文章 课程 首页 集训营
更多
  • 视频
  • 百科图谱
  • 问答
  • 提问
  • 专栏
  • 活动
  • 文档
  • 工作
  • 集市
  • 首页
  • 文章
  • 视频
  • 课程
  • 集训营
  • 工作
    • 工作
    • 问答
    • 活动
    • 文档
    • 集市
搜索
  • 登录/注册
amitiitbhu
  • 文章
  • 专栏
  • 问答
  • 视频
  • 课程
  • 集市作品
  • 活动
  • 招聘
TA的文章 TA购买的 TA喜欢的 TA收藏的
深度解析 DeepSeek-V4:百万级长文本的低成本突破

DeepSeek-V4 是新一代开源混合专家(MoE)模型,核心突破在于实现了极低成本的百万级长文本处理。

混合专家模型  混合压缩注意力  流形约束超连接  Muon 优化器  策略内蒸馏  量化感知训练 
发布于 2026-04-24 21:47 阅读(250) 点赞(0) ( 2 )
分享
Twitter分享
微信扫码分享
Transformer架构深度解析

本文详细解析了 Transformer 架构的核心组件及其工作原理,涵盖了从分词嵌入、位置编码到多头注意力机制、前馈网络及残差连接的完整流程。文章还对比了编码器与解码器的功能差异,并探讨了该架构为何能成为现代大语言模型基石的原因。

Transformer  注意力机制  编码器  解码器  位置编码  多头注意力 
发布于 2026-04-08 08:19 阅读(319) 点赞(0) ( 32 )
分享
Twitter分享
微信扫码分享
AI Harness Engineering 控制工程

文章详细介绍了 AI 中的 Harness Engineering(控制层工程),解释了它是如何通过封装模型、管理输入输出及工具调用,使大语言模型(LLM)具备实际生产力的。内容涵盖了其核心组件、在 AI 智能体与评估系统中的应用,以及构建稳健 AI 系统所需的最佳实践。

Harness Engineering  AI 智能体  大语言模型  提示词管理  工具编排  模型评估 
发布于 2026-04-03 06:32 阅读(422) 点赞(0) ( 24 )
分享
Twitter分享
微信扫码分享
Paged Attention:大模型推理显存优化的核心方案

本文介绍了 Paged Attention 技术,它通过借鉴操作系统中的分页机制,解决了大语言模型推理过程中 KV Cache 导致的内存浪费问题。文章详细阐述了传统连续内存分配的缺陷,并解析了 Paged Attention 如何通过固定大小的内存块和块表实现动态、非连续的内存管理,从而提升系统并发处理能力。

Paged Attention  KV Cache  内存管理  大语言模型  推理优化  块表 
发布于 2026-03-28 10:14 阅读(170) 点赞(0) ( 7 )
分享
Twitter分享
微信扫码分享
文章删除后将不可恢复 !
删除 取消
提交成功!
系统处理完成后将直接进入审核发布流程,可在个人主页关注文章状态。
amitiitbhu
amitiitbhu
贡献值: 45 学分: 56
江湖只有他的大名,没有他的介绍。
0 关注 1 粉丝
关于
关于我们
社区公约
学分规则
Github
伙伴们
DeCert
ChainTool
GCC
UpChain
合作
广告投放
发布课程
联系我们
友情链接
关注社区
Discord
Twitter
Youtube
B 站
公众号

关注不错过动态

微信群

加入技术圈子

©2026 登链社区 版权所有
粤公网安备 44049102496617号 粤ICP备17140514号 粤B2-20230927 增值电信业务经营许可证

发送私信

请将文档链接发给晓娜,我们会尽快安排上架,感谢您的推荐!

提醒

检测到你当前登录的账号还未绑定手机号
请绑定后再发布
去绑定
编辑封面图
封面预览

创建课程

编辑封面图
建议尺寸: 1920*1080
编辑封面图
封面预览