HomeWatch
【人工智能】揭开大模型的黑盒 | 解释性电路 | 权重稀疏模型 | 叠加态 | 双重稀疏 | AdamW | L0退火 | 梯度裁剪 | 修剪算法 | 三大任务实验 | 桥接方法 | 稀疏模型映射
最佳拍档
9.4K views•2 weeks ago
152
Description
当我们每天使用GPT、Claude这些大语言模型时,我们真的知道它们是怎么思考的吗?我们输入一个查询,模型给出精准的回答,但是中间的决策过程,却像一个完全封闭的黑盒一样,我们只能看到输入和输出,对内部的计算逻辑却一无所知。今天我们要解读的这篇来自OpenAI的论文,恰恰为打破这个黑盒提供了一种全新的思路,通过训练权重稀疏的Transformer模型,让大模型的内部计算电路变得人类可理解。 https://cdn.openai.com/pdf/41df8f28-d4ef-43e9-aed2-823f9393e470/circuit-sparsity-paper.pdf
Related Videos

【人工智能】AI顶会ICLR泄露门始末 | 61分钟漏洞 | 审稿人身份裸奔 | 双盲机制粉碎 | 学术信仰崩塌 | OpenReview | 黑暗森林 | AI评审意见 | 审稿人圈子 | 引文联盟
最佳拍档
11.5K views•1 day ago

【芯片】“中国版英伟达”摩尔线程上市 | 首日暴涨近五倍 | 市值逼近3000亿 | GPU算力水平 | 商业模式 | MTLink | MUSA | 创始团队 | 机构投资者 | 国产芯片扎堆上市
最佳拍档
2 days ago

【人工智能】AI如何改变Anthropic的工作 | 工作总量大幅提升 | 学习和迭代速度加快 | 核心技能退化风险 | AI取代工作的担忧 | 工作的意义感 | 软件工程师的未来 | 未来的迷茫
最佳拍档
18.5K views•3 days ago

【芯片】台积电海外建厂能成功么?| 基于台湾的三种护城河 | 美国亚利桑那 | 日本德国 | WaferTech的失败教训 | 张忠谋 | 地缘政治要求 | 全球科技格局影响
Best Partners TV
4 days ago

【访谈】能源是真正唯一的货币 | 埃隆·马斯克最新两小时访谈精华 | 社交媒体X的意义 | 人生的原动力 | 42的隐喻 | 真正的能源是太阳 | 人形机器人的爆发 | AI的价值观 | 模拟世界
Best Partners TV
5 days ago

【人工智能】思考游戏 | 哈萨比斯与DeepMind纪录片 | 如何从国际象棋天才少年成长为AI领袖 | 通用人工智能AGI | AlphaGo | AlphaFold | 人类历史的十字路口
最佳拍档
15.2K views•6 days ago

【访谈】为什么马斯克能打败所有人 | 红杉合伙人肖恩·马奎尔 | 马斯克是一个群体 | 科技界的布尔巴基 | 选人的艺术 | 智力的差距层级 | 天才之间的鸿沟 | 投资SpaceX | 非线性决策
最佳拍档
1 week ago

【人工智能】谷歌TPU欲将英伟达GPU挑下王座? | 全球AI芯片市场格局突变 | CUDA护城河能持续多久 | Anthropic百万订单 | TCO和峰值FLOPS | 系统架构优势 | 软件生态
Best Partners TV
1 week ago

【人工智能】Scaling时代终结,探索研究时代开启 | Ilya最新访谈 | AI当前巨大的撕裂感 | 预训练 | 强化学习 | 人类的情感和欲望 | 价值函数 | 超级智能 | SSI要憋大招
Best Partners TV
1 week ago
![[Artificial Intelligence] Google Releases Gemini 3 | The Smartest AI Model Ever | Dominates Multi...](/_next/image?url=https%3A%2F%2Fi.ytimg.com%2Fvi%2FdUWBj6YTe0Y%2Fhqdefault.jpg&w=3840&q=75&dpl=dpl_9bKGdHBhEqkEQ1QFfLQWaRrWqgXr)
[Artificial Intelligence] Google Releases Gemini 3 | The Smartest AI Model Ever | Dominates Multi...
Best Partners TV
2 weeks ago
![[Interview] What is Palantir's business model? | CRO Ryan Taylor | Background | Business Model | ...](/_next/image?url=https%3A%2F%2Fi.ytimg.com%2Fvi%2FTHibPstx21M%2Fhqdefault.jpg&w=3840&q=75&dpl=dpl_9bKGdHBhEqkEQ1QFfLQWaRrWqgXr)
[Interview] What is Palantir's business model? | CRO Ryan Taylor | Background | Business Model | ...
Best Partners TV
2 weeks ago

【人工智能】AI不是泡沫 | 微软AICEO Mustafa Suleyman | AI没有自我意识 | 超级智能 | AGI | 日常生活变化 | 医疗平权 | 教育普及 | 自学能力
最佳拍档
13.6K views•2 weeks ago
