李飞飞S1K模型引爆AI界：仅50美金成本完胜DeepSeek R1与ChatGPT O1！

老范讲故事 • February 10, 2025

老范讲故事

About

老程序员，互联网老兵。喜欢听故事，然后选择自觉合适的时机，地点，再将这些故事讲给合适的人，并以此为生。讲一讲实时热点背后的互联网商业逻辑，有时也会偷偷爆料一些行业内幕。 Twitter：https://twitter.com/lukfan Blog：http://lukefan.com Instagram：http://www.instagram.com/lukefan/ Discord：https://discord.gg/ppKsNkttTv Mastodon：https://m.cmx.im/@lukefan

Latest Posts

老范读评 12月17日工程师治国 vs 文科生治国：思维差异如何决定 AI 发展的终局？从 Claude 编程吊打 GPT 看大模型的真实落地困境，算力并不是唯一的决胜关键｜人工智能 (AI)、算力

老范讲故事

Luo Fuli unveils new model, yet stock price falls for three consecutive days? What has capital se...

老范讲故事

通往AGI的最后两块拼图已锁定！DeepMind CEO首次公开具体路线：搞定世界模型与智能体系统就够了｜通用人工智能、Demis Hassabis、AI路线图、AI突破

老范讲故事

继承之战只是烟雾弹？真正动摇娃哈哈根基的，是创始人宗庆后时代遗留的“合法性”原罪｜品牌、辞职、反转、掌舵人、被诉、商标

老范讲故事

Video Description

付费频道订阅：https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join 文字版地址：https://lukefan.com/2025/02/11/%e6%9d%8e%e9%a3%9e%e9%a3%9es1k%e6%a8%a1%e5%9e%8b%e5%bc%95%e7%88%86ai%e7%95%8c%ef%bc%9a%e4%bb%8550%e7%be%8e%e9%87%91%e6%88%90%e6%9c%ac%e5%ae%8c%e8%83%9cdeepseek-r1%e4%b8%8echatgpt-o1%ef%bc%81/ 啊啊啊啊啊啊啊！大家听说了吗？李飞飞的S1K模型只用50美金，就超越了DeepSeek R1和GPT O1！🔥 这简直是AI界的奇迹！首先，DeepSeek R1和GPT O1已经是推理模型的顶流了，但李飞飞的S1K模型竟然在多项测试中超过了它们！更牛的是，这个模型只用了16张H100显卡，26分钟就训练完了，成本才50美金！你敢信？🤯 这个S1K模型的厉害之处在于它的“科学筛选”和“预算强制”两大创新。通过筛选1,000个高质量、高难度、全面覆盖的问题，再加上动态预算管理，S1K模型在推理效率和准确性上都有了质的飞跃。这简直就是科学的胜利！🎉 而且，李飞飞的这个模型不仅成本低，效果还超好。它通过微调通义千问32B模型，使用了Gemini 2.0 Flash thinking产生的问题进行训练，最终超越了DeepSeek R1的32B版本。这波操作，真的是让人惊呼“中国行我也行”！🇨🇳 更让人兴奋的是，这种科学的方法未来可以应用到各个领域。无论是法律、财务还是其他专业领域，都可以通过筛选高质量问题，训练出特定领域的小模型。这意味着，未来的AI应用将更加精准和高效！🚀 总之，李飞飞的S1K模型不仅展示了AI的无限可能，也让我们看到了科学和技术的完美结合。家人们，AI的春天来了，快上车！🚗 #AI #李飞飞 #S1K模型 #科技 #创新 #50美金 #DeepSeek #GPT #AI工具 #搞钱必看李飞飞S1K模型引爆AI界：仅50美金成本完胜DeepSeek R1与ChatGPT O1！李飞飞的S1K模型以极低的50美金训练成本超越了DeepSeek R1和ChatGPT O1，这一突破彻底改变了AI模型训练的规则。核心创新包括仅使用1,000道精挑细选的高质量问题进行微调训练，以及采用全新的预算强制法以优化推理结果，引发AI领域的巨大关注。通过科学筛选与动态调整预算，S1K实现了高效的资源利用，同时打破了传统大模型高成本的限制，为小公司提供了蒸馏小模型的崭新解决方案。随着这一技术的普及，AI行业即将迎来全面变革，行业定制化与细分市场成为可能。无论是法律、财务还是教育，均可借助S1K方法快速推出精准的小模型，推动人工智能真正落地并服务于实际业务需求。 00:00:00 大家好，欢迎收听老潘讲故事YouTube频道，今天讲解李飞飞的S1K模型。 00:00:05 首先，DeepSeek如何以低训练成本震惊全球。 00:00:12 训练成本是OpenAI的3%。 00:00:19 现在李飞飞的S1K模型，用16张H100显卡，26分钟跑完，得到一个32B的模型。 00:00:31 多项测试超越DeepSeek R1和GPTO1，大模型评测有很多测试项。 00:00:45 对于粉红和支黑来说，李飞飞的成就有不同解读。 00:00:53 李飞飞的背景介绍，成都七中毕业，斯坦福大学教授，人工智能教母。 00:02:27 这是创新还是抄袭的讨论。 00:02:32 咱们先不炒这个，讲讲这50美金到底咋花的。 00:02:37 首先，蒸馏一个小样本模型，使用通义千问32B做微调。 00:02:53 使用谷歌Gemini 2.0 Flash thinking产生的问题进行微调，DeepSeek R1 32B用了80万个问题，而李飞飞只用了1000个。 00:03:34 s1k模型只有1,000个问题，成本50美金。 00:03:54 关于“中国行我也行”的新梗，以及1000个问题的筛选难度。 00:04:17 S1K的两个创新点：1000个问题的筛选和预算强制。 00:04:36 1000个问题的筛选标准：质量高、难度大、全面。 00:05:33 重复艺术、技术与科学之间的差异，以及S1K属于科学范畴。 00:06:30 他们筛选问题并进行训练，找到逻辑后优化，筛选1000道题的方法可以应用到不同领域。 00:07:55 建议大模型团队可以去学而思、新东方找老师筛选问题。 00:08:37 下一个创新是预算强制，即根据题目难度决定是否终止计算。 00:10:01 预算强制法如何确定budget：推理步数和时间。 00:10:27 对中间结果进行评估：置信度、收敛性、质量评估。 00:12:05 预算强制的具体工作流程。 00:13:18 论文发出后，未来推理模型都会使用这套东西。 00:14:08 50美金训练1000道题的成本，以及预算强制的效果。 00:14:39 科学车轮滚滚向前，老师们筛选问题的价值。 00:15:33 在不同领域快速蒸馏出小模型，并实现领域内的突破。 00:16:00 国内外有一堆推理模型可供使用。 00:17:32 找到最优解，得到特定领域里特别好用的32B小模型。 00:17:47 硅基流动、together等开源微调模型将起飞。 00:18:15 小公司可以用小模型提供服务，增加用户粘度。 00:19:15 小公司可以卖模型、卖服务、卖数据。 00:19:49 软件行业的梦想“系统咨询构架工程师”又近了一步。 00:20:33 大模型改变每一个行业即将开始。 00:21:15 李飞飞模型发布后，2025年会有大量公司提供微调小模型服务。 00:21:50 今天讲解的第一个故事，李飞飞50美金模型是如何做出来的。大家好！今天咱们来聊聊李飞飞的S1K模型，这个仅花费50美金的模型竟然超越了DeepSeek R1和ChatGPT O1。S1K模型的训练成本极低，仅用16张H100显卡跑了26分钟，就生成了一个32B的模型，并在多项测试中表现优异。 S1K的成功主要归功于两大创新：一是精心筛选的1,000个高质量、高难度且全面的问题；二是“预算强制”技术，通过控制推理步数和时间，优化模型效率。这些创新使得S1K在推理任务中表现出色，甚至超越了现有的顶级推理模型。未来，随着S1K模型的发布，行业内的推理模型将迎来一个新的春天。小公司可以通过筛选问题和微调模型，快速生成适合特定领域的小模型，从而提升用户粘性和竞争力。大模型的广泛应用也将逐步改变各个行业，带来实实在在的业务变革。总之，S1K模型不仅展示了低成本高效率的模型训练方法，还为未来的AI应用开辟了新的路径。欢迎加入Discord讨论服务器： https://discord.gg/ppKsNkttTv

李飞飞S1K模型引爆AI界：仅50美金成本完胜DeepSeek R1与ChatGPT O1！

老范讲故事

About

Latest Posts

老范读评 12月17日 工程师治国 vs 文科生治国：思维差异如何决定 AI 发展的终局？从 Claude 编程吊打 GPT 看大模型的真实落地困境，算力并不是唯一的决胜关键｜人工智能 (AI)、算力

Luo Fuli unveils new model, yet stock price falls for three consecutive days? What has capital se...

通往AGI的最后两块拼图已锁定！DeepMind CEO首次公开具体路线：搞定世界模型与智能体系统就够了｜通用人工智能、Demis Hassabis、AI路线图、AI突破

继承之战只是烟雾弹？真正动摇娃哈哈根基的，是创始人宗庆后时代遗留的“合法性”原罪｜品牌、辞职、反转、掌舵人、被诉、商标

Video Description

You May Also Like

Upgrade Your AI Learning

LIGHTAILING Light for Lego-75379 R2-D2 - Led Lighting Kit Compatible with Lego Building Blocks Model - NOT Included The Model Set

Airbrush Kit with Air Tank Compressor 2 Dual-Action Gravity Airbrush with 0.2mm 0.3mm 0.5mm Nozzle Air Compressor with Airbrush Coloring Tool Cleaning Brush for Model Paint Hobby Craft

Loading...

老范读评 12月17日工程师治国 vs 文科生治国：思维差异如何决定 AI 发展的终局？从 Claude 编程吊打 GPT 看大模型的真实落地困境，算力并不是唯一的决胜关键｜人工智能 (AI)、算力