李飞飞S1K模型引爆AI界:仅50美金成本完胜DeepSeek R1与ChatGPT O1!
老范讲故事
View ChannelAbout
老程序员,互联网老兵。 喜欢听故事,然后选择自觉合适的时机,地点,再将这些故事讲给合适的人,并以此为生。 讲一讲实时热点背后的互联网商业逻辑,有时也会偷偷爆料一些行业内幕。 Twitter:https://twitter.com/lukfan Blog:http://lukefan.com Instagram:http://www.instagram.com/lukefan/ Discord:https://discord.gg/ppKsNkttTv Mastodon:https://m.cmx.im/@lukefan
Latest Posts
Video Description
付费频道订阅:https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join 文字版地址:https://lukefan.com/2025/02/11/%e6%9d%8e%e9%a3%9e%e9%a3%9es1k%e6%a8%a1%e5%9e%8b%e5%bc%95%e7%88%86ai%e7%95%8c%ef%bc%9a%e4%bb%8550%e7%be%8e%e9%87%91%e6%88%90%e6%9c%ac%e5%ae%8c%e8%83%9cdeepseek-r1%e4%b8%8echatgpt-o1%ef%bc%81/ 啊啊啊啊啊啊啊!大家听说了吗?李飞飞的S1K模型只用50美金,就超越了DeepSeek R1和GPT O1!🔥 这简直是AI界的奇迹! 首先,DeepSeek R1和GPT O1已经是推理模型的顶流了,但李飞飞的S1K模型竟然在多项测试中超过了它们!更牛的是,这个模型只用了16张H100显卡,26分钟就训练完了,成本才50美金!你敢信?🤯 这个S1K模型的厉害之处在于它的“科学筛选”和“预算强制”两大创新。通过筛选1,000个高质量、高难度、全面覆盖的问题,再加上动态预算管理,S1K模型在推理效率和准确性上都有了质的飞跃。这简直就是科学的胜利!🎉 而且,李飞飞的这个模型不仅成本低,效果还超好。它通过微调通义千问32B模型,使用了Gemini 2.0 Flash thinking产生的问题进行训练,最终超越了DeepSeek R1的32B版本。这波操作,真的是让人惊呼“中国行我也行”!🇨🇳 更让人兴奋的是,这种科学的方法未来可以应用到各个领域。无论是法律、财务还是其他专业领域,都可以通过筛选高质量问题,训练出特定领域的小模型。这意味着,未来的AI应用将更加精准和高效!🚀 总之,李飞飞的S1K模型不仅展示了AI的无限可能,也让我们看到了科学和技术的完美结合。家人们,AI的春天来了,快上车!🚗 #AI #李飞飞 #S1K模型 #科技 #创新 #50美金 #DeepSeek #GPT #AI工具 #搞钱必看 李飞飞S1K模型引爆AI界:仅50美金成本完胜DeepSeek R1与ChatGPT O1! 李飞飞的S1K模型以极低的50美金训练成本超越了DeepSeek R1和ChatGPT O1,这一突破彻底改变了AI模型训练的规则。核心创新包括仅使用1,000道精挑细选的高质量问题进行微调训练,以及采用全新的预算强制法以优化推理结果,引发AI领域的巨大关注。通过科学筛选与动态调整预算,S1K实现了高效的资源利用,同时打破了传统大模型高成本的限制,为小公司提供了蒸馏小模型的崭新解决方案。随着这一技术的普及,AI行业即将迎来全面变革,行业定制化与细分市场成为可能。无论是法律、财务还是教育,均可借助S1K方法快速推出精准的小模型,推动人工智能真正落地并服务于实际业务需求。 00:00:00 大家好,欢迎收听老潘讲故事YouTube频道,今天讲解李飞飞的S1K模型。 00:00:05 首先,DeepSeek如何以低训练成本震惊全球。 00:00:12 训练成本是OpenAI的3%。 00:00:19 现在李飞飞的S1K模型,用16张H100显卡,26分钟跑完,得到一个32B的模型。 00:00:31 多项测试超越DeepSeek R1和GPTO1,大模型评测有很多测试项。 00:00:45 对于粉红和支黑来说,李飞飞的成就有不同解读。 00:00:53 李飞飞的背景介绍,成都七中毕业,斯坦福大学教授,人工智能教母。 00:02:27 这是创新还是抄袭的讨论。 00:02:32 咱们先不炒这个,讲讲这50美金到底咋花的。 00:02:37 首先,蒸馏一个小样本模型,使用通义千问32B做微调。 00:02:53 使用谷歌Gemini 2.0 Flash thinking产生的问题进行微调,DeepSeek R1 32B用了80万个问题,而李飞飞只用了1000个。 00:03:34 s1k模型只有1,000个问题,成本50美金。 00:03:54 关于“中国行我也行”的新梗,以及1000个问题的筛选难度。 00:04:17 S1K的两个创新点:1000个问题的筛选和预算强制。 00:04:36 1000个问题的筛选标准:质量高、难度大、全面。 00:05:33 重复艺术、技术与科学之间的差异,以及S1K属于科学范畴。 00:06:30 他们筛选问题并进行训练,找到逻辑后优化,筛选1000道题的方法可以应用到不同领域。 00:07:55 建议大模型团队可以去学而思、新东方找老师筛选问题。 00:08:37 下一个创新是预算强制,即根据题目难度决定是否终止计算。 00:10:01 预算强制法如何确定budget:推理步数和时间。 00:10:27 对中间结果进行评估:置信度、收敛性、质量评估。 00:12:05 预算强制的具体工作流程。 00:13:18 论文发出后,未来推理模型都会使用这套东西。 00:14:08 50美金训练1000道题的成本,以及预算强制的效果。 00:14:39 科学车轮滚滚向前,老师们筛选问题的价值。 00:15:33 在不同领域快速蒸馏出小模型,并实现领域内的突破。 00:16:00 国内外有一堆推理模型可供使用。 00:17:32 找到最优解,得到特定领域里特别好用的32B小模型。 00:17:47 硅基流动、together等开源微调模型将起飞。 00:18:15 小公司可以用小模型提供服务,增加用户粘度。 00:19:15 小公司可以卖模型、卖服务、卖数据。 00:19:49 软件行业的梦想“系统咨询构架工程师”又近了一步。 00:20:33 大模型改变每一个行业即将开始。 00:21:15 李飞飞模型发布后,2025年会有大量公司提供微调小模型服务。 00:21:50 今天讲解的第一个故事,李飞飞50美金模型是如何做出来的。 大家好!今天咱们来聊聊李飞飞的S1K模型,这个仅花费50美金的模型竟然超越了DeepSeek R1和ChatGPT O1。S1K模型的训练成本极低,仅用16张H100显卡跑了26分钟,就生成了一个32B的模型,并在多项测试中表现优异。 S1K的成功主要归功于两大创新:一是精心筛选的1,000个高质量、高难度且全面的问题;二是“预算强制”技术,通过控制推理步数和时间,优化模型效率。这些创新使得S1K在推理任务中表现出色,甚至超越了现有的顶级推理模型。 未来,随着S1K模型的发布,行业内的推理模型将迎来一个新的春天。小公司可以通过筛选问题和微调模型,快速生成适合特定领域的小模型,从而提升用户粘性和竞争力。大模型的广泛应用也将逐步改变各个行业,带来实实在在的业务变革。 总之,S1K模型不仅展示了低成本高效率的模型训练方法,还为未来的AI应用开辟了新的路径。 欢迎加入Discord讨论服务器: https://discord.gg/ppKsNkttTv
Upgrade Your AI Learning
AI-recommended products based on this video

LIGHTAILING Light for Lego-75379 R2-D2 - Led Lighting Kit Compatible with Lego Building Blocks Model - NOT Included The Model Set




