Navigation menu

新闻中心

460万美元培训！万亿参数月球模型之暗面登顶开

AI 生成的图像 |搜狐科技撰稿人|梁长军主编|杨进：“艾独角兽又回到舞台中央了。”谈及近期国内大型模型的表现，一些AI从业者感叹道。最新的例子是《月之暗面》发布的万亿参数心智模型Kimi K2，总体落后于GPT-5等顶级闭源模型，却位居全球开源模型榜首。值得注意的是，这种模式的使用成本也非常低。搜狐科技发现，Kimi K2心智模型的训练成本约为460万美元（约合人民币3200万元）。这刷新了 Deepseek 的记录。 Deepseek曾透露，V3模型仅需560万美元，引起全球AI圈震动。现在Kimi K2的售价已经降了100万美元。不少评论称，“这是中国大模式最接近Openai的时刻”、“又一个Deepseek时刻”。另外《月之暗面》中，Zhipu和Minimax的模型近期也已在海外发布。 Deepseek-R2迟迟没有到货，现在看来它已经不再是话题的中心了。曾经被抢去风头的国内人工智能独角兽，开始走向全球舞台。这也是这些企业重新夺回技术话语权的一次尝试。 “又一个Deepseek时刻”万亿参数、开源登顶、获得GPT-5……这是外界对月之暗面发布的最新思维模型Kimi K2的思维讨论的焦点。官方评测显示，该模型在推理、编程等能力上已经过时或接近GPT-5和Claude Sonnet 4.5，并在人类最终测试等多项基准测试中达到了SOTA（最优）水平。 “这是开源模型的历史性胜利。”在Artificial Ana最新发布的全球模型综合评价中Kimi K2 的心理评分跃升至全球第二位，仅落后两款 GPT-5 型号 1 分。在该组织发布的智能体基准τ2-Bench的电信任务中，Kimi K2的思维直接跃居第一，击败了GPT-5、Claude Sonnet 4.5、Grok4等领先模型。《月之暗面》向国外社交平台介绍该车型的推文短短几天阅读量就超过440万次，刷新了国民对中国伟大车型的认知。一些评论人士认为，这是另一个“深度探索时刻”。该模型使用的成本比 Deepseek 更低。搜狐科技从知情人士处获悉，Kimi K2心智模型的训练成本约为460万美元。不仅比OpenAI等模型的投资少，而且还打破了Deepseek-V3约560万美元的训练成本记录。 “与美国顶级模特相比，这成本非常低。中国的大部分车型预算水平都差不多，而且很多公司可用的芯片并不多，所以这完全取决于谁能得到适当的培训。 “有AI从业者表示。至于Kimi K2的PAG思维为何能持续降低成本？月之暗面并未披露相关技术论文。以减少存储需求和资源消耗，同时尽可能保持模型性能、训练后强化学习的有效性。”不过，多次实测表明，Kimi K2的PAG思维显得非常具有沟通性。在AA情报指数分析中，总共使用了1.4亿个代币，是Deepseek v3.2的2.5倍，是GPT-5的2倍，这对保存的成本和速度造成了一定的影响。“如果美国继续关起门来，中国开源将完胜。”有评论称。黄仁勋，中国首富世界，上周之前提到过，中国的人工智能技术非常先进，并且已经开发出了非常好的人工智能。世界上最流行的开源人工智能模型都来自中国，并且发展非常迅速。这是真实的。来自中国，其中Kimi K2的想法位居榜首，领先于阿里巴巴和Deepseek模型。正如 Deepseek 和 Kimi 所做的那样，在算法、架构和工程层面上的创新想法和突破。回到舞台中央。现在，Deepseek在AA全球模型中的排名已经达到了第十名，或许只有R2能够卷土重来。国内模式的应用已经蔓延至硅谷。 Kimi模式出现的背后，是中国大模越来越受国外青睐。硅谷正试图从昂贵的闭源模式转向更便宜的中国开源模式。硅谷知名投资人、社会资本创始人查马斯·帕里哈皮蒂亚 (Chamath Palihapitiya) 近日承认，自己已经转会给 Kimi K2 带来了大量的工作负载。美国云计算公司Vercel针对该模型推出了API服务。 AI编程独角兽Cursor和Windsurf、前百度高管景鲲的初创公司Genspark、AI搜索独角兽进攻都有机会接触到。此前Minimax发布的Model Inference M2发布仅几天，就在海外模型路由器OpenRouter上全球调用量排名前三。它一度成为HuggingFace上下载次数最多的模型，至少有20个平台提供API服务。此外，不少硅谷公司也被曝欺骗中国大模子。在最新的pVersion 2.0更新中，Cursor推出了第一个自己的代码模型——composer。然而，开发者透露，作曲家困住了中国的GLM-4.6模型。 GLM-4.6是GLM今年9月底发布的旗舰机型。它的编码能力与 Claude Sonnet 4 一致。当时，它是被誉为中国最好的编码模型。后来在大型模型赛场lmarena中排名开源模型第一名。 AI 编程的另外两个主要独角兽 Cognition 和 Windsurf 也被透露正在使用 GLM-4.6。 Windsurf被网友曝光后停止安装。该公司表示，响应社区用户的热情号召，推出了GLM-4.6模型，相信它将“为编程带来更好的代码生成能力和任务性能”。这也让不少AI从业者兴奋不已。 “以前中国的大牌车型都是覆盖国外的顶级车型，现在我们的车型都成了被覆盖的对象，国产车型真的开始骄傲了。”可以说，中国大型车型在海外市场已经进入了一个新的阶段。从最初的重点讨论，到一些行业外产品的应用，再到很多国内基地模式在海外企业的落地，价值何在？中国制造在大型车型领域持续崛起。值得注意的是，这些模型都是开源的。这让全球的开发者和企业可以毫无负担地应用，而中国的大模式正在借助开源枕头构建越来越大的技术影响力。当然，开源也需要强有力的支持，而让硅谷选择中国模式的关键是最终的性价比。美国云计算公司Vercel首席执行官Guillermo Rauch指出，在内部代理Real-Scenario Benchmark测试中，Kimi K2在运行速度和准确度方面表现出色，优于GPT-5和Claude Sonnet 4.5，准确率高出50%。著名硅谷投资者 Chamath 指出，Kimi-K2 性能强劲，而且比 OpenAi 和 Anthropic 便宜。数据显示，Kimi-K2、Kimi K2 Thinking和GLM-4.6的API产出价格约为GPT-5的20%，不到Claude Sonnet 4.5的15%。价格e Minimax-M2 仅是 Claude Sonnet 4.5 的 8%。 “在这个关键时刻，中国的开放资源模式已经足够支撑西方产品的发展，全球人工智能正在进入多极竞争的新格局。”有评论称，甚至有国外网友表示：是时候学点中文了？融资和上市，AI独角兽正在寻找追赶技术的方法，并走向世界颠覆行业。中国的人工智能独角兽正试图留在牌桌上。这也让他们对上市和新一轮融资的过程更有信心。月之暗面近日宣布启动新一轮融资，甚至有消息称海外知名公司A16Z正在考虑投资。据悉，《月之暗面》此次融资约6亿美元，投前估值38亿美元。领投方指向IDG，老股东腾讯、五缘资本、创投等目前也计划跟投。若融资完成，月之暗面有望成为继智普、Minimax之后又一家估值超300亿元的AI独角兽。搜狐科技向月之暗面及相关投资者求证，但其他方均未回应。关注AI的投资者认为，如此高的融资成本一般需要较长的决策确认时间，美国基金在当前环境下不太可能进行投资。对于前述《月黑之时》的估值，该投资人表示，当国内大机型融资热潮过去后，这个估值并不低，但与美国的大独角兽机型相比还差得远。有人认为，与美国AI初创公司相比，国内AI独角兽在技术和价值观上存在严重不匹配。例如，对阴暗面的欣赏月球比openai和anthropic还不到1%。 “国内大牌模特赚钱还是很难。”近两年来，《月之暗面》已经成为大模市场炙手可热的明星。去年两轮超过13亿美元的融资使其成为估值33亿美元的AI独角兽。 Kimi也成为中国交易量最大的AI原生应用。然而，随着联创张雨桐与朱啸虎的争执，以及Deepseek的效果，“月之暗面”受到质疑，公司的发展也已被改变。它停止交付产品，将重点转向技术，并从闭源转向开源。今年以来，Kimi的用户基数增速出现下滑甚至下滑。据Questmobile统计，今年9月，Kimi的月活跃用户不足1000万，较去年12月下降逾1100万，排名在同行业中名列前茅。mestic AI 原生应用程序从第二位跌至第五位。商业化方面，月之暗面继续押宝C端，此前曾在国内外推出OK电脑，并首次启用订阅付费。由于国内同类型产品免费且面临顶级竞争，这可能是一场持久而激烈的战斗。在这种情况下，这笔融资对于月之暗面来说是相当重要的，尤其是在商业化程度相对较好的智浦上市、Minimax准备上市的情况下，需要积累更多的资金来应对未来的变化。今年年中，Minimax完成新一轮融资近3亿美元，投后估值超过40亿美元，上海国资等参投。随后，又有消息称该公司计划赴港上市。当时，有内部人士表示，有列出清单的想法。目前，应用公司海外应用和视频生成应用海螺AI构成主要收入来源。近期推出编程和智能产品收费模式，加大对C端的押注。深耕G端、B端的智浦今年上半年完成多个领域国有融资并启动上市。预计年内向科创板提交招股书，成为首只大规模样板股。该公司过去的失踪也反映出商业化和上市的困难。肉眼可见的是，四只AI虎中间的步星似乎有些落后。随着技术理念与现实的交织，独角兽仍然面临生存压力，但情况远未解决。返回搜狐查看更多

上一篇：民国时期上海吃喝指南｜卡夫卡：品尝高加索美下一篇：没有了

新闻中心

460万美元培训！万亿参数月球模型之暗面登顶开

相关新闻