Navigation menu

新闻中心

460万美元培训!万亿参数月球模型之暗面登顶开

AI 生成的图像 |搜狐科技撰稿人|梁长军主编|杨进:“艾独角兽又回到舞台中央了。”谈及近期国内大型模型的表现,一些AI从业者感叹道。最新的例子是《月之暗面》发布的万亿参数心智模型Kimi K2,总体落后于GPT-5等顶级闭源模型,却位居全球开源模型榜首。值得注意的是,这种模式的使用成本也非常低。搜狐科技发现,Kimi K2心智模型的训练成本约为460万美元(约合人民币3200万元)。这刷新了 Deepseek 的记录。 Deepseek曾透露,V3模型仅需560万美元,引起全球AI圈震动。现在Kimi K2的售价已经降了100万美元。不少评论称,“这是中国大模式最接近Openai的时刻”、“又一个Deepseek时刻”。另外《月之暗面》中,Zhipu和Minimax的模型近期也已在海外发布。 Deepseek-R2迟迟没有到货,现在看来它已经不再是话题的中心了。曾经被抢去风头的国内人工智能独角兽,开始走向全球舞台。这也是这些企业重新夺回技术话语权的一次尝试。 “又一个Deepseek时刻”万亿参数、开源登顶、获得GPT-5……这是外界对月之暗面发布的最新思维模型Kimi K2的思维讨论的焦点。官方评测显示,该模型在推理、编程等能力上已经过时或接近GPT-5和Claude Sonnet 4.5,并在人类最终测试等多项基准测试中达到了SOTA(最优)水平。 “这是开源模型的历史性胜利。”在Artificial Ana最新发布的全球模型综合评价中Kimi K2 的心理评分跃升至全球第二位,仅落后两款 GPT-5 型号 1 分。在该组织发布的智能体基准τ2-Bench的电信任务中,Kimi K2的思维直接跃居第一,击败了GPT-5、Claude Sonnet 4.5、Grok4等领先模型。 《月之暗面》向国外社交平台介绍该车型的推文短短几天阅读量就超过440万次,刷新了国民对中国伟大车型的认知。一些评论人士认为,这是另一个“深度探索时刻”。该模型使用的成本比 Deepseek 更低。搜狐科技从知情人士处获悉,Kimi K2心智模型的训练成本约为460万美元。不仅比OpenAI等模型的投资少,而且还打破了Deepseek-V3约560万美元的训练成本记录。 “与美国顶级模特相比,这成本非常低。中国的大部分车型预算水平都差不多,而且很多公司可用的芯片并不多,所以这完全取决于谁能得到适当的培训。 “有AI从业者表示。至于Kimi K2的PAG思维为何能持续降低成本?月之暗面并未披露相关技术论文。以减少存储需求和资源消耗,同时尽可能保持模型性能、训练后强化学习的有效性。”不过,多次实测表明,Kimi K2的PAG思维显得非常具有沟通性。在AA情报指数分析中,总共使用了1.4亿个代币,是Deepseek v3.2的2.5倍,是GPT-5的2倍,这对保存的成本和速度造成了一定的影响。“如果美国继续关起门来,中国开源将完胜。”有评论称。黄仁勋,中国首富世界,上周之前提到过,中国的人工智能技术非常先进,并且已经开发出了非常好的人工智能。世界上最流行的开源人工智能模型都来自中国,并且发展非常迅速。这是真实的。来自中国,其中Kimi K2的想法位居榜首,领先于阿里巴巴和Deepseek模型。正如 Deepseek 和 Kimi 所做的那样,在算法、架构和工程层面上的创新想法和突破。回到舞台中央。现在,Deepseek在AA全球模型中的排名已经达到了第十名,或许只有R2能够卷土重来。国内模式的应用已经蔓延至硅谷。 Kimi模式出现的背后,是中国大模越来越受国外青睐。硅谷正试图从昂贵的闭源模式转向更便宜的中国开源模式。硅谷知名投资人、社会资本创始人查马斯·帕里哈皮蒂亚 (Chamath Palihapitiya) 近日承认,自己已经转会给 Kimi K2 带来了大量的工作负载。美国云计算公司Vercel针对该模型推出了API服务。 AI编程独角兽Cursor和Windsurf、前百度高管景鲲的初创公司Genspark、AI搜索独角兽进攻都有机会接触到。此前Minimax发布的Model Inference M2发布仅几天,就在海外模型路由器OpenRouter上全球调用量排名前三。它一度成为HuggingFace上下载次数最多的模型,至少有20个平台提供API服务。此外,不少硅谷公司也被曝欺骗中国大模子。在最新的pVersion 2.0更新中,Cursor推出了第一个自己的代码模型——composer。然而,开发者透露,作曲家困住了中国的GLM-4.6模型。 GLM-4.6是GLM今年9月底发布的旗舰机型。它的编码能力与 Claude Sonnet 4 一致。当时,它是被誉为中国最好的编码模型。后来在大型模型赛场lmarena中排名开源模型第一名。 AI 编程的另外两个主要独角兽 Cognition 和 Windsurf 也被透露正在使用 GLM-4.6。 Windsurf被网友曝光后停止安装。该公司表示,响应社区用户的热情号召,推出了GLM-4.6模型,相信它将“为编程带来更好的代码生成能力和任务性能”。这也让不少AI从业者兴奋不已。 “以前中国的大牌车型都是覆盖国外的顶级车型,现在我们的车型都成了被覆盖的对象,国产车型真的开始骄傲了。”可以说,中国大型车型在海外市场已经进入了一个新的阶段。从最初的重点讨论,到一些行业外产品的应用,再到很多国内基地模式在海外企业的落地,价值何在?中国制造在大型车型领域持续崛起。值得注意的是,这些模型都是开源的。这让全球的开发者和企业可以毫无负担地应用,而中国的大模式正在借助开源枕头构建越来越大的技术影响力。当然,开源也需要强有力的支持,而让硅谷选择中国模式的关键是最终的性价比。美国云计算公司Vercel首席执行官Guillermo Rauch指出,在内部代理Real-Scenario Benchmark测试中,Kimi K2在运行速度和准确度方面表现出色,优于GPT-5和Claude Sonnet 4.5,准确率高出50%。著名硅谷投资者 Chamath 指出,Kimi-K2 性能强劲,而且比 OpenAi 和 Anthropic 便宜。数据显示,Kimi-K2、Kimi K2 Thinking和GLM-4.6的API产出价格约为GPT-5的20%,不到Claude Sonnet 4.5的15%。价格e Minimax-M2 仅是 Claude Sonnet 4.5 的 8%。 “在这个关键时刻,中国的开放资源模式已经足够支撑西方产品的发展,全球人工智能正在进入多极竞争的新格局。”有评论称,甚至有国外网友表示:是时候学点中文了?融资和上市,AI独角兽正在寻找追赶技术的方法,并走向世界颠覆行业。中国的人工智能独角兽正试图留在牌桌上。这也让他们对上市和新一轮融资的过程更有信心。月之暗面近日宣布启动新一轮融资,甚至有消息称海外知名公司A16Z正在考虑投资。据悉,《月之暗面》此次融资约6亿美元,投前估值38亿美元。领投方指向IDG,老股东腾讯、五缘资本、创投等目前也计划跟投。若融资完成,月之暗面有望成为继智普、Minimax之后又一家估值超300亿元的AI独角兽。搜狐科技向月之暗面及相关投资者求证,但其他方均未回应。关注AI的投资者认为,如此高的融资成本一般需要较长的决策确认时间,美国基金在当前环境下不太可能进行投资。对于前述《月黑之时》的估值,该投资人表示,当国内大机型融资热潮过去后,这个估值并不低,但与美国的大独角兽机型相比还差得远。有人认为,与美国AI初创公司相比,国内AI独角兽在技术和价值观上存在严重不匹配。例如,对阴暗面的欣赏月球比openai和anthropic还不到1%。 “国内大牌模特赚钱还是很难。”近两年来,《月之暗面》已经成为大模市场炙手可热的明星。去年两轮超过13亿美元的融资使其成为估值33亿美元的AI独角兽。 Kimi也成为中国交易量最大的AI原生应用。然而,随着联创张雨桐与朱啸虎的争执,以及Deepseek的效果,“月之暗面”受到质疑,公司的发展也已被改变。它停止交付产品,将重点转向技术,并从闭源转向开源。今年以来,Kimi的用户基数增速出现下滑甚至下滑。据Questmobile统计,今年9月,Kimi的月活跃用户不足1000万,较去年12月下降逾1100万,排名在同行业中名列前茅。mestic AI 原生应用程序从第二位跌至第五位。商业化方面,月之暗面继续押宝C端,此前曾在国内外推出OK电脑,并首次启用订阅付费。由于国内同类型产品免费且面临顶级竞争,这可能是一场持久而激烈的战斗。在这种情况下,这笔融资对于月之暗面来说是相当重要的,尤其是在商业化程度相对较好的智浦上市、Minimax准备上市的情况下,需要积累更多的资金来应对未来的变化。今年年中,Minimax完成新一轮融资近3亿美元,投后估值超过40亿美元,上海国资等参投。随后,又有消息称该公司计划赴港上市。当时,有内部人士表示,有列出清单的想法。目前,应用公司海外应用和视频生成应用海螺AI构成主要收入来源。近期推出编程和智能产品收费模式,加大对C端的押注。深耕G端、B端的智浦今年上半年完成多个领域国有融资并启动上市。预计年内向科创板提交招股书,成为首只大规模样板股。该公司过去的失踪也反映出商业化和上市的困难。肉眼可见的是,四只AI虎中间的步星似乎有些落后。随着技术理念与现实的交织,独角兽仍然面临生存压力,但情况远未解决。返回搜狐查看更多