马斯克费钱砸出的Grok 3,超出DeepSeek与OpenAI?
文 | 科技旋涡 文 | 科技旋涡北京时光2月18日午间,马斯克旗下人工智能始创公司xAI正式宣布新一代谈天呆板人Grok 3。马斯克跟他的人工智能团队宣称,Grok 3测试版的高等推理才能超越了现有的人工智能模子。马斯克这个号称地表最聪慧的AI,完善解释了什么叫“有钱率性”,只因其应用了20万块GPU练习模子。那么,它真的可能超出风头正盛的DeepSeek跟行业前锋OpenAI吗?烧钱有数的Grok 3有多强?在Grok 3的直播中,马斯克等人先容了Grok 3的练习过程。客岁马斯克剧透,Grok 3在10万张H100长进行练习,是首个到达如斯练习集群范围的模子。明天的宣布会上又流露,到练习停止到第92地利,集群范围扩大到了20万卡。Grok 3的气力也确实证实了,在当下这个时代,砸钱是一种宏大的上风。这一波Grok 3有满血跟mini两个版本,在数学、迷信、代码等数据集上表示均超越了GPT-4o、DeepSeek-V3等非推理模子。 开展全文
Grok-3 mini的机能基础上当先或媲美其余闭源/开源模子。在有名年夜模子LMSYS Arena排行榜中,Grok-3刷榜,Elo评分超1400位列最高,不任何一个模子能与之比拟,可谓断层式当先。
xAI团队还展现了Grok 3怎样履行风趣的义务。比方盘算从地球到火星的航天器义务。Grok 3 天生了一张太空发射的动画 3D 轨迹图(即从地球到火星而后再前往地球的可行轨迹)。这波及一些庞杂的物理常识,Grok 3须要懂得这些内容。
Grok 3还展现了在主动化游戏开辟方面的潜力。xAI团队请求Grok 3现场发明一款融会《俄罗斯方块》跟《宝石迷阵》的新游戏。Grok 3天生的Python剧本界说了游戏的常量、色彩、方块外形等元素,并浮现出奇特弄法:当衔接了至少三个雷同色彩的方块时,会触发重力机制使方块打消,这种方法相似《宝石迷阵》。
别的,Grok 3包括一个名为Big Brain的功效,这是一个推理模子形式,容许在处置查问时停止更深刻的思考。马斯克指出,17个月前,最初的Grok模子多少乎不克不及处理高中成绩,而当初它曾经提高了良多,他风趣地比方“Grok曾经筹备好上年夜学了”。
性价比与猛砸钱,年夜模子的路该怎样走?
家喻户晓,DeepSeek经由过程奇特的算法优化、架构计划以及高效的资本应用方法,年夜幅下降了对英伟达高端GPU的依附。这也以致英伟达股价暴跌16.97%,市值单日蒸发约5926.58亿美元。
DeepSeek宣称其模子练习本钱仅为同类模子的1/5至1/10,这象征着其在解脱英伟达硬件约束的情形下,依然在推感性能等方面都表示出与ChatGPT-o1濒临的才能,局部范畴另有所超出。
反不雅马斯克的Grok 3不只砸出来20万块GPU,更是为了尽快推出Grok 3,在短短四个月内建成数据核心。如斯宏大的投入换来的也仅仅只是lmArena 排行榜中41分的晋升,这真的值吗?
现实上,马斯克猖狂砸钱的举措或者有着提前规划的考量。当下,任何AI的练习都离不开GPU,只不外DeepSeek走的是“精算师道路”——经由过程算法优化,用行业1/10的本钱实现90%的机能。而马斯克的20万块GPU不只是为了疾速推出Grok 3,更可能是为了后续仍旧坚持疾速迭代的抉择。前往搜狐,检查更多