被称为“地球上最聪明的AI” 马斯克的Grok 3能否颠覆全球AI格局?
当地时间17日晚,埃隆·马斯克旗下美国人工智能(AI)初创公司xAI开发的Grok 3模型正式发布。此前,马斯克将Grok 3描述为“地球上最聪明的AI”。马斯克的xAI已经成为AI大模型领域强有力的竞争者,同样参与这场竞技的还有OpenAI、谷歌以及近期引发全球关注的中国初创企业DeepSeek,这场“地表最强AI”争夺战或许刚刚开始……
发布会亮点纷呈 Grok 3计算力与训练方法双升级
在Grok 3发布会的背景板上,写着“我们的使命是了解宇宙”。马斯克曾表示,xAI公司的目标就是“了解宇宙”。
综合新华财经、上海《文汇报》报道,发布会上,xAI详细介绍了其最新的AI模型和技术进展。
xAI表示,Grok 3的推理能力仍在不断完善中,推理模型需要在解决问题前花费相当长的时间思考。一个月前,Grok 3的预训练完成,并开始努力将推理能力集成到现有的模型中。虽然目前这一功能仍处于初步阶段,但已经能够展现一定的效果。为了加速开发,xAI还在训练一个更小型的推理模型。
Grok 3最大的亮点在于其引入了“思维链”推理机制,其像DeepSeek R1和ChatGPT o3Mini一样,向用户展示详细的思考链条,让用户可以看到聊天机器人在解决问题时的思考过程。马斯克确认,为了防止其他公司直接复制该聊天机器人,xAI会稍微隐藏思考过程中的一些细节。
在现场演示中,Grok 3被要求解决一个复杂的物理问题,即计算从地球到火星的转移轨迹,并绘制3D动画。xAI提到,这一任务完全没有预设脚本,Grok 3仅通过简短的指令“生成地球发射、火星着陆、以及下一次发射窗口返回地球的动画3D图”进行操作。Grok 3能够理解复杂的物理计算并生成可视化图形,证明其在科学计算方面的能力。
此外,马斯克还解释了“Grok”这一名字的由来。“Grok”一词来源于罗伯特·海因莱因所著小说《异乡异客》,由一位在火星长大的角色创造,意指“彻底理解某物”。他表示,“Grok”代表深刻理解,而共情能力是这一概念的重要部分。
xAI报告称,Grok 3的开发得益于其仅用八个月时间就建成的Colossus超级计算机。该系统由10万个英伟达H100GPU驱动,为训练提供了2亿个GPU小时——是Grok2的10倍。据介绍,xAI最开始搭建这个10万GPU集群用了122天,后续拓展到20万集群仅用了92天。马斯克在发布会现场表示,Grok 3在很短的时间内超越了上一代Grok 2,“我们认为它比Grok 2强大一个数量级”。
计算能力的大幅提升使Grok 3能够更高效地处理大型数据集,缩短了训练时间并显著提高了模型准确性。
除了计算能力的提升,xAI还对训练方法进行了调整,以全面提升Grok 3的性能,包括合成数据集、自我纠正机制和强化学习。马斯克表示,这些改进经过多重验证步骤,旨在减少错误反应,通过对照可靠来源验证信息,提升逻辑准确性,并通过持续的自我评估和学习,更高效地适应需求变化。此外,xAI引入了人类反馈循环和情境训练,以确保Grok 3的响应更加自然和准确。
xAI表示,“我们今天(17日)推出Grok 3,首先从(社交平台)X上的Premium+订阅者开始,他们将是第一批获得访问权限的人。”
马斯克补充称:“如果你想要一个更完善的版本,可能要等待一周,但每天都会有所改进。我们还在开发语音交互功能,我认为这将是Grok 3最好的体验之一。”
确认成立AI游戏工作室 背后xAI实力不容小觑
需要关注的是,在17日的发布会演示中,Grok 3设计出了融合俄罗斯方块与宝石迷阵元素的游戏。马斯克随即宣布:“我们将在xAI成立AI游戏工作室。如果你对开发AI驱动的游戏感兴趣,欢迎加入我们。我们将在今晚正式发布该项目。”
综合上海财联社、深圳《证券时报》报道,稍早前,海外博主Dima Zeniuk在X平台发布一张马斯克与多人的合照,并配文称xAI即将开设一家AI游戏工作室。
马斯克当日表示,当前游戏行业过于注重“觉醒”内容,导致游戏失去了纯粹的娱乐性。他认为,许多游戏开发商被大公司控制,无法专注于制作高质量的游戏。因此,xAI决定成立这家新的游戏工作室,目标是“让游戏再次伟大”。
有媒体报道称,作为一个科技迷,马斯克素来对游戏抱有巨大的热情。其于大学时期便钟情于《文明》等策略模拟类游戏,曾在收购推特前一晚为《艾尔登法环》废寝忘食至凌晨5时。在某次参观特斯拉柏林工厂时,他由于沉迷《低模之战》而耽误了与当地经理的会面。
马斯克对于AI+游戏制作抱有期待的线索众多,比如他在回复网民提问时曾表示:“如果说有什么特别有趣的事情,那就是创办一家属于自己的游戏工作室。我觉得,如果能把AI应用到游戏中,你真的可以做出很棒的游戏。”但他17日并未详细解释该工作室将如何运营,以及将开发什么种类的游戏。
此次成立的AI游戏工作室由xAI公司负责。公开资料显示,xAI成立于2023年7月12日,有分析称其目的旨在与OpenAI一决高下。但马斯克声称,构建xAI的目标,是要专注于回答更深层次的科学问题,期望未来可以用AI帮助人们去解决复杂的科学和数学问题并且“理解”宇宙。
xAI公司成立后,时隔半年便发布了Grok和Grok 1.5模型。2024年8月,该公司发布了Grok 2语言模型;12月,xAI宣布开始向X平台上的所有用户免费推出新版Grok 2模型,而此前该模式只向那些订阅了Premium Plus的用户开放。
xAI的融资能力更是惊人,2024年5月,xAI宣布完成60亿美元的B轮融资。随后,在当年12月,公司又宣布完成了60亿美元的C轮融资。根据美国风投数据研究公司PitchBook整理的数据,该公司上一次估值约为510亿美元。
据美国媒体报道,xAI正寻求新一轮约100亿美元的融资,此轮融资将使公司估值达到约750亿美元。包括红杉资本、Andreessen Horowitz以及Valor Equity Partners在内的现有投资者正在洽谈参与此次交易。此次融资的具体条款尚未最终确定,仍可能发生变化。可以说,手握Grok系列模型并想在AI领域多点开花的xAI,将为全球AI行业的未来格局增添巨大的不确定性。
AI大模型进入“神仙打架”模式
马斯克的xAI无疑是AI大模型领域强有力的竞争者,同样参与这场竞技的还有OpenAI、谷歌、Anthropic以及近期引发全球关注的中国初创企业DeepSeek。
北京《中国证券报》报道,伴随AI快速迭代,模型的领先优势的“保质期”越来越短,有业内人士表示,“不超过100天,就会有新的模型出现,并超越。”
比如OpenAI于近日宣布,公司将在未来几个月内推出新一代AI模型GPT-5和GPT-4.5。据称,GPT-5将整合OpenAI的多项核心技术,包括o3推理模型。
OpenAI首席执行官兼联合创始人SamAltman在社交平台表示:“对于高要求的测试者来说,试用GPT-4.5的体验,远比我预期的要深刻得多!”业内人士预计,这说明GPT-4.5已经进入测试阶段,离正式发布非常近了。
2月初,DeepSeek新模型发布后,谷歌公司发布Gemini2.0系列模型,该系列模型强化了编码与推理能力,全面开放使用并降低成本。
另有消息称,Anthropic计划在未来几周内发布新的混合型大模型Claude4,用户可以自行控制使用时的推理成本。
当地时间17日,总部位于法国巴黎的Mistral发布名为Mistral Saba的定制大模型,特点是具有高准确率的阿拉伯语交互能力。
今年春节以来,中国初创企业DeepSeek发布新模型DeepSeek-R1,以极低的训练成本和使用成本,超越OpenAI对标模型,搅动AI大模型竞争,也在中国各大行业带起了大模型接入潮。
据不完全统计,已经有数百家公司正式接入DeepSeek研发的大模型。包括中国三大基础运营商、超过15家芯片厂商,以及包括云服务、网络科技、金融在内的200多家企业,多个手机厂商和车企,地方政府政务系统,以及微软、英伟达、亚马逊等世界级云计算巨头都宣布接入DeepSeek。
腾讯集团确认,微信自北京时间15日起开始灰度测试接入DeepSeek-R1模型,增强其搜索功能。消息一出,引发腾讯股价大涨。16日,百度搜索宣布全面接入DeepSeek和文心大模型最新的深度搜索功能。
另据报道称,曾担任OpenAI创始团队、斯坦福博士、训练大型深度神经网络的工程师Andrej Karpathy表示,在大约使用了两个小时的过程中,他感受到,Grok3加上深度思考模式的能力略好于DeepSeek-R1和Gemini2.0Flash Thinking。“这场大语言模型(LLM)模型领域的竞赛令人非常兴奋!”Karpathy说。
开源、合作 AI未来发展方向在哪?
值得一提的是,马斯克表示,将在数月后对Grok 3进行全面开源,之后的节奏将是“发布一个新版本后开源上一版本”。
综合中新社、北京《中国证券报》报道,在开源大模型DeepSeek冲击之下,无论是OpenAI、xAI,还是中国的百度、腾讯这些科技大厂,都走到了一个新的“十字路口”:要么开源发力AI应用和解决方案,要么用闭源打败开源。
“对于我们的下一个开源项目,我们应当选择开发一个虽然体积小但仍然需要借助GPU运行的o3mini层级模型,还是应当致力于开发一个尺寸适合手机且表现最佳的模型呢?”OpenAI首席执行官萨姆·奥尔特曼17日早发起投票,最终端侧模型的投票率大幅领先,相比于o3mini的开源,显然高赞评论的网民更希望开源GPT-4。
走向免费的大模型如何赚钱?一位关注AI创新的投资服务业人士表示:AI大模型企业要想挣钱,可以提供面向企业端的解决方案,同时大模型企业的估值也不是根据模型,而是看其生态。他称,对于大模型企业来说,未来的估值将不再单纯依赖于模型本身,而是更多地关注其生态建设、用户规模、数据质量以及增值服务的盈利能力。拥有庞大用户基础和完善生态的企业,将在未来的市场竞争中占据优势。
长期研究AI的欧洲科学院院士福斯托·准奇利亚则表示,当前,研究AI的主要企业都提出了各自的模型,这些企业呈现“以竞争的方式独立完成(AI研发)”的局面。但面对未来AI发展将面临的各项挑战,应当通过合作来解决,从而建设一个更具包容性和可持续性的社会。
开源、免费加快了AI大模型走入日常生活的脚步,准奇利亚说,随着生成式AI的飞速发展,AI领域发展形成了以创造智能系统支持用户进行以人为中心的任务的主导趋势。AI将改变人们的思维方式,改变知识和推理的本质,并可能成为人类文明获得巨大飞跃的独特机遇,“试想,如果AI能让每个人都向世界上最能满足其需求者寻求帮助,我们的生活质量将会得到多大提升”。
准奇利亚称赞DeepSeek-R1,称其在大幅降低能耗的同时获得更高质量的结果,这“无疑是未来AI发展的方向”。“不过,在我看来,这只是刚刚迈出了一小步,所取得的第一批成果还可以进一步扩大,从而使AI系统更经济实惠、贴近现实,并对人类更有用。”他说。