OpenAI员工公开指责Grok3 基准测试争议升级[看点]

发布日期：2025-02-23 22:41:21 来源：互联网作者：亿席商务网浏览次数：121

核心提示：近日，OpenAI的一名员工公开指责埃隆·马斯克旗下的xAI公司，称其发布的最新AI模型Grok3的基准测试结果具有误导性。xAI的联合创始人伊戈尔·巴布什金则坚称公司并无不当

近日，OpenAI的一名员工公开指责埃隆·马斯克旗下的xAI公司，称其发布的最新AI模型Grok3的基准测试结果具有误导性。xAI的联合创始人伊戈尔·巴布什金则坚称公司并无不当。

xAI的图表显示，Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而，OpenAI的员工很快指出，xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金辩称，OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

　　以上是“OpenAI员工公开指责Grok3 基准测试争议升级[看点]”的全部内容，希望对大家有所帮助。

免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。亿席商务网对此不承担任何直接责任及连带责任。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

分享到：QQ空间新浪微博腾讯微博人人网微信

[ 资讯搜索 ] [ 加入收藏 ] [ 告诉好友 ] [ 打印本文 ] [ 违规举报 ] [ 关闭窗口 ]