OpenAI员工公开指责Grok3 基准测试争议升级[看点] - 社会 - 国内资讯 - 亿席商务网
标王 热搜: 广州  SEO  贷款  深圳    医院  用户体验  网站建设  机器人  贵金属 
 
 
当前位置: 首页 » 资讯 » 国内资讯 » 社会 » 正文

OpenAI员工公开指责Grok3 基准测试争议升级[看点]

放大字体  缩小字体 发布日期:2025-02-23 22:41:21  来源:互联网  作者:亿席商务网  浏览次数:99
核心提示:近日,OpenAI的一名员工公开指责埃隆·马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。xAI的联合创始人伊戈尔·巴布什金则坚称公司并无不当

近日,OpenAI的一名员工公开指责埃隆·马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。xAI的联合创始人伊戈尔·巴布什金则坚称公司并无不当。

xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。



 

  以上是“OpenAI员工公开指责Grok3 基准测试争议升级[看点]”的全部内容,希望对大家有所帮助。


免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。亿席商务网对此不承担任何直接责任及连带责任。任何单位或个人如对以上内容有权利主张(包括但不限于侵犯著作权、商业信誉等),请与我们联系并出示相关证据,我们将按国家相关法规即时移除。
 

[ 资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

 
 
本企业其他资讯

 
网站首页 | xml | top资讯 | 粤ICP备11090451号