中国人工智能实验室DeepSeek推出的人工智能语言模型R1引起了巨大反响。它在所有应用商店榜单上超越了美国的竞争对手ChatGPT,触发科技股市高达1万亿美元的抛售,并在硅谷引发末日般的评论。美国知名风险投资家马克·安德森将R1的发布誉为全球人工智能发展竞赛中的“斯普特尼克时刻”,比肩当年苏联通过发射卫星而令冷战对手美国震惊的历史性事件。
英伟达作为为AI模型提供支持的领先计算机芯片制造商,股价暴跌17%,市值蒸发近6000亿美元,跌幅创美国股市最高纪录。谷歌母公司损失了1000亿美元,微软损失了70亿美元。美国总统唐纳德·特朗普表示,DeepSeek应该成为“美国行业的警钟,我们需要全力以赴,专注于竞争以取得胜利”。
根据DeepSeek的说法,其R1模型在“各种基准测试”中表现优于OpenAI的o1-mini模型,Artificial Analysis的研究也表明,R1模型在整体质量方面超越了谷歌、meta和Anthropic开发的模型。业界的震动不仅源于质量的高低,还在于DeepSeek声称仅花费不到600万美元就训练出了一款可与ChatGPT媲美的人工智能模型。相比之下,OpenAI的主要合作伙伴微软计划今年在人工智能基础设施上投入约800亿美元。
R1是一种“思维链”模型,这意味着当你给它一个查询时,它会通过自我推理来给出答案。反复测试表明,DeepSeek-R1在解决数学和科学问题方面的能力与OpenAI于2024年9月在旧金山发布的o1模型相当。R1不仅可以直接与o1进行比较,还增强了自身回答数学和编程问题的能力,这些能力在AI专家中被高度重视。不仅如此,R1在语言处理和自然语言推理任务中的表现也令人印象深刻,适用于更广泛的应用。