今年春节,DeepSeek 成为了AI圈的焦点。人们热议这款前所未有的出圈AI产品及其公司,讨论中夹杂着中美竞争、美股暴跌等热门话题,使得DeepSeek被神化或妖魔化。
然而,DeepSeek的研究员们在忙些什么呢?尽管这家公司极其低调,但它鼓励科学家追求学术成就,并以开源为基础进行研究。这些年轻的研究员们在社区里活跃,分享自己的工作和见解。
与那些夸张的文章相比,研究员们的实际分享往往阅读量不高。但对真正想了解DeepSeek的人来说,这些真实的分享更为重要。例如,认证为DeepSeek机器学习和多模态研究员的刘星超,在推特上分享了自己的工作,并与他人互动。他参与开发的多模态模型JanusFlow获得了知名学者的关注,而他的回复也充满了人情味。
这些研究员们经常关注同行的工作,并点赞或提问。在DeepSeek爆火之前,他们的信息常常石沉大海。例如,邵智宏在实习期间成为DeepSeek Math的核心作者之一,后来参与了R1等模型开发。他在推特上点赞并祝贺其他团队,就像普通关注者一样。