DeepSeek-R1 论文以封面文章形式登上《Nature》,DeepSeek 创始人兼 CEO 梁文峰为通讯作者。研究团队通过实验证明,大语言模型的推理能力可通过纯强化学习提升,减少人类输入工作量,且在数学、编程等任务上表现优于传统方法训练的模型。DeepSeek-R1 在 GitHub 上的 star 数达 91.1k,得到全球开发者好评。卡内基梅隆大学助理教授等评价其从强大但不透明的解决方案寻找者,发展成能进行类人对话的系统。Nature 在 Editorial 文章中肯定其为第一个经过同行评审后发表的主流 LLM,是朝着透明化迈出的可喜一步,同行评审有助于澄清 LLM 工作原理,评估其有效性,并提升模型安全性。
发表回复