DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型

客服微996438433个月前财经知识61

9月18日,梁文锋作为通讯作者,带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》。

_DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型_DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型

图据澎湃新闻

《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。最终它学会了推理——逐步解决问题并揭示这些步骤——更有可能得出正确答案。这使得DeepSeek-R1能够自我验证和自我反思,在给出新问题的答案之前检查其性能,从而提高其在编程和研究生水平科学问题上的表现。

_DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型_DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型

图据澎湃新闻

据悉,DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。

在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。

DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。

今年1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1引爆AI行业,作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAIo1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。

伴随AI大模型行业的日新月异,DeepSeek已经更新出R1以外的新版本,但万众期待的R2尚未面世。此前8月21日DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。

据介绍,V3.1包含三大主要变化。首先,V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式;其次,V3.1具有更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;另外,V3.1具有更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

当时,DeepSeek表示,DeepSeek-V3.1使用UE8M0FP8Scale的参数精度。UE8M0FP8是针对即将发布的下一代国产芯片设计。这也表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。相关表态,一度带动国产芯片算力股价迎来飙升。

来源:澎湃新闻(记者 范佳来)、界面新闻

相关文章

浆水、老盐、椒麻…这一批奶茶店狂下“猛料”

浆水、老盐、椒麻…这一批奶茶店狂下“猛料”

作者 |餐饮老板内参内参君 新一批奶茶店,开下“猛料” 这年头,奶茶不“甜”了? 前两天,喜茶在春熙路的叠院推出限定产品“川椒滇红”,据品牌方介绍,该产品包含汉源花椒、金阳青花椒、云南荜茇三种椒...

突然,被雷劈了,亏200万

突然,被雷劈了,亏200万

正在网上悠哉游哉冲浪,突然看到一个卖房视频: “XX小区,亏血本出房。” 我心一惊,这不就是我小区么? 我细细一看,这不就跟我一个户型,一个面积么? 比我买的时候便宜了整整200万。 心情一下子草泥马...

美国或面临数百万劳动力流失

美国或面临数百万劳动力流失

据《卫报》7月29日报道,近日特朗普政府在移民政策上的一系列举措正对美国各行业造成广泛压力,特别是在依赖移民劳动力的工业领域。工会领导人和工人们指出,特朗普的移民打压政策正在加剧劳动力短缺,一些工厂已...

城镇化率突破67%,城市发展转向存量优化,自然资源部:将发布规划指南

城镇化率突破67%,城市发展转向存量优化,自然资源部:将发布规划指南

当城市发展进入存量时代,如何盘活优化存量土地,已经成为提升城市土地利用效率,实现城市可持续发展的关键。 近日,时代周报记者从自然资源部获悉,《城市存量空间盘活优化规划指南》(以下简称为《指南》)已审议...

一场马拉松,引爆周末!多只机器人概念股获增持,基金经理:3年100倍!

一场马拉松,引爆周末!多只机器人概念股获增持,基金经理:3年100倍!

4月19日,全球首个人形机器人半程马拉松在北京亦庄开赛,来自北京人形机器人创新中心和优必选科技的“天工Ultra”以2时40分42秒的成绩冲线,夺得全球首个人形机器人半程马拉松赛事桂冠。 赛事不仅是...

10家头部券商赚749亿,中信证券丢第一!境外业务哪家强?中金仍未超中信

10家头部券商赚749亿,中信证券丢第一!境外业务哪家强?中金仍未超中信

上市券商2025年中报悉数披露,排名座次也已出炉。 结合去年同期基数较低的背景,以及今年上半年行情提振影响,50家上市券商归母净利润全部实现增长,且未有一家出现亏损,为2022年以来首次达成的中期业绩...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
客服微信:BT86616点击复制并跳转微信