亚洲一级免费观看_五十路熟女丰满大屁股_国产高清精品软男同_日本久久久精品视频_中文字幕色呦呦_欧美精品久久96人妻无码_亚洲一二区在线观看_少妇高清精品毛片在线视频_黄色影视在线观看_eeuss中文_午夜探花在线观看_日韩精品在线视频免费观看

首頁 > 別克 > DeepSeek-R1開創歷史！首登《自然》封面，梁文鋒團隊正面回應蒸餾質疑、發布詳盡安全報告。

DeepSeek-R1開創歷史！首登《自然》封面，梁文鋒團隊正面回應蒸餾質疑、發布詳盡安全報告。

發布時間：2025-09-19 13:43:35 發布用戶： kangbai

9月17日，由DeepSeek團隊共同完成、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文，登上了國際權威期刊《自然（Nature）》的封面。

DeepSeek-R1論文首次公開了僅靠強化學習，就能激發大模型推理能力的重要研究成果，啟發全球AI研究者；這一模型還成為全球最受歡迎的開源推理模型，Hugging Face下載量超1090萬次。此番獲得《自然》的認證，可謂是實至名歸。

與此同時，DeepSeek-R1也是全球首個經過同行評審的主流大語言模型?！蹲匀弧吩谏缯撝懈叨仍u價道：幾乎所有主流的大模型都還沒有經過獨立同行評審，這一空白“終于被DeepSeek打破”。

《自然》認為，在AI行業中，未經證實的說法和炒作已經“司空見慣”，而DeepSeek所做的一切，都是“邁向透明度和可重復性的可喜一步”。

▲《自然》雜志封面標題：自助——強化學習教會大模型自我改進

發表在《自然》雜志的新版DeepSeek-R1論文，與今年1月未經同行評審的初版有較大差異，披露了更多模型訓練的細節，并正面回應了模型發布之初的蒸餾質疑。

▲發表在《自然》雜志的DeepSeek-R1論文

在長達64頁的同行評審文件中，DeepSeek介紹，DeepSeek-V3 Base（DeepSeek-R1的基座模型）使用的數據全部來自互聯網，雖然可能包含GPT-4生成的結果，但絕非有意而為之，更沒有專門的蒸餾環節。

DeepSeek也在補充材料中提供了訓練過程中減輕數據污染的詳細流程，以證明模型并未在訓練數據中有意包含基準測試，從而提升模型表現。

此外，DeepSeek對DeepSeek-R1的安全性進行了全面評估，證明其安全性領先同期發布的前沿模型。

《自然》雜志認為，隨著AI技術日漸普及，大模型廠商們無法驗證的宣傳可能對社會帶來真實風險。依靠獨立研究人員進行的同行評審，是抑制AI行業過度炒作的一種有效方式。

論文鏈接：

https://www.nature.com/articles/s41586-025-09422-z#code-availability

同行評審報告：

https://www.nature.com/articles/s41586-025-09422-z#MOESM2

補充材料：

https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-025-09422-z/MediaObjects/41586_2025_9422_MOESM1_ESM.pdf

01 .

新版論文披露多個重要信息

R1安全性獲全面評估

在了解新版論文的變化前，我們有必要先回顧下DeepSeek-R1論文的核心內容。

DeepSeek-R1的研究出發點，是當時困擾AI業內的一個重大問題。眾所周知，推理能提升大語言模型的能力，但讓模型在后訓練階段通過數據學習思維鏈軌跡，嚴重依賴人工標注，限制了可擴展性。

DeepSeek嘗試通過強化學習，讓模型自我演化發展出推理能力。在DeepSeek-V3 Base的基礎上，DeepSeek使用GRPO作為強化學習框架，僅使用最終預測結果與真實答案的正確性作為獎勵信號，未對推理過程施加限制，最終構建出DeepSeek-R1-Zero。

DeepSeek-R1-Zero通過強化學習成功掌握了改進的推理策略，傾向于生成更長的回答，每個回答中包含驗證、反思和探索備選方案。

▲DeepSeek-R1-Zero答題正確率隨著推理長度提升，模型訓練中總體回答長度也不斷提升

DeepSeek在DeepSeek-R1-Zero的基礎上，采用多階段訓練結合RL、拒絕采樣和監督微調，開發出DeepSeek-R1，使模型既具備強推理能力，又能更好貼合人類偏好。此外，團隊還蒸餾出小型模型并公開發布，為研究社區提供了可用資源，推動思維鏈推理模型的發展與應用。

除了上述主要科研成果外，在最新版的論文和其他材料中，DeepSeek新增了不少補充信息，讓外界更深入地了解到模型訓練和運作的細節。

基準測試數據污染是一個極為敏感的問題——如果廠商在訓練時有意或無意包含了基準測試和相關答案，就很有可能導致模型在相關測試上的得分異常偏高，影響基準測試評分的公正性。

DeepSeek透露，為了防止基準測試數據污染，其已對DeepSeek-R1的預訓練和后訓練數據都實施了全面的去污染措施。以數學領域為例，僅在預訓練數據中，DeepSeek的去污染流程就識別并刪除了約六百萬條潛在文本。

在后訓練階段，數學相關的數據均來自2023年之前的競賽，并采用與預訓練相同的過濾策略，確保訓練數據與評測數據完全不重疊。這些措施保證了模型評測結果能夠真實反映其解決問題的能力，而非對測試數據的記憶。

不過，DeepSeek也承認這種去污染方法無法完全防止對測試集的改寫，因此在2024年之前發布的部分基準測試仍可能存在污染問題。

DeepSeek還為DeepSeek-R1新增了一份全面的安全報告。報告提到，DeepSeek-R1在服務部署中引入了外部風險控制系統，不僅可以基于關鍵詞匹配識別不安全對話，還使用DeepSeek-V3直接進行風險審查，判斷是否應拒絕響應。DeepSeek建議開發者在使用DeepSeek-R1時，部署類似的風險控制系統。

在公開安全基準測試和內部安全研究中，DeepSeek-R1在大多數基準上超過了Claude-3.7-Sonnet、GPT-4o等前沿模型。開源部署版本的安全性雖不及具備外部風險控制系統的版本，但仍擁有中等水平的安全保障。

DeepSeek-R1發布之初，曾有傳聞稱該模型使用了OpenAI的模型進行蒸餾，這也出現在審稿人的提問中。

對此，DeepSeek做出了正面回應，稱DeepSeek-V3-Base的預訓練數據全部來源于網絡，反映自然數據分布，“可能包含由先進模型（如GPT-4）生成的內容”，但DeepSeek-V3-Base并沒有引入在合成數據集上進行大規模監督蒸餾的“冷卻”階段。

DeepSeek-V3-Base的數據截止時間為2024年7月，當時尚未發布任何公開的先進推理模型，這進一步降低了從現有推理模型中無意蒸餾的可能性。

更重要的是，DeepSeek-R1論文的核心貢獻，也就是R1-Zero，不涉及從先進模型進行蒸餾。其強化學習（RL）組件是獨立訓練的，不依賴于GPT-4或其他類似能力模型的輸出或指導。

02 .

R1論文開創大模型科研新范式

《自然》盛贊其填補空白

在社論中，《自然》詳細地分析了DeepSeek-R1經歷完整同行評審流程，并登上期刊的價值。

大模型正在迅速改變人類獲取知識的方式，然而，目前最主流的大模型都沒有在研究期刊中經歷過獨立的同行評審，這是一個嚴重的空白。

同行評審出版物有助于闡明大模型的工作原理，也有助于業內評估大模型的表現是否與廠商宣傳的一致。

DeepSeek改變了這一現狀。DeepSeek在今年2月14日將DeepSeek-R1論文提交至《自然》，而直到7月17日才被接收，9月17日正式發布。

在這一過程中，有8位外部專家參與了同行評審，對這項工作的原創性、方法和魯棒性進行了評估。在最終發布的版本中，審稿報告與作者回復都被一并披露。

智東西也深入研讀了DeepSeek-R1論文的審稿意見與作者回復。這份文件長達64頁，接近論文本身篇幅的3倍。

▲DeepSeek同行評審材料封面

8位審稿人共提出上百條具體意見，既包括對單詞單復數等細節的修改，也涵蓋對論文中將AI“擬人化”的警示，以及對數據污染和模型安全性問題的關注。

例如，在下方修改意見中，審稿人敏銳地捕捉到了“將DeepSeek-R1-Zero開源”這一表述的模糊性，并提醒DeepSeek，“開源”這一概念的界定仍存爭議，在使用相關表述時需要格外注意。

這位審稿人還要求DeepSeek在論文中附上SFT和RL數據的鏈接，而不僅僅是提供數據樣本。

▲一位審稿人的部分修改意見

DeepSeek認真回應了審稿人提出的每一個問題，前文提到的多個章節與補充信息，正是在審稿人的建議下新增的。

雖然DeepSeek也曾在今年1月發布DeepSeek-R1的技術報告，但《自然》認為，此類技術文檔與實際情況之間的差距可能很大。

相比之下，在同行評審中，外部專家并不是被動接收信息，而是能夠在獨立第三方（編輯）的主持和管理下，通過協作提出問題，并要求論文作者補充信息。

同行評審能夠提升論文的清晰度，并確保作者對其主張作出合理的論證。這一流程并不一定會對文章內容帶來重大修改，但卻能增強研究的可信度。對AI開發者而言，這意味著他們的工作會更為扎實，并更具說服力。

03 .

結語：DeepSeek開源模式

或成行業典范

作為國產開源 AI 模型走向世界的代表，DeepSeek-R1在全球開源社區擁有極高的口碑。而在本次登上《自然》雜志封面后，DeepSeek又補充了這一模型的更多信息，為開源社區提供了科研參考、模型復現思路以及應用支持。

《自然》雜志呼吁更多的AI公司將其模型提交給同行進行評審，確保其聲明經過驗證和澄清。在這一背景下，DeepSeek的開源模式不僅展示了國產AI的技術實力，也有望成為全球AI行業在科研透明度方面的參考典范。

【返回列表】

特別聲明：以上內容(如有圖片或視頻亦包括在內)為“微學堂用戶上傳并發布"，本平臺僅提供信息存儲服務。

下一篇:2025世界智能安全大會（ISC 2025）在西安盛大開幕

上一篇:夾在羅永浩和西貝中間的華與華哥倆，“惹了一身騷”

星越更多>>

你知道長安油車省油有多牛？藍鯨超擎混動實測油耗已榨到1.6L 實測9分20秒充飽！仰望閃充版福州上市，破千續航驚艷蔚來終于盈利，蔚小理們跨過斬殺線了嗎攜手國家隊，東升股份打造汽車零部件測試新高地比起底特律車展本身，搖擺的政策與缺席的電動車更受關注日產在美國遭遇集體訴訟，因Rogue車型后窗自爆小鵬P7+/G7/G6/G9四款新車同步更新輔助駕駛與座艙全面升級十年筑夢，新程再啟！邁向新能源電池全球供應鏈區域化發展新時代

問界更多>>

業界首發2億像素RYYB傳感器華為Pura 90系列影像實力超強純電小型車賣得火！3月小型車銷量榜 4款銷量過萬海鷗第三超級Eva＋千里浩瀚G-ASD 4.0，吉利發布中國首個艙駕融合超級智能體 11.58萬元起，埃安N60開啟預售，全系標配激光雷達越級實力陜耀銀河星耀8遠航家我耀打十個全民眾測西安站加新啟航實車解讀極氪007，不吹不黑，該買的人都買了，適合誰？ 220度電、重載不慌！適合城際運輸的新能源輕卡來了！一場“首映禮”+2000公里進藏路全新QQ3殺回我們的青春

哈弗更多>>

埃安N60炸場預售！11.58萬起享高階智駕，重新定義年輕人第一臺車 Ti時代閃耀泉城方程豹鈦3閃充版上市暨品鑒會·濟南站圓滿收官聚鏈成勢，鄭州展啟航——2026汽后改裝新機遇，雙展聯動拓新局娛樂圈百位明星選乘座駕極狐問道V9憑實力穩坐“高端局” 契約立心，技術歸元 AI豪華六座旗艦魏牌V9X正式開啟預售智己LS8上市，30萬內大SUV這次來了個真正有分量的新選手百公里油耗實測最低1.6L，解析長安汽車藍鯨超擎混動技術越級實力陜耀銀河吉利銀河星耀8遠航家西安上市開啟全民眾測

傳祺更多>>

海外攝影師捕捉識質存在少女角色靈動瞬間，贈Steam激活碼及北通手柄蘋果WWDC2026官宣：macOS 27全面轉向自研芯片，終止英特爾Mac支持光環：戰役進化韓版過審，7月28日發售傳聞升溫全球CPU供應告急：AI芯片擠占產能致主流處理器有價無市大眾的大型SUV，車長5.2米6座布局，517馬力百公里加速5.6秒智己LS8深度試駕：以超越百萬級駕控品質，定義“2026最強8系旗艦” PlayStation 4月無State of Play，5月或官宣漫威金剛狼等新作陪朋友選純電小車，試駕吉利星愿后，終于懂它為何能賣爆60萬臺

凱美瑞更多>>

歸元S平臺重磅發布，魏牌V9X開啟預售37.18萬元起阿維塔雙車重磅發布新阿維塔12上市、阿維塔06T開啟預售星靈智行ADiGO GSD 3.0廣汽埃安開啟國民智駕新紀元長安、吉利等中國車企集體發力HEV賽道，能打敗豐田嗎？電啟新程！沃爾沃純電雙旗艦預售，XC70感恩版上市越野&改裝一步到位，捷途推出2款特別版SUV，限時10.79萬元起設計更新/動力優化，標致408中期改款：新“獅爪”更亮！英國產汽車納入歐盟“歐洲制造”優惠范圍，日產表示歡迎

別克更多>>

東芝REGZA 20周年：中日同源技術鑄就真實音畫新標桿奕境X9首發亮相：5.2米大六座智能SUV殺入紅海市場破局“彈唱平權”：恩雅賽博吉他破億銷量背后的技術普惠邏輯美圖公司Q1產品成績單出爐：6款產品入選AI產品百強榜單代號三國：龍起新宣片發布：2026年4月上線，明星演繹沉浸式三國穿越體驗奕境X9首發亮相：5.3米六座智能SUV，搭載華為乾崑智駕與鴻蒙座艙追覓CEO俞浩詳解全球化多品類戰略與務實創新路徑卡普空新IP識質存在引爆市場，口碑股價雙飆升

DeepSeek-R1開創歷史！首登《自然》封面，梁文鋒團隊正面回應蒸餾質疑、發布詳盡安全報告。

星越更多>>

問界更多>>

哈弗更多>>

傳祺更多>>

凱美瑞更多>>

別克更多>>

DeepSeek-R1開創歷史！首登《自然》封面，梁文鋒團隊正面回應蒸餾質疑、發布詳盡安全報告。