DeepSeek模型現'極'字異常輸出,技術團隊確認修復方案
時間:2025-09-04 來源: 作者: 我要糾錯
DeepSeek V3.1版本近期出現了一個被開發者稱為"極你太美"的技術故障,引發了廣泛關注。
具體表現為:開發人員在調用API進行編程時,生成的結果中會隨機出現"極"字符號。
示例如下:
該問題最初在火山引擎、chutes等平臺被察覺,隨后迅速擴散至更多服務平臺,包括騰訊CodeBuddy以及DeepSeek官方平臺。
在國際開發者社區Reddit上,這一問題也引發了熱烈討論,主要涉及"extreme"、"極"和"極"等關鍵詞:
"extreme"(編號:15075)
"極"(編號:2577,中文簡體中的extreme)
"極"(編號:16411,中文繁體中的extreme)
騰訊CodeBuddy平臺甚至出現了更特殊的情況,直接插入了包含"極"字的推廣內容。
△
圖片來源:小紅書用戶@奈緒白 Nine-piece shell
如果開發人員未仔細檢查就直接使用生成的編碼,很可能導致編譯失敗等問題,這對需要高精度、結構化輸出的應用場景造成了嚴重影響。
目前,業界普遍認為問題根源在于DeepSeek V3.1模型本身,CodeBuddy方面已表態:
已與DeepSeek技術團隊建立聯系,將在近期版本中完成修復。
△
圖片來源:微信公眾號"劉小排r"留言區
當前如何規避"極"字異常?
雖然徹底解決需要等待官方更新,足球直播無插件但已有用戶開始分享臨時應對策略。
例如小紅書用戶@大模型產品經理提出的提示詞調整方案:
關鍵提示詞設置為:
禁止以下符號序列模式:
[空格] [若干標識符] [占位符/省略號]
該方法主要適用于調用API的第三方平臺,DeepSeek V3.1官方平臺則無需此操作。
技術原因分析
關于該問題的成因,知乎用戶、階躍星辰黃哲威提供了專業見解,獲得高度認可。
他指出這種現象并非首次出現。在使用小型模型和開源數據蒸餾,以及測試早期R1模型時,就遇到過類似問題。
黃哲威認為這與大模型編程時可能出現的"異常模式"有關。英超聯賽他舉例說明,在枚舉質數的任務中,正常模型應該持續列舉,如"質數序列 2, 3, 5, 7 …"。
但他觀察到代號R1-0528的模型會出現特殊行為:列舉一段時間后自動停止,變成有限序列,例如"質數序列 2, 3, 5, 7 … 997, 極長"。足球直播
這種"極長"的使用方式與當前討論的"極"字問題十分相似,通常出現在大量異常重復后,作為推理過程的校正。有時模型甚至會輸出"90000000…0000極大數值"這類內容。
他進一步描述了異常觸發的場景。當模型陷入"思考"循環無法跳出時,有小概率會突然輸出"極"字并終止思考,這似乎成為一種特殊的終止標記。
通過分析R1模型的大量輸出,黃哲威發現了多個問題,免費電影包括超長響應、大段空白字符、持續短句重復等,連思考末尾的英文字符都變得殘缺不全。
基于這些觀察,他提出核心推測:問題根源可能在于數據凈化不徹底。在進行監督微調數據合成乃至預訓練數據構建時,可能未完全清理名為"'極長'數組"的異常數據。
他推斷,R1模型在處理復雜問題時,似乎大量采用了檢索增強生成技術,而在后續強化學習階段,模型直接將"極"字作為終止符或語言切換標記來學習使用。
最后黃哲威總結道,五大聯賽如果R1迭代時的數據未徹底凈化,模型自行蒸餾并"污染"正常輸出過程是完全可能的。這為理解DeepSeek V3.1模型的"極"字問題提供了重要參考。
這個被用戶戲稱為"極你太美"、"'極'速版"的技術問題何時能徹底解決,還需等待DeepSeek官方的版本更新。
標簽: