多色數據

(SeaPRwire) –   DeepSeek R1 的推出震驚了華爾街和矽谷,讓投資者感到不安,也給科技領袖留下了深刻印象。但在所有討論中,許多人忽略了這款新人工智能運作方式的一個關鍵細節——這一細微差別讓研究人員擔心人類控制尖端人工智能系統的能力。

這一切都要歸咎於 DeepSeek R1 的訓練方法上的創新——這種創新導致模型早期版本出現了令人驚訝的行為,研究人員在其發布的論文中描述了這些行為。

在測試過程中,研究人員注意到,該模型會在解決問題時自發地在英語和中文之間切換。當他們強制模型堅持使用一種語言時,這樣使用戶更容易理解,他們發現系統解決相同問題的能力會下降。

這一發現讓一些人工智能安全研究人員敲響了警鐘。目前,最具能力的人工智能系統是用人類可讀的語言「思考」,在得出結論之前寫出它們的推理過程。這對安全團隊來說是一個福音,他們最有效的安全措施包括監控模型所謂的「思想鏈」,尋找危險行為的跡象。但 DeepSeek 的結果增加了即將出現脫鉤的可能性:一種情況是,通過完全擺脫人類語言的約束,可以獲得新的 AI 能力。

可以肯定的是,DeepSeek 的語言切換本身並不足以引起警報。相反,讓研究人員擔憂的是造成這種現象的新的創新。DeepSeek 的論文描述了一種新穎的訓練方法,其中模型僅根據答案是否正確來獎勵,而不管其思考過程對人類來說是否易於理解。令人擔憂的是,這種基於激勵的方法最終可能導致人工智能系統發展出完全不可理解的推理方式,甚至創造出自己的非人類語言,如果這樣做被證明更有效的話。

如果人工智能行業朝這個方向發展——通過放棄可讀性來尋求更強大的系統——「這將奪走原本看起來可能是人工智能安全的一項簡單勝利」,Anthropic 公司(一家致力於將人工智能與人類偏好「對齊」的人工智能公司)研究部門負責人 Sam Bowman 表示。「我們將失去原本可能擁有的監控它們的能力。」

無需語言的思考

人工智能創造自己的外星語言並不像聽起來那麼荒謬。

去年 12 月,Meta 的研究人員着手驗證這樣一個假設:人類語言並不是進行推理的最佳格式——大型語言模型(或 LLMs,這是 OpenAI 的 ChatGPT 和 DeepSeek 的 R1 的基礎人工智能系統)如果不受這種語言約束的限制,可能會更有效率和準確地進行推理。

Meta 的研究人員繼續設計了一個模型,它不是用文字進行推理,而是使用一系列數字來表示其神經網絡中最近的模式——本質上是其內部推理引擎。他們發現,這個模型開始產生他們所謂的「連續思想」——本質上是同時編碼多個潛在推理路徑的數字。這些數字對人類來說完全不透明且難以理解。但他們發現,這種策略在模型中創造了「新興的高級推理模式」。與使用人類語言進行推理的模型相比,這些模式在一些邏輯推理任務中取得了更高的分數。

儘管 Meta 的研究項目與 DeepSeek 的項目大相徑庭,但其研究結果與中國的研究在一個關鍵方面不謀而合。

根據 Gladstone AI(一家就人工智能安全挑戰向美國政府提供建議的公司)的首席執行官 Jeremie Harris 的說法,DeepSeek 和 Meta 都表明,「人類的可讀性會對人工智能系統的性能造成損害」。Harris 說:「從極限上來說,沒有理由 [人工智能的思考過程] 應該看起來像人類可讀的。」

這種可能性讓一些安全專家感到擔憂。

Anthropic 安全團隊負責人 Bowman 說:「看來,牆上寫着這樣一種方法:[對於人工智能研究],你只需優化你能得到的最佳推理。」「我預計人們會擴大這項工作。風險是,我們最終會得到這樣的模型:我們無法自信地說我們知道它們想做什麼,它們的價值觀是什麼,或者當我們將它們設置為代理時,它們將如何做出艱難的決定。」

Meta 的研究人員則表示,他們的研發不一定會導致人類被邊緣化。他們在論文中寫道:「理想情況下,大型語言模型應該可以自由地不受任何語言約束地進行推理,然後只有在必要時才將其研究結果翻譯成語言。」(Meta 沒有回應關於該研究可能導致危險方向的置評請求。)

語言的局限性

當然,即使是人類可讀的人工智能推理也並非沒有問題。

當人工智能系統用淺顯易懂的英語解釋它們的思考過程時,它看起來好像它們在忠實地展示它們的工作過程。但一些專家質疑,這些解釋是否真的揭示了人工智能真正做出決策的方式。這就像向政治家詢問某項政策背後的動機——他們可能會想出一個聽起來不錯的解釋,但與真正的決策過程幾乎沒有聯繫。

雖然讓人工智能用人類術語來解釋自身並不完美,但許多研究人員認為,這比另一種選擇更好:讓人工智能發展出我們無法理解的神秘內部語言。科學家們正在研究新的方法,類似於醫生使用腦掃描來研究人類思維的方式。但這些方法仍然很新,還沒有給我們提供可靠的方法來使人工智能系統更安全。

因此,許多研究人員仍然對鼓勵人工智能以人類語言以外的方式進行推理的努力持懷疑態度。

Bowman 說:「如果我們不走這條路,我認為我們在安全方面將處於更好的位置。」「如果我們這樣做了,我們將失去目前看來是我們在一些非常可怕的、尚未解決的對齊問題中最佳的切入點。」

本文由第三方廠商內容提供者提供。SeaPRwire (https://www.seaprwire.com/)對此不作任何保證或陳述。

分類: 頭條新聞,日常新聞

SeaPRwire為公司和機構提供全球新聞稿發佈,覆蓋超過6,500個媒體庫、86,000名編輯和記者,以及350萬以上終端桌面和手機App。SeaPRwire支持英、日、德、韓、法、俄、印尼、馬來、越南、中文等多種語言新聞稿發佈。

“`