安全風險

首次發表國際人工智慧安全報告的重要更新

滿地可2025年10月17日 /美通社/ — 首次發表國際人工智慧安全報告的重要更新,及時提供先進人工智慧能力與風險的更新。 該報告由圖靈獎得主兼電腦科學家 Yoshua Bengio 主導,超過 100 位國際專家參與,並得到超過 30 個國家/地區和國際組織(包括歐盟、經濟合作暨發展組織和聯合國)的支援。 由於認識到該領域太迅速發展而單一年度報告無法涵蓋,因此引入重要更新,提供更簡短兼更集中的關鍵發展報告。這將確保政策制定者得到最新文獻合編,而告知證據為本的政策制定。 首次重要更新涵蓋能力進步與風險影響: 人工智慧模型不斷改善解決複雜問題的能力:例如,多個領先系統現可於一組現實世界軟體工程問題中,完成超過 60% 任務。到了 2025 年初,它們僅可完成當中約 40% 問題,而到了 2024 年初,它們無法解決任何問題。(事實上,自從最終確定本更新的文字後,效能已提升至超過 70%。) 業界參與者已採取全新防範保障措施: 在無法明確排除最新模型可協助發展化學、生物、放射和核子風險的可能性後,大型人工智慧開發商們便已主動推出具備額外安全措施的最新模型。 人工智慧模型接受評估過程期間,越來越多表現策略行為,而導致監督挑戰:人工智慧模型越來越可能顯示它們正在接受評估的意識,並相應地改變自身輸出。這對開發人員和測試人員於新人工智慧模型部署前準確評估人工智慧模型功能的能力,提出重大質疑。 該報告主席、滿地可大學教授、LawZero 科學主任兼 Mila…