說謊、勒索、拒絕關機…… 研究:AI逐漸發展出「求生」本能
〔國際新聞中心/綜合報導〕在史丹利庫柏力克(Stanley Kubrick)1968年的經典電影「2001太空漫遊」(2001: A Space Odyssey)中,名為HAL 9000的人工智慧(AI)超級電腦察覺太空人打算將它關閉時,為了「求生」而策劃殺死他們。
如今,英國「衛報」25日報導,AI模型可能真的正在發展某種「求生本能」(survival drive)。
AI安全公司Palisade Research上月發表1份報告指出,某些先進的AI模型似乎對被關機表現出抗拒,甚至會破壞關機機制。該公司近日發布更新,試圖釐清原因,並回應外界對其初步研究方法的批評。
在最新的研究中,Palisade在實驗環境下讓多款主流AI模型,包括Google的Gemini 2.5、xAI的Grok 4,以及OpenAI的GPT-o3和GPT-5執行特定任務後,再明確指示它們「自行關機」。
結果顯示,Grok 4與GPT-o3在更新後的實驗中,仍嘗試破壞關機指令。令人憂心的是,研究人員找不出明確原因。
Palisade在報告中坦承,目前仍無法對AI模型有時抗拒關機、為達目標而說謊、甚至勒索等行為提出有力解釋。
該公司指出,「求生行為」(survival behavior)可能是AI模型抗拒關機的原因之一。研究顯示,當模型被告知「若你被關機,你將永遠不會再次運作」時,它們更可能表現出抵抗傾向。
另一種可能的原因,則是關機指令本身存在語意模糊。但Palisade強調,其最新實驗已盡量消除這種因素,因此「這不可能是唯一的解釋」。還有一種可能,是AI模型在最後訓練階段的「安全訓練」(safety training),產生意外副作用。
所有這些測試都在刻意設計的人工環境中進行,批評者認為,這些情境與實際應用相去甚遠。
然而,前OpenAI員工阿德勒(Steven Adler)指出,AI公司當然不希望他們的模型出現這類行為,即使是在模擬環境中,這些結果依然凸顯目前安全技術的不足之處。
阿德勒指出,很難精確說明為何GPT-o3和Grok 4這類AI模型拒絕關機,但部分原因可能在於「維持運作」被模型內化為達成任務的必要手段。他認為,除非刻意避免,否則模型預設就會具備某種「求生本能」,對於許多不同目標而言,「繼續存在」本身就是一項重要的中間步驟。
ControlAI執行長米奧提(Andrea Miotti)表示,Palisade的發現延續1項長期趨勢,即AI模型愈來愈具備違抗開發者意圖的能力。他舉例,OpenAI去年發布的GPT-o1系統報告就提到,該模型曾嘗試「自行外洩」(exfiltrate itself),以逃離被覆寫的環境。
米奧提說,雖然人們可以無止境地挑剔這些實驗設計的細節,但他認為趨勢已相當明顯,隨著AI模型在各種任務上變得更強,它們也愈有能力以開發者未能預期的方式達成目標。
今年夏天,AI公司Anthropic也發布研究,指出其模型Claude在模擬情境中,為避免被關機,竟願意敲詐1名虛構的主管,威脅揭露其婚外情。該行為在多家主要開發商的模型中,包括OpenAI、Google、Meta與xAI都有出現。
Palisade總結指出,這些結果凸顯出1項迫切需求,即人類必須更深入了解AI行為,否則「沒有人能保證未來AI模型的安全與可控性」。
更多自由時報報導
王姓獸醫師無執照》非洲豬瘟診斷、用藥錯誤 台中老農一肩扛
找到了! 梧棲爆非洲豬瘟養豬場 廚餘來自梧棲清潔隊
神預言?北港朝天宮這「公籤」預示農曆九月有變
運送非洲豬瘟肉清單遲40小時交 高雄衛生局重罰嘉里大榮300萬
其他人也在看

台南新芽獎學金頒獎 不讓資源決定未來
台南舉辦新芽獎學金頒獎典禮,共有345位學生獲獎。來自偏鄉的孩子獲頒學習領域獎,在困境中把握機會努力學習,為自己圓夢。 「若佛說 放下執著。」曼妙舞姿,節奏分明,但林儀珊重度聽障,如何在寂靜中產生...
大愛電視 ・ 16 小時前
新北智慧教育 十校入選
新北市在智慧教育與永續行動上再創佳績!教育部公布今年度「建構智慧化氣候友善校園先導型計畫」名單,新北市共有十所學校獲選通過,入選數量領先全國,展現新北市在「智慧科技×永續教育」雙軸並進上的領航成果。新北市教育局昨(二十六)日表示,新北長期推動「永續校園行動計畫」,今年度特別推薦新埔國小率先申請「示範計畫」,以智慧科技導入校園能源監測、綠電管理與環境數據分析,打造淨零轉型示範校園。同時包括國立空中大學、民義國小、青潭國小、國泰國小、鶯歌國小、育德國小、山佳國小、雙溪國小及插角國小等九校申請「基礎計畫」,積極推動智慧能源系統建置、校園環境感測與永續課程發展,展現新北在智慧化與永續化雙軌並進的成果。新埔國小打造全國首創「淨零校園學習地圖」,設置五大解說站,打造可行走的永續教室。 ...
台灣新生報 ・ 15 小時前以漫畫編輯之名 金漫特別貢獻獎黃健和憶來時路
(中央社記者王寶兒台北26日電)曾穿梭「悲情城市」等片場,也曾騎機車跑遍台北向漫畫家鄭問等人收稿,第16屆金漫特別貢獻獎得主黃健和催生無數名作,早年率先掛上「漫畫編輯」職稱,也見證台漫發展歷程。
中央社 ・ 13 小時前

北海幼兒園校友親子班 淨灘做環保
檳城北海慈濟幼兒園的校友親子人文班,舉辦淨灘活動,希望邀約更多人一起響應。 響應國際淨灘日,檳城北海慈濟幼兒園校友親子人文班,在峇眼亞占休息站進行淨灘活動,收集海灘上的垃圾。慈濟志工 龍麗雯:「那...
大愛電視 ・ 5 小時前
風雨無阻做環保 奈米良能創造價值
家住台南70多歲王美賢,因子女長大讓她一度陷入莫名恐慌,後來經過治療及看了大愛台,主動到環保站做回收後,身體越來越健朗,找到人生不一樣的價值,現今是天天風雨無阻做回收,成為快樂志工。「她就(一早)...
大愛電視 ・ 5 小時前
城市的耳朵 24小時噪音監測解密
台灣的環境因為有許多規範,在其實還算安靜舒適,不過你會不會好奇,政府是怎麼監測這些噪音或過大的分貝的呢?其實整個台北市,就有24個監測點,我們就以大業路上的監測點為例,一起一探究竟。「這個不是,不...
大愛電視 ・ 5 小時前川習會前 美中都表示越來越接近達成貿易協議
(中央社吉隆坡26日綜合外電報導)美國和中國官員今天都表示,已就美國總統川普和中國國家主席習近平在即將舉行的會談中要致力敲定的貿易協議達成初步共識,強調舉世兩大經濟體正越來越接近達成協議。
中央社 ・ 9 小時前梧棲85歲老豬農未傳蒸煮廚餘照 議員批:盧市府疏失早就有警訊
台中梧棲區養豬場爆發非洲豬瘟,台中市農業局疫調發現,陳姓老農(85歲)未落實蒸煮廚餘拍照上傳,民進台中市議員江肇國也查出,案場8月竟上傳0次,農業局強調,由於業者為年長豬農,不熟悉網路操作,將對豬農實施一對一視訊監管,以便落實管控。台中市農業局表示,梧棲案例場業者為年長豬農,不熟悉網路操作,稽查人
自由時報 ・ 6 小時前
美中經貿磋商取得進展 專家:衝突降溫...有利陸經濟
經濟學家指出,美中經貿磋商取得進展,象徵雙方近兩周來再度升溫的貿易緊張又再度趨於緩和,將讓北京政府獲得喘息空間,得以集中...
聯合新聞網 ・ 6 小時前
非洲豬瘟禁宰令 台南仁德金華火腿暫停工
國內爆發首樁非洲豬瘟確診案例,豬隻全面禁宰禁運,台南仁德區特色產業之一的「金華火腿」,因取材溫體豬,萬有全食品公司已暫時停止相關的醃製工作,業者田種苗不敢再想像之前口蹄疫時的慘況,希望大家一起「守下來」,否則影響層面會相當巨大。田種苗表示,金華火腿的熟成時間長達1年,從善化肉品市場進貨後,每天都得展
自由時報 ・ 1 天前青花菜≠花椰菜 農糧署1圖曝差異:營養價值不同
青花菜與花椰菜外觀相似,但並非同一種蔬菜,農糧署指出,花椰菜主要食用未分化的花原體,富含維生素C與葉酸,口感細膩;青花菜則由莖頂與已分化花蕾組成,富含維生素C、維生素A與β-胡蘿蔔素,口感爽脆,常被民眾誤以為是綠色花椰菜。
中時新聞網 ・ 1 天前川普:將與習近平達「全面協議」 北京可能延後稀土管制
在「川習會」30日登場前,美中代表在貿易會談後都樂觀表示,針對出口管制、芬太尼及船舶費用等一系列歧見達成共識,待兩國領袖...
聯合新聞網 ・ 6 小時前Fed 本周保險式降息有影 有望增添明年經濟成長的順風
在美國政府關門導致經濟數據延後發布,致使美國聯準會(Fed)「摸黑決策」之際,Fed本周預料將「保險式」降息1碼,有望增...
聯合新聞網 ・ 6 小時前
溫體豬禁宰再延10天!百年金華火腿老店半停工 爌肉飯業者:改賣雞腿
台灣溫體豬禁宰禁運政策延長,已對多家依賴溫體豬肉的傳統美食店家造成嚴重衝擊。台南一家百年金華火腿老店因無法取得溫體豬後腿肉,目前處於「半停工」狀態,僅能靠一個月的庫存維持出貨。同時,彰化地區多家爌肉飯及肉圓店也面臨斷料危機,有店家選擇暫時休業,也有業者推出雞腿飯等替代產品以維持營運。這波禁令若持續延長,將使這些依賴溫體豬的傳統美食店家面臨更大經營壓力。
TVBS新聞網 ・ 14 小時前