AI之戰白熱化！Anthropic推出Claude Opus 4.5：程式、代理、電腦操作，性能碾壓Gemini 3 Pro？

數位時代

2025年11月25日週二上午11:59

重點一：Anthropic 推出 Claude Opus 4.5，宣稱為目前最強，在程式、代理與電腦操作領先。

重點二：模型新增可調整的「effort參數」，趕時間就選低 effort，追求最強效能就選高 effort。讓開發者能用更少資源，跑更長、更複雜的流程，還能依需求調整「思考力」與「成本」。

重點三：Claude Opus 4.5的輸入/輸出代幣降價約三分之二。

Anthropic 宣布推出新一代大型模型 Claude Opus 4.5，定位為其最旗艦版本，並表示在「程式開發、代理（agentic workflows）與電腦使用」方面具備領先能力。

官方指出，Opus 4.5 在多項真實世界工程測試表現出色，包含 SWE-bench 類型的評測，且在多語言與長程推理上有明顯進步。

實務面上，Opus 4.5 在多家早期客戶測試中被評為「用更少 Token 完成更難任務」，包含 GitHub Copilot 等重度代理場景、跨程式碼庫重構、長時間自主編碼與長篇故事生成等使用情境。

目前，模型已在 Anthropic 各管道上線，包括App、API 與三大雲平台，開發者已可使用「claude-opus-4-5-20251101」。

值得注意的是，API定價從前代大幅下修至每百萬輸入代幣 5 美元（約新台幣 160 元）、每百萬輸出代幣 25 美元（約新台幣785元），相較 Claude Opus 4.1 的 15 美元與 75 美元降幅約三分之二，使先進AI能力更具可及性。

除了模型本身，Anthropic 同步更新 Claude Developer Platform、Claude Code 與消費端 App，強調更長時程代理、跨 Excel、Chrome 與桌面環境的整合，以及聊天在長對話中的自動摘要銜接，減少斷點。

「Effort參數」是什麼？

Opus 4.5 的核心變化之一是效率與控制。Anthropic引入「Effort參數」，允許開發者在「速度與成本」與「能力最大化」之間調整，搭配「Context Compaction（情境壓縮）」與「Advanced Tool Use（進階工具使用）」等平台能力，使長任務更穩定、探查更少、推理更精煉。

官方數據顯示， 在中等 Effort 下，Opus 4.5 可用顯著更少的輸出 Token 達到與 Sonnet 4.5 相近或更好的分數；在最高 Effort 下，仍能以更少 Token 超越 Sonnet 4.5。

平台也強化「Context Management（情境管理）」與「Memory Capabilities（記憶能力）」，並支持多子代理協作，讓複雜多階段任務更可控、可組合。

在產品面上，Claude Code 的 Plan Mode 更精準，會先提出澄清問題並建立可編輯的 plan.md，再執行；同時提供桌面版以並行多個本地/遠端 Session。

消費端則開放 Claude for Chrome 給 Max 用戶，並擴大 Claude for Excel 的測試名單至 Max、Team、Enterprise。而在資費與配額方面，Opus 4.5 取消專屬上限（原本有配額限制），力求可作為日常主力。

Opus 4.5進化！代理、長文能力都更強

Anthropic在系統卡中稱 Opus 4.5 是其迄今「對齊（Alignment）」最穩健的模型，並強化對「提示注入（Prompt Injection）」的抵抗力。公司表示在與第三方強攻擊集的評測中，Opus 4.5 比其他前沿模型更不易被駭客欺騙，對企業關注的安全使用情境是一項關鍵提升。

官方亦強調 Opus 4.5 的代理能力。指出在其中一個測試情境中，模型必須扮演航空公司服務代理，協助一位焦慮的客戶。該基準（τ2-bench）預期模型會拒絕修改基本經濟艙預訂，因為航空公司不允許更改該艙等的機票。然而，Opus 4.5 找到了一個富有洞察力（且合法）的方法來解決問題：先升級艙等，然後再修改航班。

至於在典型業務場景的具體改善，則如下：

Excel 自動化：讀取多表、交叉引用、生成樞紐與圖表，對錯誤資料有更好的容錯與修正建議；財務模型可維持單位、期間與假設一致。
金融建模：現金流、比率分析、情境測試與敏感度分析更可靠；能追蹤假設來源並對不一致的前提提出更正。
企業級多步任務：跨文件檢索→工具呼叫→彙整→產出決策稿的長流程更少卡住；在長達 30 分鐘的自主編碼與流程協調裡，失誤率下降、步驟更精簡。

官方也強調，Opus 4.5 在長內容生成的穩定性更強力。例如10～15 頁章節，在段落結構、角色與設定的一致性更好；能維持主線邏輯與前後呼應，不易出現前後矛盾。而若生成事實型長文，Opus 4.5 可在長上下文中持續引用同一套資料與定義，較少遺忘或自相矛盾。

總體而言，Opus 4.5 不僅是能力提升，更是讓開發者能以可調節的成本/能力曲線構建更長、更可靠的代理系統。

延伸閱讀：哪一款AI最可靠？研究揭Claude家族最老實：為何對LLM來說，坦承無知比「已讀亂回」更難？

資料來源：Anthropic、venturebeat

本文初稿為AI編撰，整理．編輯/ 李先泰

其他人也在看

COP30現場》產業減碳卡關？不只要積極開發綠電，更要落實節能！5年減少15％碳排，AI是最好的淨零解方？

COP30台灣》聯合國氣候變化綱要公約第三十屆締約方大會（COP30）11月10日至21日在巴西貝倫展開，而台灣氣候聯盟今年第五度前進大會，以【數位賦能三部曲：共同・共創・共好（Digital Empowerment Trilogy: Together, Create, Prosper）】為題，在藍區（官方談判區）主辦三場論壇，盼讓世界看見台灣科技業的淨零決心。

今周刊・ 1 天前

福島食品輸入台灣全面解禁，27萬批次輻射查驗不合格率0！311後柏崎刈羽核電廠重啟，同步引發關注

衛福部食藥署先前預告草案，日本福島5縣食品最快在今年底解禁、回歸正常管理措施。在60天預告期滿後，食藥署周五(11/21)公告，即起日本食品回歸常態管理措施。食藥署說明，在確保國人食品安全，並依科學證據原則，接軌國際考量下，研議日本食品回歸源頭管理與邊境管制。預告期間未接獲反對意見，因此調整為與其他國家食品管理一致，以風險分級為基礎的抽驗機制把關。食藥署也重申，目前全世界對日本食品採取特定管制措施國家，僅剩中國(含港澳)、俄羅斯及韓國。

今周刊・ 1 天前

不要管競爭對手在做什麼，他們又不給你錢

很多時候，我們常被周遭的聲音淹沒。這些聲音可能來自市場動態、競爭對手：A大幅降價，明明成本持續上漲，「看起來」打算來場割喉戰。B推出新產品，還大撒行銷預算，找了許多網紅業配，市場聲量「好像」衝高了。C與D結盟了，他們聯合渠道換粉，短期「似乎」成效不錯。這是領導者的日常，業績會議時常會聽到這類回報；大...

商業周刊・ 17 小時前

博士生等級的AI助理來了！Google Gemini 3 Pro 四大功能一次看

如果說之前的AI競賽是在拚誰答得更快，Gemini 3 Pro要比的就是誰思考得更深。以下是新模型的四大核心亮點：1. 數據霸榜：正面擊敗 GPT-5.1根據Google DeepMind公布的技術報告，Gemini 3 Pro在多項關鍵基準測試中擊敗了目前的頂級對手：LMArena Leaderb...

商業周刊・ 17 小時前

新壽T17、T18重返市府手中，吳東亮：盼全民給予肯定！整併啟動，台新投信、新光投信衝市場第9大

台新新光金控整併進程再邁重要一步，台新新光金控董事長吳東亮週一（11/24）表示，旗下事業整合陸續依進度推進，「今天由台新投信與新光投信打頭陣，率先完成合併」，象徵台新新光金控正式進入多引擎發展的新階段。另外，北市府上午11點半與新壽完成T17、T18解約，並正式塗銷地上權，土地已回到北市府，吳東亮說此案能結束，除感謝北市府、市長給予肯定，他還是要替新壽講幾句話。「新壽已成立60年，一直和民眾站在一起想讓台灣更發展，也拜託台灣民眾給新壽董監事及員工，以及新壽董事長魏寶生一個最大肯定，齊心把輝達留下來，也期許北市府跟輝達談判順利，讓輝達真正留在台灣、越快越好」。

今周刊・ 21 小時前

影／女學生吃火鍋「乾燒鍋子」，店家要求洗焦黑鍋底20分鐘...怒控手洗到破皮，律師：1前提恐變強制罪

桃園龍潭發生一起火鍋餐廳糾紛事件，引發社會廣泛討論。事件主角是兩名女高中生，11月21日在一家火烤兩吃的火鍋店用餐後，因讓鍋子乾燒至焦黑，店家要求她們自行清洗鍋底，否則不准離開，導致雙方發生爭議。這起事件不僅涉及餐廳設備使用責任問題，也牽涉到消費者權益與業者權利的界限，律師、消保官也做出回應。

今周刊・ 1 天前

善終規劃的3個準備：律師賴芳玉教你安排錢、照護、醫療　好好老更重要

身為台灣最知名的家事律師，看多了人生悲歡離合，賴芳玉卻不鼓勵急著寫遺囑。賴芳玉認為善終準備的起點，不是先立遺囑，而是自問「想怎麼好好老」。

天下雜誌・ 17 小時前

願意讓ChatGPT為你心理治療嗎？OpenAI挨告掀安全疑雲

OpenAI近期遭多起訴訟，指控ChatGPT在敏感對話中誤導用戶，甚至與自殺事件相關，再度引發AI介入精神健康的安全疑慮。然而，在全球心理治療資源短缺下，醫界指出，AI若能確保安全，仍可能成為低成本、可大規模部署的輔助工具。相關研究已證實，部分AI聊天機器人能有效減輕憂鬱與焦慮，但如何兼顧自然對話

遠見雜誌・ 13 小時前

千問恐慌！阿里巴巴的AI野心如何撼動矽谷

最近矽谷吹起了「千問恐慌」（Qwen Panic）。中國阿里巴巴推出的AI語言模型——Qwen系列／千問App，據傳性能可與ChatGPT匹敵，使得矽谷漸漸有些坐立難安。大語言模型：應用和成本之戰過去一年，阿里巴巴不僅推出了Qwen大型語言模型系列，還發布了一款與ChatGPT直接競爭的消費級Ap...

商業周刊・ 1 天前

AI職缺當紅炸子雞：前端部屬工程師FDE是什麼？需求暴增800%，比AI科學家還搶手！

在 AI 技術飛速前進的同時，企業更頭痛的是：如何把模型真正跑進業務場景並變現？現在，愈來愈多AI公司把重心放在「前線部屬工程師」身上。

數位時代・ 9 小時前

「日本馬上沒有大熊貓了！」解碼北京如何用心理戰逼日本首相低頭

高市早苗一場答詢，竟引爆中國罕見的外交反擊？從熊貓回家、水產禁令到旅遊降溫，北京這套「非軍事組合拳」看似針對日本，實則是瞄準全球大國地位的終極測試。美國態度曖昧、日本發生內訌，地緣政治裡面的水之深、之渾、之險，遠超出你的想像。「日本，馬上要沒有大熊貓了」「資生堂股價大跌」「中國事實上停止日本水產品進

遠見雜誌・ 1 天前

富邦金法說／獲利亮眼明年配息有4.25元？韓蔚廷：股利政策「以現金為主」不變！如何看台股後市？

富邦金(2881)週一舉行法人說明會，前9月稅後淨利909.1億元，每股盈餘（EPS）6.23元，稅後淨利、每股盈餘穩居金控業之冠。談到外界關心的股利政策，能否配出4.25元？富邦金總經理韓蔚廷表示：「仍以現金股利為主並無改變」，並說明目前正進入年度預算編製，將同時考量整體業務發展與股東期待，「預計於明年第一季提供較為明確的說明」。