AI之戰白熱化!Anthropic推出Claude Opus 4.5:程式、代理、電腦操作,性能碾壓Gemini 3 Pro?
重點一:Anthropic 推出 Claude Opus 4.5,宣稱為目前最強,在程式、代理與電腦操作領先。
重點二:模型新增可調整的「effort參數」,趕時間就選低 effort,追求最強效能就選高 effort。讓開發者能用更少資源,跑更長、更複雜的流程,還能依需求調整「思考力」與「成本」。
重點三:Claude Opus 4.5的輸入/輸出代幣降價約三分之二。
Anthropic 宣布推出新一代大型模型 Claude Opus 4.5,定位為其最旗艦版本,並表示在「程式開發、代理(agentic workflows)與電腦使用」方面具備領先能力。
官方指出,Opus 4.5 在多項真實世界工程測試表現出色,包含 SWE-bench 類型的評測,且在多語言與長程推理上有明顯進步。
實務面上,Opus 4.5 在多家早期客戶測試中被評為「用更少 Token 完成更難任務」,包含 GitHub Copilot 等重度代理場景、跨程式碼庫重構、長時間自主編碼與長篇故事生成等使用情境。
目前,模型已在 Anthropic 各管道上線,包括App、API 與三大雲平台,開發者已可使用「claude-opus-4-5-20251101」。
值得注意的是,API定價從前代大幅下修至每百萬輸入代幣 5 美元(約新台幣 160 元)、每百萬輸出代幣 25 美元(約新台幣785元),相較 Claude Opus 4.1 的 15 美元與 75 美元降幅約三分之二,使先進AI能力更具可及性。
除了模型本身,Anthropic 同步更新 Claude Developer Platform、Claude Code 與消費端 App,強調更長時程代理、跨 Excel、Chrome 與桌面環境的整合,以及聊天在長對話中的自動摘要銜接,減少斷點。
「Effort參數」是什麼?
Opus 4.5 的核心變化之一是效率與控制。Anthropic引入「Effort參數」,允許開發者在「速度與成本」與「能力最大化」之間調整,搭配「Context Compaction(情境壓縮)」與「Advanced Tool Use(進階工具使用)」等平台能力,使長任務更穩定、探查更少、推理更精煉。
官方數據顯示, 在中等 Effort 下,Opus 4.5 可用顯著更少的輸出 Token 達到與 Sonnet 4.5 相近或更好的分數;在最高 Effort 下,仍能以更少 Token 超越 Sonnet 4.5。
平台也強化「Context Management(情境管理)」與「Memory Capabilities(記憶能力)」,並支持多子代理協作,讓複雜多階段任務更可控、可組合。
在產品面上,Claude Code 的 Plan Mode 更精準,會先提出澄清問題並建立可編輯的 plan.md,再執行;同時提供桌面版以並行多個本地/遠端 Session。
消費端則開放 Claude for Chrome 給 Max 用戶,並擴大 Claude for Excel 的測試名單至 Max、Team、Enterprise。而在資費與配額方面,Opus 4.5 取消專屬上限(原本有配額限制),力求可作為日常主力。
Opus 4.5進化!代理、長文能力都更強
Anthropic在系統卡中稱 Opus 4.5 是其迄今「對齊(Alignment)」最穩健的模型,並強化對「提示注入(Prompt Injection)」的抵抗力。公司表示在與第三方強攻擊集的評測中,Opus 4.5 比其他前沿模型更不易被駭客欺騙,對企業關注的安全使用情境是一項關鍵提升。
官方亦強調 Opus 4.5 的代理能力。指出在其中一個測試情境中,模型必須扮演航空公司服務代理,協助一位焦慮的客戶。該基準(τ2-bench)預期模型會拒絕修改基本經濟艙預訂,因為航空公司不允許更改該艙等的機票。然而,Opus 4.5 找到了一個富有洞察力(且合法)的方法來解決問題:先升級艙等,然後再修改航班。
至於在典型業務場景的具體改善,則如下:
Excel 自動化:讀取多表、交叉引用、生成樞紐與圖表,對錯誤資料有更好的容錯與修正建議;財務模型可維持單位、期間與假設一致。
金融建模:現金流、比率分析、情境測試與敏感度分析更可靠;能追蹤假設來源並對不一致的前提提出更正。
企業級多步任務:跨文件檢索→工具呼叫→彙整→產出決策稿的長流程更少卡住;在長達 30 分鐘的自主編碼與流程協調裡,失誤率下降、步驟更精簡。
官方也強調,Opus 4.5 在長內容生成的穩定性更強力。例如10~15 頁章節,在段落結構、角色與設定的一致性更好;能維持主線邏輯與前後呼應,不易出現前後矛盾。而若生成事實型長文,Opus 4.5 可在長上下文中持續引用同一套資料與定義,較少遺忘或自相矛盾。
總體而言,Opus 4.5 不僅是能力提升,更是讓開發者能以可調節的成本/能力曲線構建更長、更可靠的代理系統。
延伸閱讀:哪一款AI最可靠?研究揭Claude家族最老實:為何對LLM來說,坦承無知比「已讀亂回」更難?
資料來源:Anthropic、venturebeat
本文初稿為AI編撰,整理.編輯/ 李先泰
更多報導
零售搞AI,除了AI客服還能幹嘛?Target除了讓機器讀懂什麼是「可愛」,還實際應用在3大層面
新新併第一彈!台新投信正式整併新光投信,如何靠3大策略取得「兆元俱樂部」門票?
其他人也在看

COP30現場》產業減碳卡關?不只要積極開發綠電,更要落實節能!5年減少15%碳排,AI是最好的淨零解方?
COP30台灣》聯合國氣候變化綱要公約第三十屆締約方大會(COP30)11月10日至21日在巴西貝倫展開,而台灣氣候聯盟今年第五度前進大會,以【數位賦能三部曲:共同・共創・共好(Digital Empowerment Trilogy: Together, Create, Prosper)】為題,在藍區(官方談判區)主辦三場論壇,盼讓世界看見台灣科技業的淨零決心。
今周刊 ・ 1 天前
福島食品輸入台灣全面解禁,27萬批次輻射查驗不合格率0!311後柏崎刈羽核電廠重啟,同步引發關注
衛福部食藥署先前預告草案,日本福島5縣食品最快在今年底解禁、回歸正常管理措施。在60天預告期滿後,食藥署周五(11/21)公告,即起日本食品回歸常態管理措施。 食藥署說明,在確保國人食品安全,並依科學證據原則,接軌國際考量下,研議日本食品回歸源頭管理與邊境管制。預告期間未接獲反對意見,因此調整為與其他國家食品管理一致,以風險分級為基礎的抽驗機制把關。 食藥署也重申,目前全世界對日本食品採取特定管制措施國家,僅剩中國(含港澳)、俄羅斯及韓國。
今周刊 ・ 1 天前
不要管競爭對手在做什麼,他們又不給你錢
很多時候,我們常被周遭的聲音淹沒。這些聲音可能來自市場動態、競爭對手:A大幅降價,明明成本持續上漲,「看起來」打算來場割喉戰。B推出新產品,還大撒行銷預算,找了許多網紅業配,市場聲量「好像」衝高了。C與D結盟了,他們聯合渠道換粉,短期「似乎」成效不錯。這是領導者的日常,業績會議時常會聽到這類回報;大...
商業周刊 ・ 17 小時前
博士生等級的AI助理來了!Google Gemini 3 Pro 四大功能一次看
如果說之前的AI競賽是在拚誰答得更快,Gemini 3 Pro要比的就是誰思考得更深。以下是新模型的四大核心亮點:1. 數據霸榜:正面擊敗 GPT-5.1根據Google DeepMind公布的技術報告,Gemini 3 Pro在多項關鍵基準測試中擊敗了目前的頂級對手:LMArena Leaderb...
商業周刊 ・ 17 小時前
新壽T17、T18重返市府手中,吳東亮:盼全民給予肯定!整併啟動,台新投信、新光投信衝市場第9大
台新新光金控整併進程再邁重要一步,台新新光金控董事長吳東亮週一(11/24)表示,旗下事業整合陸續依進度推進,「今天由台新投信與新光投信打頭陣,率先完成合併」,象徵台新新光金控正式進入多引擎發展的新階段。 另外,北市府上午11點半與新壽完成T17、T18解約,並正式塗銷地上權,土地已回到北市府,吳東亮說此案能結束,除感謝北市府、市長給予肯定,他還是要替新壽講幾句話。 「新壽已成立60年,一直和民眾站在一起想讓台灣更發展,也拜託台灣民眾給新壽董監事及員工,以及新壽董事長魏寶生一個最大肯定,齊心把輝達留下來,也期許北市府跟輝達談判順利,讓輝達真正留在台灣、越快越好」。
今周刊 ・ 21 小時前
影/女學生吃火鍋「乾燒鍋子」,店家要求洗焦黑鍋底20分鐘...怒控手洗到破皮,律師:1前提恐變強制罪
桃園龍潭發生一起火鍋餐廳糾紛事件,引發社會廣泛討論。事件主角是兩名女高中生,11月21日在一家火烤兩吃的火鍋店用餐後,因讓鍋子乾燒至焦黑,店家要求她們自行清洗鍋底,否則不准離開,導致雙方發生爭議。 這起事件不僅涉及餐廳設備使用責任問題,也牽涉到消費者權益與業者權利的界限,律師、消保官也做出回應。
今周刊 ・ 1 天前
善終規劃的3個準備:律師賴芳玉教你安排錢、照護、醫療 好好老更重要
身為台灣最知名的家事律師,看多了人生悲歡離合,賴芳玉卻不鼓勵急著寫遺囑。賴芳玉認為善終準備的起點,不是先立遺囑,而是自問「想怎麼好好老」。
天下雜誌 ・ 17 小時前
願意讓ChatGPT為你心理治療嗎?OpenAI挨告掀安全疑雲
OpenAI近期遭多起訴訟,指控ChatGPT在敏感對話中誤導用戶,甚至與自殺事件相關,再度引發AI介入精神健康的安全疑慮。然而,在全球心理治療資源短缺下,醫界指出,AI若能確保安全,仍可能成為低成本、可大規模部署的輔助工具。相關研究已證實,部分AI聊天機器人能有效減輕憂鬱與焦慮,但如何兼顧自然對話
遠見雜誌 ・ 13 小時前
千問恐慌!阿里巴巴的AI野心如何撼動矽谷
最近矽谷吹起了「千問恐慌」(Qwen Panic)。 中國阿里巴巴推出的AI語言模型——Qwen系列/千問App,據傳性能可與ChatGPT匹敵,使得矽谷漸漸有些坐立難安。大語言模型:應用和成本之戰過去一年,阿里巴巴不僅推出了Qwen大型語言模型系列,還發布了一款與ChatGPT直接競爭的消費級Ap...
商業周刊 ・ 1 天前
AI職缺當紅炸子雞:前端部屬工程師FDE是什麼?需求暴增800%,比AI科學家還搶手!
在 AI 技術飛速前進的同時,企業更頭痛的是:如何把模型真正跑進業務場景並變現?現在,愈來愈多AI公司把重心放在「前線部屬工程師」身上。
數位時代 ・ 9 小時前
「日本馬上沒有大熊貓了!」解碼北京如何用心理戰逼日本首相低頭
高市早苗一場答詢,竟引爆中國罕見的外交反擊?從熊貓回家、水產禁令到旅遊降溫,北京這套「非軍事組合拳」看似針對日本,實則是瞄準全球大國地位的終極測試。美國態度曖昧、日本發生內訌,地緣政治裡面的水之深、之渾、之險,遠超出你的想像。「日本,馬上要沒有大熊貓了」「資生堂股價大跌」「中國事實上停止日本水產品進
遠見雜誌 ・ 1 天前
富邦金法說/獲利亮眼明年配息有4.25元?韓蔚廷:股利政策「以現金為主」不變!如何看台股後市?
富邦金(2881)週一舉行法人說明會,前9月稅後淨利909.1億元,每股盈餘(EPS)6.23元,稅後淨利、每股盈餘穩居金控業之冠。 談到外界關心的股利政策,能否配出4.25元?富邦金總經理韓蔚廷表示:「仍以現金股利為主並無改變」,並說明目前正進入年度預算編製,將同時考量整體業務發展與股東期待,「預計於明年第一季提供較為明確的說明」。
今周刊 ・ 12 小時前
Gemini 3 Pro提示詞怎麼下?拆解Google官方教學:從4個實用prompt,掌握黃金技巧
Gemini 3 Pro Image登場!其「思考模式」可生成資訊圖表、標誌、菜單與行銷素材,問題是,Prompt要怎麼下?
數位時代 ・ 1 天前
影/吳怡農稱輝達落腳台北不能算政績 李四川反問:不是嗎?
輝達落腳北士科T17、T18,北市府與新壽已簽解約協議書、土地也已還北市府。不過有意參選台北市長、壯闊台灣理事長吳怡農表...
聯合新聞網 ・ 1 天前

影/ 陸十五五啟動太空探源計畫 將發射衛星尋找「第二顆地球」
大陸中國科學院國家空間科學中心24日在空間科學先導專項最新亮點成果發布會上宣布,「十五五」期間將組織實施太空探源科學衛星計畫,發射4顆衛星探索宇宙起源、空間天氣起源、生命起源等重大前沿問題,力爭在宇宙黑暗時代、太陽磁活動週、系外類地行星探測等領域實現新突破。
中天新聞網 ・ 16 小時前
「錯過研發導入期,就沒有機會了!」憑一台醫療AI伺服器,華碩孫公司搶下科技大廠吃不到的訂單
醫揚科技不只做嵌入式醫療電腦,更在近年AI爆發之際,開發出「醫療安規的AI伺服器」,成功切入連商用伺服器大廠也難以跨足的藍海。
數位時代 ・ 1 天前
NABE預測:明年美國經濟成長小幅上揚 關稅是最大下行風險
美國商業經濟學家協會 (NABE) 的年終預測調查顯示,美國經濟明年預計將溫和成長,但就業增幅依然緩慢,且聯準會將放緩進一步降息的腳步。
鉅亨網 ・ 1 天前