優寶購物《ubao.Tw》特貨品商城,黑貓宅配,取貨付款,AI之戰白熱化!Anthropic推出Claude Opus 4.5:程式、代理、電腦操作,性能碾壓Gemini 3 Pro?
數位時代

AI之戰白熱化!Anthropic推出Claude Opus 4.5:程式、代理、電腦操作,性能碾壓Gemini 3 Pro?

數位時代

重點一:Anthropic 推出 Claude Opus 4.5,宣稱為目前最強,在程式、代理與電腦操作領先。

重點二:模型新增可調整的「effort參數」,趕時間就選低 effort,追求最強效能就選高 effort。讓開發者能用更少資源,跑更長、更複雜的流程,還能依需求調整「思考力」與「成本」。

重點三:Claude Opus 4.5的輸入/輸出代幣降價約三分之二。

Anthropic 宣布推出新一代大型模型 Claude Opus 4.5,定位為其最旗艦版本,並表示在「程式開發、代理(agentic workflows)與電腦使用」方面具備領先能力。

廣告

官方指出,Opus 4.5 在多項真實世界工程測試表現出色,包含 SWE-bench 類型的評測,且在多語言與長程推理上有明顯進步。

實務面上,Opus 4.5 在多家早期客戶測試中被評為「用更少 Token 完成更難任務」,包含 GitHub Copilot 等重度代理場景、跨程式碼庫重構、長時間自主編碼與長篇故事生成等使用情境。

Claude Opus 4.5 的軟體工程能力 圖/Anthropic
Claude Opus 4.5 的軟體工程能力 圖/Anthropic

目前,模型已在 Anthropic 各管道上線,包括App、API 與三大雲平台,開發者已可使用「claude-opus-4-5-20251101」。

值得注意的是,API定價從前代大幅下修至每百萬輸入代幣 5 美元(約新台幣 160 元)、每百萬輸出代幣 25 美元(約新台幣785元),相較 Claude Opus 4.1 的 15 美元與 75 美元降幅約三分之二,使先進AI能力更具可及性。

除了模型本身,Anthropic 同步更新 Claude Developer Platform、Claude Code 與消費端 App,強調更長時程代理、跨 Excel、Chrome 與桌面環境的整合,以及聊天在長對話中的自動摘要銜接,減少斷點。

「Effort參數」是什麼?

Opus 4.5 的核心變化之一是效率與控制。Anthropic引入「Effort參數」,允許開發者在「速度與成本」與「能力最大化」之間調整,搭配「Context Compaction(情境壓縮)」與「Advanced Tool Use(進階工具使用)」等平台能力,使長任務更穩定、探查更少、推理更精煉。

官方數據顯示, 在中等 Effort 下,Opus 4.5 可用顯著更少的輸出 Token 達到與 Sonnet 4.5 相近或更好的分數;在最高 Effort 下,仍能以更少 Token 超越 Sonnet 4.5。

平台也強化「Context Management(情境管理)」與「Memory Capabilities(記憶能力)」,並支持多子代理協作,讓複雜多階段任務更可控、可組合。

在產品面上,Claude Code 的 Plan Mode 更精準,會先提出澄清問題並建立可編輯的 plan.md,再執行;同時提供桌面版以並行多個本地/遠端 Session。

消費端則開放 Claude for Chrome 給 Max 用戶,並擴大 Claude for Excel 的測試名單至 Max、Team、Enterprise。而在資費與配額方面,Opus 4.5 取消專屬上限(原本有配額限制),力求可作為日常主力。

Opus 4.5進化!代理、長文能力都更強

Anthropic在系統卡中稱 Opus 4.5 是其迄今「對齊(Alignment)」最穩健的模型,並強化對「提示注入(Prompt Injection)」的抵抗力。公司表示在與第三方強攻擊集的評測中,Opus 4.5 比其他前沿模型更不易被駭客欺騙,對企業關注的安全使用情境是一項關鍵提升。

官方亦強調 Opus 4.5 的代理能力。指出在其中一個測試情境中,模型必須扮演航空公司服務代理,協助一位焦慮的客戶。該基準(τ2-bench)預期模型會拒絕修改基本經濟艙預訂,因為航空公司不允許更改該艙等的機票。然而,Opus 4.5 找到了一個富有洞察力(且合法)的方法來解決問題:先升級艙等,然後再修改航班。

Claude Opus 4.5 的各項能力值 圖/Anthropic
Claude Opus 4.5 的各項能力值 圖/Anthropic

至於在典型業務場景的具體改善,則如下:

  • Excel 自動化:讀取多表、交叉引用、生成樞紐與圖表,對錯誤資料有更好的容錯與修正建議;財務模型可維持單位、期間與假設一致。

  • 金融建模:現金流、比率分析、情境測試與敏感度分析更可靠;能追蹤假設來源並對不一致的前提提出更正。

  • 企業級多步任務:跨文件檢索→工具呼叫→彙整→產出決策稿的長流程更少卡住;在長達 30 分鐘的自主編碼與流程協調裡,失誤率下降、步驟更精簡。

官方也強調,Opus 4.5 在長內容生成的穩定性更強力。例如10~15 頁章節,在段落結構、角色與設定的一致性更好;能維持主線邏輯與前後呼應,不易出現前後矛盾。而若生成事實型長文,Opus 4.5 可在長上下文中持續引用同一套資料與定義,較少遺忘或自相矛盾。

總體而言,Opus 4.5 不僅是能力提升,更是讓開發者能以可調節的成本/能力曲線構建更長、更可靠的代理系統。

延伸閱讀:哪一款AI最可靠?研究揭Claude家族最老實:為何對LLM來說,坦承無知比「已讀亂回」更難?

資料來源:Anthropicventurebeat

本文初稿為AI編撰,整理.編輯/ 李先泰

更多報導
零售搞AI,除了AI客服還能幹嘛?Target除了讓機器讀懂什麼是「可愛」,還實際應用在3大層面
新新併第一彈!台新投信正式整併新光投信,如何靠3大策略取得「兆元俱樂部」門票?

其他人也在看

COP30現場》產業減碳卡關?不只要積極開發綠電,更要落實節能!5年減少15%碳排,AI是最好的淨零解方?

COP30現場》產業減碳卡關?不只要積極開發綠電,更要落實節能!5年減少15%碳排,AI是最好的淨零解方?

COP30台灣》聯合國氣候變化綱要公約第三十屆締約方大會(COP30)11月10日至21日在巴西貝倫展開,而台灣氣候聯盟今年第五度前進大會,以【數位賦能三部曲:共同・共創・共好(Digital Empowerment Trilogy: Together, Create, Prosper)】為題,在藍區(官方談判區)主辦三場論壇,盼讓世界看見台灣科技業的淨零決心。

今周刊 ・ 1 天前
福島食品輸入台灣全面解禁,27萬批次輻射查驗不合格率0!311後柏崎刈羽核電廠重啟,同步引發關注

福島食品輸入台灣全面解禁,27萬批次輻射查驗不合格率0!311後柏崎刈羽核電廠重啟,同步引發關注

衛福部食藥署先前預告草案,日本福島5縣食品最快在今年底解禁、回歸正常管理措施。在60天預告期滿後,食藥署周五(11/21)公告,即起日本食品回歸常態管理措施。 食藥署說明,在確保國人食品安全,並依科學證據原則,接軌國際考量下,研議日本食品回歸源頭管理與邊境管制。預告期間未接獲反對意見,因此調整為與其他國家食品管理一致,以風險分級為基礎的抽驗機制把關。 食藥署也重申,目前全世界對日本食品採取特定管制措施國家,僅剩中國(含港澳)、俄羅斯及韓國。

今周刊 ・ 1 天前
不要管競爭對手在做什麼,他們又不給你錢

不要管競爭對手在做什麼,他們又不給你錢

很多時候,我們常被周遭的聲音淹沒。這些聲音可能來自市場動態、競爭對手:A大幅降價,明明成本持續上漲,「看起來」打算來場割喉戰。B推出新產品,還大撒行銷預算,找了許多網紅業配,市場聲量「好像」衝高了。C與D結盟了,他們聯合渠道換粉,短期「似乎」成效不錯。這是領導者的日常,業績會議時常會聽到這類回報;大...

商業周刊 ・ 17 小時前
博士生等級的AI助理來了!Google Gemini 3 Pro 四大功能一次看

博士生等級的AI助理來了!Google Gemini 3 Pro 四大功能一次看

如果說之前的AI競賽是在拚誰答得更快,Gemini 3 Pro要比的就是誰思考得更深。以下是新模型的四大核心亮點:1. 數據霸榜:正面擊敗 GPT-5.1根據Google DeepMind公布的技術報告,Gemini 3 Pro在多項關鍵基準測試中擊敗了目前的頂級對手:LMArena Leaderb...

商業周刊 ・ 17 小時前
新壽T17、T18重返市府手中,吳東亮:盼全民給予肯定!整併啟動,台新投信、新光投信衝市場第9大

新壽T17、T18重返市府手中,吳東亮:盼全民給予肯定!整併啟動,台新投信、新光投信衝市場第9大

台新新光金控整併進程再邁重要一步,台新新光金控董事長吳東亮週一(11/24)表示,旗下事業整合陸續依進度推進,「今天由台新投信與新光投信打頭陣,率先完成合併」,象徵台新新光金控正式進入多引擎發展的新階段。 另外,北市府上午11點半與新壽完成T17、T18解約,並正式塗銷地上權,土地已回到北市府,吳東亮說此案能結束,除感謝北市府、市長給予肯定,他還是要替新壽講幾句話。 「新壽已成立60年,一直和民眾站在一起想讓台灣更發展,也拜託台灣民眾給新壽董監事及員工,以及新壽董事長魏寶生一個最大肯定,齊心把輝達留下來,也期許北市府跟輝達談判順利,讓輝達真正留在台灣、越快越好」。

今周刊 ・ 21 小時前
影/女學生吃火鍋「乾燒鍋子」,店家要求洗焦黑鍋底20分鐘...怒控手洗到破皮,律師:1前提恐變強制罪

影/女學生吃火鍋「乾燒鍋子」,店家要求洗焦黑鍋底20分鐘...怒控手洗到破皮,律師:1前提恐變強制罪

桃園龍潭發生一起火鍋餐廳糾紛事件,引發社會廣泛討論。事件主角是兩名女高中生,11月21日在一家火烤兩吃的火鍋店用餐後,因讓鍋子乾燒至焦黑,店家要求她們自行清洗鍋底,否則不准離開,導致雙方發生爭議。 這起事件不僅涉及餐廳設備使用責任問題,也牽涉到消費者權益與業者權利的界限,律師、消保官也做出回應。

今周刊 ・ 1 天前
善終規劃的3個準備:律師賴芳玉教你安排錢、照護、醫療 好好老更重要

善終規劃的3個準備:律師賴芳玉教你安排錢、照護、醫療 好好老更重要

身為台灣最知名的家事律師,看多了人生悲歡離合,賴芳玉卻不鼓勵急著寫遺囑。賴芳玉認為善終準備的起點,不是先立遺囑,而是自問「想怎麼好好老」。

天下雜誌 ・ 17 小時前
願意讓ChatGPT為你心理治療嗎?OpenAI挨告掀安全疑雲

願意讓ChatGPT為你心理治療嗎?OpenAI挨告掀安全疑雲

OpenAI近期遭多起訴訟,指控ChatGPT在敏感對話中誤導用戶,甚至與自殺事件相關,再度引發AI介入精神健康的安全疑慮。然而,在全球心理治療資源短缺下,醫界指出,AI若能確保安全,仍可能成為低成本、可大規模部署的輔助工具。相關研究已證實,部分AI聊天機器人能有效減輕憂鬱與焦慮,但如何兼顧自然對話

遠見雜誌 ・ 13 小時前
千問恐慌!阿里巴巴的AI野心如何撼動矽谷

千問恐慌!阿里巴巴的AI野心如何撼動矽谷

最近矽谷吹起了「千問恐慌」(Qwen Panic)。 中國阿里巴巴推出的AI語言模型——Qwen系列/千問App,據傳性能可與ChatGPT匹敵,使得矽谷漸漸有些坐立難安。大語言模型:應用和成本之戰過去一年,阿里巴巴不僅推出了Qwen大型語言模型系列,還發布了一款與ChatGPT直接競爭的消費級Ap...

商業周刊 ・ 1 天前
AI職缺當紅炸子雞:前端部屬工程師FDE是什麼?需求暴增800%,比AI科學家還搶手!

AI職缺當紅炸子雞:前端部屬工程師FDE是什麼?需求暴增800%,比AI科學家還搶手!

在 AI 技術飛速前進的同時,企業更頭痛的是:如何把模型真正跑進業務場景並變現?現在,愈來愈多AI公司把重心放在「前線部屬工程師」身上。

數位時代 ・ 9 小時前
「日本馬上沒有大熊貓了!」解碼北京如何用心理戰逼日本首相低頭

「日本馬上沒有大熊貓了!」解碼北京如何用心理戰逼日本首相低頭

高市早苗一場答詢,竟引爆中國罕見的外交反擊?從熊貓回家、水產禁令到旅遊降溫,北京這套「非軍事組合拳」看似針對日本,實則是瞄準全球大國地位的終極測試。美國態度曖昧、日本發生內訌,地緣政治裡面的水之深、之渾、之險,遠超出你的想像。「日本,馬上要沒有大熊貓了」「資生堂股價大跌」「中國事實上停止日本水產品進

遠見雜誌 ・ 1 天前
富邦金法說/獲利亮眼明年配息有4.25元?韓蔚廷:股利政策「以現金為主」不變!如何看台股後市?

富邦金法說/獲利亮眼明年配息有4.25元?韓蔚廷:股利政策「以現金為主」不變!如何看台股後市?

富邦金(2881)週一舉行法人說明會,前9月稅後淨利909.1億元,每股盈餘(EPS)6.23元,稅後淨利、每股盈餘穩居金控業之冠。 談到外界關心的股利政策,能否配出4.25元?富邦金總經理韓蔚廷表示:「仍以現金股利為主並無改變」,並說明目前正進入年度預算編製,將同時考量整體業務發展與股東期待,「預計於明年第一季提供較為明確的說明」。

今周刊 ・ 12 小時前
Gemini 3 Pro提示詞怎麼下?拆解Google官方教學:從4個實用prompt,掌握黃金技巧

Gemini 3 Pro提示詞怎麼下?拆解Google官方教學:從4個實用prompt,掌握黃金技巧

Gemini 3 Pro Image登場!其「思考模式」可生成資訊圖表、標誌、菜單與行銷素材,問題是,Prompt要怎麼下?

數位時代 ・ 1 天前

聯準會又有官員表態支持降息 台指期夜盤受激勵

台指期夜盤24日開盤後,在美股電子盤震盪中,以26,615點、上漲1點開出,在道瓊電子盤勁揚中,一度上衝至26,686....

聯合新聞網 ・ 1 天前
影/吳怡農稱輝達落腳台北不能算政績 李四川反問:不是嗎?

影/吳怡農稱輝達落腳台北不能算政績 李四川反問:不是嗎?

輝達落腳北士科T17、T18,北市府與新壽已簽解約協議書、土地也已還北市府。不過有意參選台北市長、壯闊台灣理事長吳怡農表...

聯合新聞網 ・ 1 天前

想降鋼鐵關稅 美國:歐盟須修改數位規則

美國商務部長盧特尼克(Howard Lutnick)近日接受媒體訪問時表示,歐盟需改變數位監管規定,才能與美國達成降低鋼鋁關稅的協議。

中時財經即時 ・ 1 天前
台美關稅將開牌 藍要政院說明

台美關稅將開牌 藍要政院說明

記者康子仁∕台北報導 英國《金融時報》日前報導,台美關稅協議預料近期將定案對外公布,…

中華日報 ・ 1 天前
影/ 陸十五五啟動太空探源計畫 將發射衛星尋找「第二顆地球」

影/ 陸十五五啟動太空探源計畫 將發射衛星尋找「第二顆地球」

大陸中國科學院國家空間科學中心24日在空間科學先導專項最新亮點成果發布會上宣布,「十五五」期間將組織實施太空探源科學衛星計畫,發射4顆衛星探索宇宙起源、空間天氣起源、生命起源等重大前沿問題,力爭在宇宙黑暗時代、太陽磁活動週、系外類地行星探測等領域實現新突破。

中天新聞網 ・ 16 小時前
「錯過研發導入期,就沒有機會了!」憑一台醫療AI伺服器,華碩孫公司搶下科技大廠吃不到的訂單

「錯過研發導入期,就沒有機會了!」憑一台醫療AI伺服器,華碩孫公司搶下科技大廠吃不到的訂單

醫揚科技不只做嵌入式醫療電腦,更在近年AI爆發之際,開發出「醫療安規的AI伺服器」,成功切入連商用伺服器大廠也難以跨足的藍海。

數位時代 ・ 1 天前
NABE預測:明年美國經濟成長小幅上揚 關稅是最大下行風險

NABE預測:明年美國經濟成長小幅上揚 關稅是最大下行風險

美國商業經濟學家協會 (NABE) 的年終預測調查顯示,美國經濟明年預計將溫和成長,但就業增幅依然緩慢,且聯準會將放緩進一步降息的腳步。

鉅亨網 ・ 1 天前
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86