深度求索發布DeepSeek-OCR:解密「光學壓縮」的文字速讀機制,為何AI學會遺忘反而省算力?
重點一:DeepSeek OCR 以「光學壓縮」技術處理寫滿文字的圖片,最高壓縮10倍且保留約97%資訊,讓AI可處理更長文件。
重點二:DeepSeek OCR 把文件當成圖片處理,用兩個擅長不同工作的模型分工合作,再用一個「16倍壓縮器」把需要計算的資料量大幅減少。
重點三:DeepSeek OCR 每天可以在單一 Nvidia A100 GPU 上處理超過 20 萬頁資料。如果使用 20 台伺服器,每台伺服器運行 8 塊 A100 處理器,吞吐量將躍升至每天 3,300 萬頁。
中國AI公司Deepseek(深度求索)於10月21日推出DeepSeek-OCR(光學文字辨識)系統,主打將以「影像」呈現的文字文件做高效率壓縮後再交由語言模型處理。其技術上核心訴求是:處理「影像中的文字」比直接處理「數位文字」更省算力。
而在應用上,這套系統的核心賣點也很簡單: 用更少的「視覺符號」(內部的影像單位)就能把文件讀懂,並輸出成可編輯的文字或結構化內容,包含表格、公式與圖表。
OCR讀起字來多有效率?DeepSeek技術報告指出,在維持約97%資訊的前提下,文字脈絡可被壓縮至最多10倍,從而延長LLM可承載的上下文長度,減少記憶體與推論成本。
系統也可將「對話歷史影像化並壓縮」,將較舊的聊天內容以低解析度保存,類似人類「漸漸遺忘」的機制:資料越久、越遠、越低解析,就越模糊。
記憶刻度 :時間從「剛發生」到「1年」,清晰度由「Crystal Clear」逐步變成「Almost Gone」,描述人類記憶隨時間自然衰退。
視覺刻度:距離從 10 cm 到 20 m,越遠越不清楚,對應「看得近清楚、遠則模糊」的直覺感受。
文字刻度(解析度):從「Gundam」到「Tiny」等級,解析度越低、需要的「視覺符號」越少,文字呈現也越模糊,象徵以圖片方式壓縮舊文本。
這樣的優勢主要瞄準長文件處理、跨頁表格與圖形理解,以及跨語言(約100種)文件抽取,並在維持原始版面或輸出純文字的彈性間取得平衡。
白話來說,處理更少的符號,意味著更快的處理、更低的成本。對需要大量掃描、歸檔和資料萃取的工作類型,是最直接的效率紅利。
OCR如拼裝車!3步驟把資料「切塊再瘦身」
技術上,OCR如何辦到?DeepSeek‑OCR的做法是:把一頁文件當成「圖片」丟給AI,先切塊、再瘦身,最後才請懂圖又懂字的模型來讀。
第一步,前處理引擎DeepEncoder把版面「劃重點」:段落在哪、表格在哪、圖形在哪,別讓後面的模型浪費力氣在邊角裝飾(這裡用的是臉書母公司Meta的SAM,專門做影像分割)。
第二步是「資訊減肥」。例如原本一張1,024×1,024的頁面,會變成4,096個「視覺單位」(token),先經過壓縮器直接砍到256個,類似把會議逐字稿濃縮成重點條列,將算力和記憶體省下來。
第三步則是「理解」。其利用OpenAI的CLIP,負責把「看到的區塊」對上「語意」,也就是判斷這段到底在說什麼、這張圖在表達什麼。而因為前面已經切塊並瘦身,所以CLIP不用面對整頁的雜訊。
結果,同樣的一頁文件,DeepSeek‑OCR通常只需要64到400個視覺token就能讀懂:一般簡報大約64個、書籍或報告約100個。而若遇到版面複雜的報紙,再打開所謂的「Gundam模式」把配額拉到最多800。對比傳統OCR動輒上千到上萬token,這套路線是「少算力、更多內容」。
進一步來說,DeepSeek‑OCR的輸入模式分成三類,以對應不同「視覺符號」數量,以測試在各種壓縮比例下的表現。
• Tiny|Small:固定尺寸(約 512、640),輸出 64 或 100 個視覺符號。適合字數不多、版面簡單的頁面,用少量符號就能還原內容。
• Base|Large:較大尺寸(約 1024、1280),輸出 256 或 400 符號。以「補邊」保留原始長寬比;有效符號會因黑邊扣除而少於名義值。
• Gundam|Gundam‑Master:動態模式,把頁面切成 n 個局部視野,再加一張全局視野。
一日處理3,300萬頁!OCR資料集與權重全面開放
在實務部署方面,DeepSeek-OCR宣稱以單顆Nvidia A100每日可處理約200,000頁;若以20台伺服器、每台8顆A100組成叢集,日處理量可達3,300萬頁。此吞吐量不僅可支援企業級文件工作流,也有助於為LLM建構海量文字語料。
研究團隊訓練時使用約3,000萬頁PDF(含近百種語言,其中中文與英文約2,500萬頁),並加入1,000萬張合成圖表、500萬份化學式、100萬份幾何圖形以強化多模態文件理解。
更重要的是,官方開放程式碼與模型權重,讓生態系可驗證與擴充此技術;在多語、保版面與純文字輸出之間提供彈性,適合長文件抽取、AI訓練語料建置,以及聊天機器人脈絡的「成本感知式」保存。
整體而言,DeepSeek-OCR以「影像壓縮+少量token」策略,將OCR從單純文字擷取,推進到可支援LLM長脈絡與結構化資料抽取的系統級能力。
英國資深網頁開發者Simon Willison實測指出,DeepSeek‑OCR 可在 NVIDIA Spark(ARM64 + CUDA)的環境中順利跑通,整體印象是:只要花時間選擇合適的「運行方式/提示」,DeepSeek‑OCR本身的模型表現「非常好」,足以在新硬體條件下完成高品質 OCR。
如何使用 DeepSeek OCR ?
一般讀者可用 Hugging Face 下載模型,安裝必要套件後,把圖片丟進範例程式即可做 OCR。其建議簡易流程如下:
事前準備:有一台可用的電腦。若沒有 NVIDIA 顯示卡,也能跑,但會較慢;Hugging Face 頁面示範是用 NVIDIA GPU、CUDA 11.8。
安裝工具:安裝 Python(建議 3.12)與套件管理工具(pip 即可)。
安裝必要套件:torch 2.6.0、transformers 4.46.3、tokenizers 0.20.3、einops、addict、easydict;加速可選擇安裝 flash-attn 2.7.3。
取得模型:從 Hugging Face 載入模型名稱 deepseek-ai/DeepSeek-OCR。
放入圖片:把要辨識文字的圖片檔(如掃描的合約、收據、海報)指定到程式,執行後就會輸出文字或 Markdown。
延伸閱讀:Canva回來了!AWS雲端服務全面修復完成,快打開看Perplexity、Coinbase⋯⋯能不能用?
資料來源:DeepSeek、Decoder、Simon Willison’s Weblog
本文初稿為AI編撰,整理.編輯/ 李先泰
更多報導
創新板可以當沖了!主管機關3大策略,朝「亞洲那斯達克」邁進
矽谷創投界炙手可熱的台灣人:陳恩平是誰?a16z也搶投資!他如何以「VC操刀手」逆轉人生?
其他人也在看

黃立成爆粗口回應陶朱隱園!她喊「這就是難賣原因」:每位講到都搖頭
台北超級豪宅「陶朱隱園」在2018年完工後,終於在10月23日開胡,完成首筆交易紀錄,成交單價每坪接近400萬元,總價12億元,外界瘋傳是藝人黃立成,不過他也以1句話幽默否認。對此,科技專家許美華也指出,自己不覺得麻吉大哥會買不起陶朱隱園,且黃立成的言語中就暗藏陶朱隱園真正難賣的原因。
三立新聞網 setn.com ・ 5 小時前
MLB世界大賽》大谷翔平扛世界大賽首轟也笑不出來 藍鳥打爆道奇投手群搶開門紅
MLB美國職棒大聯盟世界大賽G1,25日在多倫多藍鳥主場Rogers Centre點燃戰火,藍鳥靠著全隊打線狂掃14支安打,包含Addison Barger一錘定音的滿貫彈,儘管大谷翔平扛出生涯在世界大賽首轟也無法改變戰局,終場藍鳥以11比4,搶下開門紅。
Yahoo奇摩運動 ・ 2 小時前
黃立成爆12億買下信義豪宅「陶朱隱園」!霸氣發文回應了
[FTNN新聞網]記者吳雨婕/綜合報導台北信義區豪宅「陶朱隱園」近來傳出17樓一戶連同4個車位以總價12億元售出,買方還是非關係人,據悉,這名神祕買家即是「麻...
FTNN新聞網 ・ 20 小時前
沒性行為也中標!60歲老闆娘染菜花 醫師揭1日常習慣惹禍
俗稱「菜花」的性病疣(又稱性器疣)通常透過性行為傳染。不過,曾有一名60歲的酒店老闆娘卻在舌頭上長出「菜花」,讓她相當錯愕,她明明早已不接客,沒想到竟因一個平常的小動作,讓病毒有機可乘。
三立新聞網 setn.com ・ 1 天前
台大名醫喊「我被騙了!」為救移工孕婦 恐背百萬呆帳
台大婦產科名醫施景中昨晚在臉書發文表示「我被騙了」,透露數週前收治一名罹患嚴重「植入性胎盤」的逃逸移工孕婦,經全力搶救後母子平安,但治療費用高達142萬元,事後竟遭陪同的收容機構拒絕支付,讓他無奈表示自己救了人,卻背上百萬呆帳。今天早上施景中再度發文更新,表示收容機構解釋雖然金額超乎他們想像,但仍會想辦法去償清這筆費用。
中天新聞網 ・ 3 小時前
冷空氣要來了!這天起「低溫探1字頭」 中南部也明顯有感
今(25)日東北季風稍減弱,但水氣仍偏多,基隆北海岸、大臺北、宜蘭地區有陣雨,仍有局部大雨發生的機率,桃竹苗、花東及恆春半島也有短暫陣雨,南部地區及中部山區則有局部短暫陣雨,其他地區為多雲。對此,氣象粉專也示警,這天將會有冷空氣南下,且中南部地區也會明顯有感。
三立新聞網 setn.com ・ 6 小時前
鄭麗文4大副主席出爐!他酸:老人化、化 轟這兩人「聯絡人」
國民主席選舉結果出爐,前立委鄭麗文以壓倒性差距,擊敗前台北市長郝龍斌,成為國民新任主席,後續政壇變化,備受各界討論。當選後鄭麗文動作頻頻,目前已經公布4位副主席,分別是前國民秘書長李乾龍、前黃復興部主委季麟連、馬英九基金會執行長蕭旭岑、國民前大陸事務部主任張榮恭,政治評論員張益贍就評論是「老人化、化」。
三立新聞網 setn.com ・ 8 小時前
台股開市2萬8穩了?謝金河盤點「這類股」飆漲中:可惜台灣受傷太重
在美國聯準會(Fed)降息預期強化、CPI最新數據和緩下,美股24日4大指數全面創下歷史新高,道瓊工業指數更攻上47000點大關,各界關注台股在周一開市後的表現,仍否突破2萬8000點大關。財信傳媒董事長謝金河今(25)日在以「記憶體的大時代」為題在臉書指出,台灣股市24日休市,但當天日本、南韓股市持續上漲,當中有幾個亮點,過去的記憶體上漲都像是一陣風,如今......
風傳媒 ・ 2 小時前
下週又有冷空氣殺到!2地區低溫「跌剩1字頭」中南部也有感
生活中心/周希雯報導台灣近期氣溫大幅下降、明顯變冷,其中北台灣受颱風外圍環流與東北季風共伴效應影響,雨彈不停歇狂炸近1週,遲遲看不到太陽露臉。氣象署指出,今(25)北部、東北部依舊偏涼,降雨機率仍高,尤其基隆北海岸、大臺北及東北部地區,容易有廣泛且持續性降雨,中南部則是白天明顯回暖,白天可達30度以上。不過還沒等到北部放晴,氣象專家就示警,下週將有冷空氣南下,北部及東北部溫度將跌到「1字頭」,而且這波降溫連中南部也有感。
民視 ・ 3 小時前
家寧被罵翻!新片「按讚數比網友留言還少」 上架13hrs慘況曝光
Andy老師近日再度更新影片,爆料家寧創立公關危機群組,聯合網軍展開抹黑計畫,其中還爆出有一位知名男星牽線,讓他跟家寧的糾紛再度牽起網友討論。不過昨(24日)家寧按照往常上傳新片,但內容不是回應Andy老師,而是分享到苗栗旅遊的過程,引來一片網友罵聲,甚至影片按讚數比網友留言還低,整體觀看數慘不忍睹。蔡佩伶報導
三立新聞網 setn.com ・ 2 小時前
棒球素人當上山本由伸翻譯 幸運內褲象徵兩人情誼
(中央社記者林宏翰洛杉磯23日專電)「洛杉磯時報」報導,道奇日籍強投山本由伸的翻譯園田芳大,原非出身棒球界,上任第2天就想辭職,但2年下來,已成為山本重要的工作夥伴,每當山本先發,他必穿上幸運內褲。
中央社 ・ 1 天前
世界大賽/道奇太慘了!史奈爾核爆、牛棚接續砸鍋 藍鳥6下轟9分大逆轉
世界大賽G1道奇派出史奈爾(Blake Snell)掛帥先發,不料6局下史奈爾在沒有人出局下不但留下滿壘危機退場,接連上場的2位後援斯漢(Emmet Sheehan)、班達(Anthony Banda)繼續放火,讓藍鳥單局敲出2支全壘打狂轟9分,6局結束藍鳥領先來到11:2。
三立新聞網 setn.com ・ 3 小時前
下波東北風這天接力!低溫探20度 北部「雨再下1週」濕到崩潰
氣象署指出,明天(24日)東北季風影響,中部以北及東北部天氣稍涼,水氣偏多,基隆北海岸、東北部地區及新竹以北山區有陣雨,並有局部大雨或豪雨發生的機率,桃園以北及東部地區有短暫陣雨,並有局部大雨發生的機率,竹苗、東南部地區及中南部山區有局部短暫陣雨,其他地區...
CTWANT ・ 1 天前
雨快要停了!專家曝「這天有望放晴」 未來一週天氣曝光
受到東北季風影響,北台灣持續呈現偏涼有雨的天氣型態,氣象專家吳聖宇表示,今明兩天(25、26日)北部及東北部仍是陰雨天氣,走到中南部天氣會比較好。但下週一水氣將減少,下週四東北季風減弱,西半部還有可能放晴,要留意的是,下週末東北季風再度增強,北部及東半部又有明顯雨勢。
三立新聞網 setn.com ・ 4 小時前
東北季風報到!北台灣雨下不停 氣象署曝「這時間」放晴
即時中心/廖予瑄、謝宛錚報導中央氣象署在今(24)日下午說明未來一週東北季風對台灣的天氣影響,預報員張承傳指出,受到東北季風影響,今日在迎風面北部及東北部,整天都有斷斷續續的下雨,天氣較濕涼;明(25)日雖然東北季風稍微減弱,但水氣仍偏多,在基隆北海岸、大台北、宜蘭地區下雨時間會較長,且有局部大雨發生的機率;東北季風將在下週四、五(30、31日)明顯減弱,屆時氣溫將逐漸回升,並縮小降雨範圍。
民視 ・ 18 小時前
說好的世代交替?鄭麗文4副主席「平均70歲」還是老藍男 朱立倫:祝福
前立委鄭麗文當選國民主席,但選前喊出世代交替,選後她公布的4名副主席平均年齡卻是70歲,挨酸還是「老藍男」。對此,國民主席朱立倫今(25)日表示,接下來鄭麗文有非常多辛苦的務工作,各方面都是予以祝福。
三立新聞網 setn.com ・ 4 小時前
大完便先別沖!醫師示警「大便超臭恐是警訊」 這8種排便狀況注意了
大便也能看出身體狀況!平時日常生活中除了定期健康檢查之外,其實很多時候身體也會發出警訊,提醒你身體可能出現狀況了,過去醫師江坤俊曾在《健康2.0》節目中分享,如何「從馬桶裡看健康」,提到身體共有4大排毒器官「肝、腎、腸胃道、肺」,因此上大號時可以注意,從「8種排便狀況」檢視腸道健康。
三立新聞網 setn.com ・ 20 小時前
用戶注意了!LINE「4大更新」將上路 少做1動作無法發訊息
LINE是台灣人日常通訊不可或缺的工具,不論是聯絡家人、朋友或工作夥伴幾乎都離不開它。不過,近期LINE官方接連公布多項重大調整,從版本淘汰、訊息收回限制、推出付費會員,到Chrome網頁版退場,部分新規也引起用戶熱議。以下整理4大變動重點,用戶務必要提前留意,避免屆時發生無法登入或漏接訊息的情況。
三立新聞網 setn.com ・ 2 小時前
MLB/藍鳥球迷噓爆大谷翔平 他感受到大家的熱情「燦笑回應」
世界大賽G1今(25日)開打,多倫多藍鳥迎戰來訪的洛杉磯道奇,有趣的是,當現場介紹大谷翔平出場時,藍鳥球迷則是給予滿滿的噓聲,不過大谷並未因此感到不悅,反而是當場笑了出來。
中天新聞網 ・ 5 小時前
被爆砸12億買陶朱隱園 黃立成爆粗口回應了
台北超級豪宅「陶朱隱園」在2018年完工後,終於在10月23日開胡,完成首筆交易紀錄,成交單價每坪接近400萬元,總價12億元。不過中華工程(2515)並未透露買家身分,但現在盛傳是藝人兼加密貨幣投資者黃立成。但對於這個消息,黃立成則是在threads發文表示「買x小旋轉大樓」!
三立新聞網 setn.com ・ 19 小時前