優寶購物《ubao.Tw》特貨品商城,黑貓宅配,取貨付款,深度求索發布DeepSeek-OCR:解密「光學壓縮」的文字速讀機制,為何AI學會遺忘反而省算力?
數位時代

深度求索發布DeepSeek-OCR:解密「光學壓縮」的文字速讀機制,為何AI學會遺忘反而省算力?

數位時代

重點一:DeepSeek OCR 以「光學壓縮」技術處理寫滿文字的圖片,最高壓縮10倍且保留約97%資訊,讓AI可處理更長文件。

重點二:DeepSeek OCR 把文件當成圖片處理,用兩個擅長不同工作的模型分工合作,再用一個「16倍壓縮器」把需要計算的資料量大幅減少。

重點三:DeepSeek OCR 每天可以在單一 Nvidia A100 GPU 上處理超過 20 萬頁資料。如果使用 20 台伺服器,每台伺服器運行 8 塊 A100 處理器,吞吐量將躍升至每天 3,300 萬頁。

廣告

中國AI公司Deepseek(深度求索)於10月21日推出DeepSeek-OCR(光學文字辨識)系統,主打將以「影像」呈現的文字文件做高效率壓縮後再交由語言模型處理。其技術上核心訴求是:處理「影像中的文字」比直接處理「數位文字」更省算力。

而在應用上,這套系統的核心賣點也很簡單: 用更少的「視覺符號」(內部的影像單位)就能把文件讀懂,並輸出成可編輯的文字或結構化內容,包含表格、公式與圖表。

OCR讀起字來多有效率?DeepSeek技術報告指出,在維持約97%資訊的前提下,文字脈絡可被壓縮至最多10倍,從而延長LLM可承載的上下文長度,減少記憶體與推論成本。

系統也可將「對話歷史影像化並壓縮」,將較舊的聊天內容以低解析度保存,類似人類「漸漸遺忘」的機制:資料越久、越遠、越低解析,就越模糊。

DeepSeek-OCR的記憶機制 圖/DeepSeek-OCR的記憶機制
DeepSeek-OCR的記憶機制 圖/DeepSeek-OCR的記憶機制

記憶刻度 :時間從「剛發生」到「1年」,清晰度由「Crystal Clear」逐步變成「Almost Gone」,描述人類記憶隨時間自然衰退。
視覺刻度:距離從 10 cm 到 20 m,越遠越不清楚,對應「看得近清楚、遠則模糊」的直覺感受。
文字刻度(解析度):從「Gundam」到「Tiny」等級,解析度越低、需要的「視覺符號」越少,文字呈現也越模糊,象徵以圖片方式壓縮舊文本。

這樣的優勢主要瞄準長文件處理、跨頁表格與圖形理解,以及跨語言(約100種)文件抽取,並在維持原始版面或輸出純文字的彈性間取得平衡。

白話來說,處理更少的符號,意味著更快的處理、更低的成本。對需要大量掃描、歸檔和資料萃取的工作類型,是最直接的效率紅利。

OCR如拼裝車!3步驟把資料「切塊再瘦身」

技術上,OCR如何辦到?DeepSeek‑OCR的做法是:把一頁文件當成「圖片」丟給AI,先切塊、再瘦身,最後才請懂圖又懂字的模型來讀。

第一步,前處理引擎DeepEncoder把版面「劃重點」:段落在哪、表格在哪、圖形在哪,別讓後面的模型浪費力氣在邊角裝飾(這裡用的是臉書母公司Meta的SAM,專門做影像分割)。

第二步是「資訊減肥」。例如原本一張1,024×1,024的頁面,會變成4,096個「視覺單位」(token),先經過壓縮器直接砍到256個,類似把會議逐字稿濃縮成重點條列,將算力和記憶體省下來。

第三步則是「理解」。其利用OpenAI的CLIP,負責把「看到的區塊」對上「語意」,也就是判斷這段到底在說什麼、這張圖在表達什麼。而因為前面已經切塊並瘦身,所以CLIP不用面對整頁的雜訊。

DeepSeek-OCR技術原理 圖/DeepSeek
DeepSeek-OCR技術原理 圖/DeepSeek

結果,同樣的一頁文件,DeepSeek‑OCR通常只需要64到400個視覺token就能讀懂:一般簡報大約64個、書籍或報告約100個。而若遇到版面複雜的報紙,再打開所謂的「Gundam模式」把配額拉到最多800。對比傳統OCR動輒上千到上萬token,這套路線是「少算力、更多內容」。

 DeepSeek‑OCR 的輸入模式有三種 圖/DeepSeek
DeepSeek‑OCR 的輸入模式有三種 圖/DeepSeek

進一步來說,DeepSeek‑OCR的輸入模式分成三類,以對應不同「視覺符號」數量,以測試在各種壓縮比例下的表現。

• Tiny|Small:固定尺寸(約 512、640),輸出 64 或 100 個視覺符號。適合字數不多、版面簡單的頁面,用少量符號就能還原內容。
• Base|Large:較大尺寸(約 1024、1280),輸出 256 或 400 符號。以「補邊」保留原始長寬比;有效符號會因黑邊扣除而少於名義值。
• Gundam|Gundam‑Master:動態模式,把頁面切成 n 個局部視野,再加一張全局視野。

一日處理3,300萬頁!OCR資料集與權重全面開放

在實務部署方面,DeepSeek-OCR宣稱以單顆Nvidia A100每日可處理約200,000頁;若以20台伺服器、每台8顆A100組成叢集,日處理量可達3,300萬頁。此吞吐量不僅可支援企業級文件工作流,也有助於為LLM建構海量文字語料。

研究團隊訓練時使用約3,000萬頁PDF(含近百種語言,其中中文與英文約2,500萬頁),並加入1,000萬張合成圖表500萬份化學式100萬份幾何圖形以強化多模態文件理解。

更重要的是,官方開放程式碼模型權重,讓生態系可驗證與擴充此技術;在多語、保版面與純文字輸出之間提供彈性,適合長文件抽取、AI訓練語料建置,以及聊天機器人脈絡的「成本感知式」保存。

整體而言,DeepSeek-OCR以「影像壓縮+少量token」策略,將OCR從單純文字擷取,推進到可支援LLM長脈絡與結構化資料抽取的系統級能力。

英國資深網頁開發者Simon Willison實測指出,DeepSeek‑OCR 可在 NVIDIA Spark(ARM64 + CUDA)的環境中順利跑通,整體印象是:只要花時間選擇合適的「運行方式/提示」,DeepSeek‑OCR本身的模型表現「非常好」,足以在新硬體條件下完成高品質 OCR。

如何使用 DeepSeek OCR ?

一般讀者可用 Hugging Face 下載模型,安裝必要套件後,把圖片丟進範例程式即可做 OCR。其建議簡易流程如下:

  • 事前準備:有一台可用的電腦。若沒有 NVIDIA 顯示卡,也能跑,但會較慢;Hugging Face 頁面示範是用 NVIDIA GPU、CUDA 11.8。

  • 安裝工具:安裝 Python(建議 3.12)與套件管理工具(pip 即可)。

  • 安裝必要套件:torch 2.6.0、transformers 4.46.3、tokenizers 0.20.3、einops、addict、easydict;加速可選擇安裝 flash-attn 2.7.3

  • 取得模型:從 Hugging Face 載入模型名稱 deepseek-ai/DeepSeek-OCR

  • 放入圖片:把要辨識文字的圖片檔(如掃描的合約、收據、海報)指定到程式,執行後就會輸出文字或 Markdown。

延伸閱讀:Canva回來了!AWS雲端服務全面修復完成,快打開看Perplexity、Coinbase⋯⋯能不能用?

資料來源:DeepSeekDecoderSimon Willison’s Weblog

本文初稿為AI編撰,整理.編輯/ 李先泰

更多報導
創新板可以當沖了!主管機關3大策略,朝「亞洲那斯達克」邁進
矽谷創投界炙手可熱的台灣人:陳恩平是誰?a16z也搶投資!他如何以「VC操刀手」逆轉人生?

其他人也在看

黃立成爆粗口回應陶朱隱園!她喊「這就是難賣原因」:每位講到都搖頭

黃立成爆粗口回應陶朱隱園!她喊「這就是難賣原因」:每位講到都搖頭

台北超級豪宅「陶朱隱園」在2018年完工後,終於在10月23日開胡,完成首筆交易紀錄,成交單價每坪接近400萬元,總價12億元,外界瘋傳是藝人黃立成,不過他也以1句話幽默否認。對此,科技專家許美華也指出,自己不覺得麻吉大哥會買不起陶朱隱園,且黃立成的言語中就暗藏陶朱隱園真正難賣的原因。

三立新聞網 setn.com ・ 5 小時前
MLB世界大賽》大谷翔平扛世界大賽首轟也笑不出來 藍鳥打爆道奇投手群搶開門紅

MLB世界大賽》大谷翔平扛世界大賽首轟也笑不出來 藍鳥打爆道奇投手群搶開門紅

MLB美國職棒大聯盟世界大賽G1,25日在多倫多藍鳥主場Rogers Centre點燃戰火,藍鳥靠著全隊打線狂掃14支安打,包含Addison Barger一錘定音的滿貫彈,儘管大谷翔平扛出生涯在世界大賽首轟也無法改變戰局,終場藍鳥以11比4,搶下開門紅。

Yahoo奇摩運動 ・ 2 小時前
黃立成爆12億買下信義豪宅「陶朱隱園」!霸氣發文回應了

黃立成爆12億買下信義豪宅「陶朱隱園」!霸氣發文回應了

[FTNN新聞網]記者吳雨婕/綜合報導台北信義區豪宅「陶朱隱園」近來傳出17樓一戶連同4個車位以總價12億元售出,買方還是非關係人,據悉,這名神祕買家即是「麻...

FTNN新聞網 ・ 20 小時前
沒性行為也中標!60歲老闆娘染菜花 醫師揭1日常習慣惹禍

沒性行為也中標!60歲老闆娘染菜花 醫師揭1日常習慣惹禍

俗稱「菜花」的性病疣(又稱性器疣)通常透過性行為傳染。不過,曾有一名60歲的酒店老闆娘卻在舌頭上長出「菜花」,讓她相當錯愕,她明明早已不接客,沒想到竟因一個平常的小動作,讓病毒有機可乘。

三立新聞網 setn.com ・ 1 天前
台大名醫喊「我被騙了!」為救移工孕婦 恐背百萬呆帳

台大名醫喊「我被騙了!」為救移工孕婦 恐背百萬呆帳

台大婦產科名醫施景中昨晚在臉書發文表示「我被騙了」,透露數週前收治一名罹患嚴重「植入性胎盤」的逃逸移工孕婦,經全力搶救後母子平安,但治療費用高達142萬元,事後竟遭陪同的收容機構拒絕支付,讓他無奈表示自己救了人,卻背上百萬呆帳。今天早上施景中再度發文更新,表示收容機構解釋雖然金額超乎他們想像,但仍會想辦法去償清這筆費用。

中天新聞網 ・ 3 小時前
冷空氣要來了!這天起「低溫探1字頭」 中南部也明顯有感

冷空氣要來了!這天起「低溫探1字頭」 中南部也明顯有感

今(25)日東北季風稍減弱,但水氣仍偏多,基隆北海岸、大臺北、宜蘭地區有陣雨,仍有局部大雨發生的機率,桃竹苗、花東及恆春半島也有短暫陣雨,南部地區及中部山區則有局部短暫陣雨,其他地區為多雲。對此,氣象粉專也示警,這天將會有冷空氣南下,且中南部地區也會明顯有感。

三立新聞網 setn.com ・ 6 小時前
鄭麗文4大副主席出爐!他酸:老人化、化 轟這兩人「聯絡人」

鄭麗文4大副主席出爐!他酸:老人化、化 轟這兩人「聯絡人」

國民主席選舉結果出爐,前立委鄭麗文以壓倒性差距,擊敗前台北市長郝龍斌,成為國民新任主席,後續政壇變化,備受各界討論。當選後鄭麗文動作頻頻,目前已經公布4位副主席,分別是前國民秘書長李乾龍、前黃復興部主委季麟連、馬英九基金會執行長蕭旭岑、國民前大陸事務部主任張榮恭,政治評論員張益贍就評論是「老人化、化」。

三立新聞網 setn.com ・ 8 小時前
台股開市2萬8穩了?謝金河盤點「這類股」飆漲中:可惜台灣受傷太重

台股開市2萬8穩了?謝金河盤點「這類股」飆漲中:可惜台灣受傷太重

在美國聯準會(Fed)降息預期強化、CPI最新數據和緩下,美股24日4大指數全面創下歷史新高,道瓊工業指數更攻上47000點大關,各界關注台股在周一開市後的表現,仍否突破2萬8000點大關。財信傳媒董事長謝金河今(25)日在以「記憶體的大時代」為題在臉書指出,台灣股市24日休市,但當天日本、南韓股市持續上漲,當中有幾個亮點,過去的記憶體上漲都像是一陣風,如今......

風傳媒 ・ 2 小時前
下週又有冷空氣殺到!2地區低溫「跌剩1字頭」中南部也有感

下週又有冷空氣殺到!2地區低溫「跌剩1字頭」中南部也有感

生活中心/周希雯報導台灣近期氣溫大幅下降、明顯變冷,其中北台灣受颱風外圍環流與東北季風共伴效應影響,雨彈不停歇狂炸近1週,遲遲看不到太陽露臉。氣象署指出,今(25)北部、東北部依舊偏涼,降雨機率仍高,尤其基隆北海岸、大臺北及東北部地區,容易有廣泛且持續性降雨,中南部則是白天明顯回暖,白天可達30度以上。不過還沒等到北部放晴,氣象專家就示警,下週將有冷空氣南下,北部及東北部溫度將跌到「1字頭」,而且這波降溫連中南部也有感。

民視 ・ 3 小時前
家寧被罵翻!新片「按讚數比網友留言還少」 上架13hrs慘況曝光

家寧被罵翻!新片「按讚數比網友留言還少」 上架13hrs慘況曝光

Andy老師近日再度更新影片,爆料家寧創立公關危機群組,聯合網軍展開抹黑計畫,其中還爆出有一位知名男星牽線,讓他跟家寧的糾紛再度牽起網友討論。不過昨(24日)家寧按照往常上傳新片,但內容不是回應Andy老師,而是分享到苗栗旅遊的過程,引來一片網友罵聲,甚至影片按讚數比網友留言還低,整體觀看數慘不忍睹。蔡佩伶報導

三立新聞網 setn.com ・ 2 小時前
棒球素人當上山本由伸翻譯 幸運內褲象徵兩人情誼

棒球素人當上山本由伸翻譯 幸運內褲象徵兩人情誼

(中央社記者林宏翰洛杉磯23日專電)「洛杉磯時報」報導,道奇日籍強投山本由伸的翻譯園田芳大,原非出身棒球界,上任第2天就想辭職,但2年下來,已成為山本重要的工作夥伴,每當山本先發,他必穿上幸運內褲。

中央社 ・ 1 天前
世界大賽/道奇太慘了!史奈爾核爆、牛棚接續砸鍋 藍鳥6下轟9分大逆轉

世界大賽/道奇太慘了!史奈爾核爆、牛棚接續砸鍋 藍鳥6下轟9分大逆轉

世界大賽G1道奇派出史奈爾(Blake Snell)掛帥先發,不料6局下史奈爾在沒有人出局下不但留下滿壘危機退場,接連上場的2位後援斯漢(Emmet Sheehan)、班達(Anthony Banda)繼續放火,讓藍鳥單局敲出2支全壘打狂轟9分,6局結束藍鳥領先來到11:2。

三立新聞網 setn.com ・ 3 小時前
下波東北風這天接力!低溫探20度 北部「雨再下1週」濕到崩潰

下波東北風這天接力!低溫探20度 北部「雨再下1週」濕到崩潰

氣象署指出,明天(24日)東北季風影響,中部以北及東北部天氣稍涼,水氣偏多,基隆北海岸、東北部地區及新竹以北山區有陣雨,並有局部大雨或豪雨發生的機率,桃園以北及東部地區有短暫陣雨,並有局部大雨發生的機率,竹苗、東南部地區及中南部山區有局部短暫陣雨,其他地區...

CTWANT ・ 1 天前
雨快要停了!專家曝「這天有望放晴」 未來一週天氣曝光

雨快要停了!專家曝「這天有望放晴」 未來一週天氣曝光

受到東北季風影響,北台灣持續呈現偏涼有雨的天氣型態,氣象專家吳聖宇表示,今明兩天(25、26日)北部及東北部仍是陰雨天氣,走到中南部天氣會比較好。但下週一水氣將減少,下週四東北季風減弱,西半部還有可能放晴,要留意的是,下週末東北季風再度增強,北部及東半部又有明顯雨勢。

三立新聞網 setn.com ・ 4 小時前
東北季風報到!北台灣雨下不停 氣象署曝「這時間」放晴

東北季風報到!北台灣雨下不停 氣象署曝「這時間」放晴

即時中心/廖予瑄、謝宛錚報導中央氣象署在今(24)日下午說明未來一週東北季風對台灣的天氣影響,預報員張承傳指出,受到東北季風影響,今日在迎風面北部及東北部,整天都有斷斷續續的下雨,天氣較濕涼;明(25)日雖然東北季風稍微減弱,但水氣仍偏多,在基隆北海岸、大台北、宜蘭地區下雨時間會較長,且有局部大雨發生的機率;東北季風將在下週四、五(30、31日)明顯減弱,屆時氣溫將逐漸回升,並縮小降雨範圍。

民視 ・ 18 小時前
說好的世代交替?鄭麗文4副主席「平均70歲」還是老藍男 朱立倫:祝福

說好的世代交替?鄭麗文4副主席「平均70歲」還是老藍男 朱立倫:祝福

前立委鄭麗文當選國民主席,但選前喊出世代交替,選後她公布的4名副主席平均年齡卻是70歲,挨酸還是「老藍男」。對此,國民主席朱立倫今(25)日表示,接下來鄭麗文有非常多辛苦的務工作,各方面都是予以祝福。

三立新聞網 setn.com ・ 4 小時前
大完便先別沖!醫師示警「大便超臭恐是警訊」 這8種排便狀況注意了

大完便先別沖!醫師示警「大便超臭恐是警訊」 這8種排便狀況注意了

大便也能看出身體狀況!平時日常生活中除了定期健康檢查之外,其實很多時候身體也會發出警訊,提醒你身體可能出現狀況了,過去醫師江坤俊曾在《健康2.0》節目中分享,如何「從馬桶裡看健康」,提到身體共有4大排毒器官「肝、腎、腸胃道、肺」,因此上大號時可以注意,從「8種排便狀況」檢視腸道健康。

三立新聞網 setn.com ・ 20 小時前
用戶注意了!LINE「4大更新」將上路 少做1動作無法發訊息

用戶注意了!LINE「4大更新」將上路 少做1動作無法發訊息

LINE是台灣人日常通訊不可或缺的工具,不論是聯絡家人、朋友或工作夥伴幾乎都離不開它。不過,近期LINE官方接連公布多項重大調整,從版本淘汰、訊息收回限制、推出付費會員,到Chrome網頁版退場,部分新規也引起用戶熱議。以下整理4大變動重點,用戶務必要提前留意,避免屆時發生無法登入或漏接訊息的情況。

三立新聞網 setn.com ・ 2 小時前
MLB/藍鳥球迷噓爆大谷翔平 他感受到大家的熱情「燦笑回應」

MLB/藍鳥球迷噓爆大谷翔平 他感受到大家的熱情「燦笑回應」

世界大賽G1今(25日)開打,多倫多藍鳥迎戰來訪的洛杉磯道奇,有趣的是,當現場介紹大谷翔平出場時,藍鳥球迷則是給予滿滿的噓聲,不過大谷並未因此感到不悅,反而是當場笑了出來。

中天新聞網 ・ 5 小時前
被爆砸12億買陶朱隱園 黃立成爆粗口回應了

被爆砸12億買陶朱隱園 黃立成爆粗口回應了

台北超級豪宅「陶朱隱園」在2018年完工後,終於在10月23日開胡,完成首筆交易紀錄,成交單價每坪接近400萬元,總價12億元。不過中華工程(2515)並未透露買家身分,但現在盛傳是藝人兼加密貨幣投資者黃立成。但對於這個消息,黃立成則是在threads發文表示「買x小旋轉大樓」!

三立新聞網 setn.com ・ 19 小時前
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86