Wayback Archiver 自托管的个人网页归档系统 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
codeface
14.49D
V2EX    分享创造

Wayback Archiver 自托管的个人网页归档系统

  •  1
     
  •   codeface 18 天前 1565 次点击

    一个自托管的个人网页归档系统,自动捕获并保存你在 Chrome 中浏览过的网页 HTML 、CSS 、Javascript 、图片等一应俱全。当原始网页无法访问时,你仍然可以通过归档副本还原当时的页面样式和内容。

    index

    v2ex

    x

    工作原理

    Chrome + Tampermonkey ──HTTP POST── Go 服务器 ── PostgreSQL (元数据) (关闭标签页 / 页面跳转 │ + 文件系统 (静态资源) 时自动捕获) │ Web UI ── 浏览 / 搜索 / 还原 
    1. Tampermonkey 用户脚本在浏览器中运行,当你离开页面时自动捕获完整的 DOM 和资源。
    2. Go 服务器接收快照,下载浏览器因 CORS 限制无法获取的跨域资源,基于内容哈希去重后存储到本地。
    3. 内置 Web UI 可以浏览、搜索和还原任意归档页面 完全离线,不依赖外部服务。

    功能特性

    • 高保真还原 CSSOM 序列化、计算样式内联、防刷新保护,尽可能还原页面原始效果
    • 完整页面捕获 HTML 、CSS 、JS 、图片、字体;资源 URL 自动重写为本地路径
    • 跨域资源恢复 服务器端自动提取并下载被 CORS 拦截的资源
    • 内容哈希去重 相同资源跨页面共享,仅存储一份( SHA-256 )
    • 版本历史 同一 URL 可多次归档,按时间戳区分
    • 智能去重 会话级 + 服务器级双重去重,内容无变化时仅更新访问时间
    • 动态内容支持 捕获实时 DOM 状态; MutationObserver 监听变化,超过阈值自动提交一次更新
    • SPA 感知 检测单页应用导航,按路由重置捕获状态
    • 防刷新保护 归档页面被冻结:定时器、WebSocket 和导航 API 均被拦截
    • Web UI 响应式界面,支持全文搜索(页面内容、URL 、标题)、按时间范围筛选和还原归档页面
    • RESTful API 提供完整的归档和查询接口

    欢迎体验

    https://github.com/icodeface/wayback-archiver

    10 条回复    2026-03-12 20:52:34 +08:00
    codeface
        1
    codeface  
    OP
       18 天前
    记录我所浏览的一切!
    arphone
        2
    arphone  
       18 天前
    amazing...
    loading
        3
    loading  
       18 天前
    hahastudio
        4
    hahastudio  
       18 天前
    感觉这个接 LLM 比 Rewind 这种要轻量
    fds
        5
    fds  
       18 天前
    防刷新保护 很新颖
    强制剥离 js 只保留 css 和 html 效果如何?能想象有些动态页面会比较惨。
    codeface
        6
    codeface  
    OP
       18 天前
    @fds 尽可能还原了,部分 SPA 网页还是要单独做特殊处理。
    hhacker
        7
    hhacker  
       17 天前
    那么,直接存成图片行不行?就是会有点大
    xJogger
        8
    xJogger  
       17 天前 via Android
    支持火狐么
    codeface
        9
    codeface  
    OP
       17 天前
    @hhacker 图片不太方便做正文检索,然后我还想把内容开放给 AI 读,图片效果也没文本好。
    codeface
        10
    codeface  
    OP
       17 天前
    xJogger 经测试是支持的
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5416 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 33ms UTC 09:23 PVG 17:23 LAX 02:23 JFK 05:23
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86