我用 AI 开发了一个书签清理和统计的工具-懒猫书签清理,但你可能用不到。 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
kveln
V2EX    分享创造

我用 AI 开发了一个书签清理和统计的工具-懒猫书签清理,但你可能用不到。

  •  
  •   kveln 2024 年 12 月 30 日 2612 次点击
    这是一个创建于 459 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有多少人像我一样,把书签和稍后阅读这样的工具是区分来用的,浏览器的书签只用来保存那些我认为以后有用的网站,稍后阅读工具用来保存当下来不及阅读的文章,但是这样也会导致书签越来越多。

    在给 Tabmark-Bookmark New Tab 增加 [一键打开文件下所有的书签] 的功能后,我发现自己现在的书签已经有超过 800+个了,点开几个看看,有些网页已经打不开了,有些文件夹也是空的,不知道是什么时候添加的。浏览器的书签在不知不觉中已经塞满了各种“以后可能会访问”的网站。

    在搜索了书签清理工具后,发现几款工具用起来都差点意思,在 UI 交互上不太直观,而且书签失效的原因也对普通用户理解起来不太友好。恰巧正值年末,充斥着各种年终总结,那么能不能也对自己这么多年收藏的书签来一次年终总结呢?于是我花了几天,用 AI 做了个书签清理和分析的浏览器拓展,名字叫“懒猫书签清理”,当然 Logo 也是用 Midjourney 生成的。

     懒猫书签清理

     懒猫书签画像

    它能做什么?

    主要就是两个功能:

    帮你扫描失效书签

    • 检查哪些链接已经打不开了
    • 找出所有空的文件夹
    • 支持一键删除这些无用的书签和空文件夹
    • 扫描完还会告诉你具体原因,而不是一些简单的状态码。另外你也可以根据各种错误的类型来筛选再次重新确认。

    为了方便你筛选,在书签的 url 上 鼠标 hover 时,还能帮忙预览网站是否能打开(注意有些网站有跨域的限制,不能预览,请手动打开)

    生成你的书签画像

    这个功能纯属好玩。它会统计你的浏览器的书签数据(所有数据不会上传,都在本地),做成一份简单的报告:

    • 你从什么时候开始收藏书签
    • 你的书签和文件夹的数量
    • 最常收藏什么类型的网站
    • 收藏数量的变化趋势
    • 基于域名的收藏分析
    • 给你一个收藏家等级(从"入门收藏家"到"神级收藏家")

    在统计了这些收藏的网站之后,发现了一些有趣的数据。

    • 比如我最早的书签是 2015 年收藏的站酷,那个时候我还在大学,正在自学 UI;
    • 我收藏网站最多的类型是各种各样的博客,现在已经有 358 个链接了,大部分网站已经不更新或者是打不开了;
    • 作为一个产品经理,我收藏最多的网站从域名来看竟然是 Github
    • 我收藏的网站有两个高峰期,一个是 2019 年,一个是 2024 年,这也刚好对应着我人生中的两次职业的变化。 所以从这些书签的数据,可能也能反映你的人生中的一些变化,或者唤起你的一些回忆。

    最后说两句 这个工具确实解决了我的书签清理和分析的需求。但老实说,它可能是那种你用一次可能就再也不会打开的工具-就像我们收藏的大多数书签一样

    如果你:

    • 收藏书签很多
    • 平常也有清理书签的习惯
    • 好奇自己的收藏习惯
    • 可以来试试我这个工具。

    相关链接:

    项目网站: https://www.ainewtab.app/LazyCat-Bookmark-Cleaner/zh-cn/

    Chrome 商店地址: https://chromewebstore.google.com/detail/lazycat-bookmark-cleaner/aeehapalakdoclgmfeondmephgiandef

    开源地址: https://github.com/Alanrk/LazyCat-Bookmark-Cleaner

    工具已经上架 Chrome 商店,也可以搜"懒猫书签清理"就能找到。如果你用了觉得有意思,欢迎来分享你的书签故事和体验建议。

    17 条回复    2025-01-02 17:03:05 +08:00
    ltaoo1o
        1
    ltaoo1o  
       2024 年 12 月 30 日
    很好用,就是有些网站不准确,比如 https://zimuku.org/ 这个,可以访问,但是扫描结果是 Page Not Found
    kveln
        2
    kveln  
    OP
       2024 年 12 月 30 日
    @ltaoo1o 奇怪,通过状态码返回的是 404
    w$ curl -I https://zimuku.org/
    HTTP/1.1 404 Not Found
    Server: nginx/1.14.0
    Date: Mon, 30 Dec 2024 03:05:53 GMT
    Content-Type: text/html
    Content-Length: 13066
    Connection: keep-alive
    Set-Cookie: security_session_verify=c8f416adae474a9e5c76897b1f9f875f; expires=Thu, 02-Jan-25 11:05:53 GMT; path=/; HttpOnly
    Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
    ltaoo1o
        3
    ltaoo1o  
       2024 年 12 月 30 日
    @kveln 那这是网站防爬机制了,没有输入验证码就 404
    kveln
        4
    kveln  
    OP
       2024 年 12 月 30 日
    @ltaoo1o 感谢解释,这个我还真不懂,这样的网站就只能手动检查了,确实是没招
    CouleurVVEX
        5
    CouleurVVEX  
       2024 年 12 月 30 日
    可惜没火狐的
    kveln
        6
    kveln  
    OP
       2024 年 12 月 30 日
    @CouleurVVEX 火狐的用户多不多呀,我之前的书签标签页也有用户反馈说没有火狐平台的。不知道适配容不容易。
    sorakiseki
        7
    sorakiseki  
       2024 年 12 月 30 日
    希望支持火狐
    kveln
        8
    kveln  
    OP
       2024 年 12 月 30 日
    @sorakiseki 好的,收到
    pillarho
        9
    pillarho  
       2024 年 12 月 30 日
    直接 5 星好评支持
    kveln
        10
    kveln  
    OP
       2024 年 12 月 30 日
    @pillarho 感谢支持
    Fxshiny
        12
    Fxshiny  
       2025 年 1 月 2 日
    ![Clip_2025-01-02_13-12-38.jpg]( https://i.111666.bestundefined)4
    在用了
    kveln
        13
    kveln  
    OP
       2025 年 1 月 2 日
    @Fxshiny 谢谢支持,不过好像看不到你贴上来的图片
    Fxshiny
        14
    Fxshiny  
       2025 年 1 月 2 日
    话说,有个问题,能不能加上一个网址重复的 这样可以看到是否多加过标签?
    kveln
        15
    kveln  
    OP
       2025 年 1 月 2 日
    @Fxshiny 代码中已经有重复网址相关的检测了,在画像哪里,我还没想好和现在的扫描页面怎么结合展示比较好
    Fxshiny
        16
    Fxshiny  
       2025 年 1 月 2 日
    @kveln #15 是有,但是不能做到只保留一个,手机扫描相同文件,不是有保留的一个的吗,可以试试相同的列下来,选择保留
    kveln
        17
    kveln  
    OP
       2025 年 1 月 2 日
    @Fxshiny 好建议,我看下怎么整合进我的页面中
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2691 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 11:18 PVG 19:18 LAX 04:18 JFK 07:18
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86