我做了一个「浏览器增强工具」,它用 AI 帮你把网页操作「自动化」 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
MaskerPRC
V2EX    分享创造

我做了一个「浏览器增强工具」,它用 AI 帮你把网页操作「自动化」

  •  
  •   MaskerPRC 5 天前 1468 次点击

    我叫 Loopsaaage 佳恒,现在在做一个「 1 年做 100 个 AI 小产品」的个人挑战。最近正折腾的这个东西,可能对每天在浏览器里打转的打工人有点用,就来 V 站跟大家汇报一下,也想听听大家真实的吐槽。

    先简单交代一下背景。我之前在华为、腾讯待过,做过游戏开发,也做过 AI 相关的系统。平时也喜欢折腾各种电子设备和新模型。这两年最直观的感觉是:模型确实越来越厉害,但真要落到「提高日常电脑办公效率」上,其实还没到那个爽点。大部分人用 AI ,还停留在「问点问题」「写点文案」「改改句子」这种层面。可是真正消耗人精力的,往往是浏览器里的那些重复步骤:打开好几个网站、来回切标签、复制粘贴、点一堆按钮、填一堆一样的表单。

    所以我现在做的这个产品,叫「全视界( Tab Hive )」。它想解决的核心问题只有一个:把你在多个网站之间的一整套固定操作,用可视化的方式串起来,然后让引擎和 AI 自动帮你跑完。

    如果用一句话来形容这个东西:把每一个网页当成可以连线的「节点」,数据可以在这些节点之间流动,而点击、输入这些操作也可以像搭积木一样编排起来。

    目前已经做了几块比较核心的功能:

    1. 多站点同屏展示

    这个是最直观的部分。你可以在一块无限画布上,同时摆 2×2 、3×3 ,甚至更多个网页。每个网页都是活的,可以正常操作。

    这对几类人比较有用:

    • 做运营、要看一堆后台数据的人,可以把几个后台都摊在一屏上;
    • 做电商比价的,可以把同一商品在不同网站的页面放在一块;
    • 做数据看板的,也可以把展示页、监控页、工具页都摆一起。

    因为桌面端是用 Electron 做的,没有浏览器里常见的 CORS 限制,所以大部分网站都能塞进来,银行、社交媒体、各种后台都可以正常打开和操作。

    2. 会话隔离 + 代理隔离

    每个小窗都有独立的 Session ,Cookie 互不影响。实际用起来,它就变成了一个「多账号浏览器」。同一个网站,你可以在一块画布上同时登录多个账号,各自互不干扰。

    再加上每个网页可以单独挂代理,你就可以做到:

    • 不同地区的账号分开跑;
    • 测试环境和生产环境分开开;
    • 不同业务线、不同商铺,各自用自己的 IP 和账号。

    这个对电商卖家、运营、需要多地区访问和管理多账号的人来说,应该会挺刚需。

    上面两点其实还只是「多窗口浏览器」。真正有意思的是第三块。

    3. AI 驱动的多网页工作流编排

    在这个工具里,每个网页不只是一个普通的窗口,而是一个「有配置的节点」。

    你可以在某个网页上,用可视化的方式框选元素:鼠标移动上去会高亮,点击可以自动生成选择器。你可以给这些元素起名字,比如「价格」「活动信息」「提交按钮」「搜索框」之类。然后对每个元素定义两类东西:

    • 从这里要「提取什么数据」;
    • 可以对它「执行什么操作」(点击、输入、滚动等)。

    在这个基础上,我设计了三种节点类型:

    • 网页节点:和真实网页打交道,负责抓数据、点按钮、填表单;
    • 流程节点:对数据做处理,比如过滤、转换、计算、组合;
    • 控制节点:根据数据结果去操控其他网页节点,比如「如果价格低于多少,就去 XX 页面下单」。

    节点之间有两种连线:

    • 数据连线:数据怎么在节点之间流动;
    • 执行连线:执行顺序怎么走。

    整体看上去有点像简化版的 Node-RED ,只不过它作用在真实网页上,而不是纯接口。

    用几个具体一点的例子来说明能干啥:

    例子 1:电商价格监控

    • 你在画布上打开几个电商平台,同一件商品的详情页;
    • 网页节点负责从每个页面抓「当前价格」「活动价」「满减信息」这些数据;
    • 流程节点把这些数据算一遍,比如统一成同一种单位、加上运费、算折扣后最终价格;
    • 最后,把结果丢进你自己做的一个「价格看板」网页里,自动填出一个列表或表格。

    你平时只要看这个看板页面,就能知道每个平台当前的实际到手价,而不用每天手动打开一堆标签一点点比。

    例子 2:多站点表单批量填写

    • 你有一份简历或者一套公司信息,需要丢到很多网站:投简历、注册账号、填写商家资料、提交工单等;
    • 你可以在流程节点里,先把这份通用信息整理好,比如「姓名」「电话」「公司名」「介绍」「链接」等字段;
    • 然后用控制节点驱动不同网站的表单,让它们自动去对应的输入框里填这些字段,并且点击提交。

    你只需要前面配置一次,后面要上新网站,只要把对应的输入框标记出来,拖拖线,流程就能直接复用。

    例子 3:多账号批量操作

    • 你打开三个一模一样的运营后台页面;
    • 每个页面挂不同的账号和代理;
    • 控制节点驱动这三个页面同步干同一件事,比如一起发帖、一起发优惠券、一起拉报表。

    比你一个账号一个账号地登录、切浏览器、来回点,要轻松得多。

    4. 执行引擎和调试体验

    执行这一块,现在已经有一整套比较顺的流程:

    • 引擎会自动找到起始节点,按执行连线往下跑;
    • 执行过程中有实时日志,你可以看到在哪个节点做了什么;
    • 每个节点的输入和输出数据可以直接展开查看;
    • 如果哪个节点出错了,会标红,并给出简单的堆栈信息,方便你查问题。

    对平时喜欢搭工作流、玩自动化的人来说,这一套应该比较好上手,至少调试不会太痛苦。

    5. 和 AI 相关的部分(目前的规划)

    现在 AI 这块主要是把底层接口和空间预留出来,具体的能力准备先从两个方向做:

    • 自然语言生成工作流草稿:
      你可以直接打一段需求,比如「从 A 、B 、C 三个站抓这个商品的价格和库存,算完之后写到 D 站的一个表格里」,AI 帮你先搭一个大致的节点和连线框架,你再自己细调、补充规则。

    • 智能识别页面元素和提取规则:
      简单说,就是尽量减少你和各种复杂选择器死磕的时间。比如 AI 帮你猜「这个列表每一行的结构」「这个页面所有价格字段」「这个表单里所有必填项」,然后给你几个候选方案,你选一下就能用。

    6. 挑战记录和后续

    我自己「 1 年 100 个产品」的进度和过程,都放在这个站点上:
    https://100.agitao.net
    「全视界 / Tab Hive 」是里面相对比较重的一个项目,我会长期迭代,不是玩票性质的 demo 。

    如果你平时的工作里,有这种「每天都在几个固定的网站之间,重复做几乎一样的事情」的场景,或者你已经在用 AutoHotkey 、Playwright 、Selenium 之类的工具,但又不太想写脚本、写代码,欢迎在评论里跟我说一下你真实的场景:

    • 你现在具体是怎么操作的;
    • 哪些步骤最烦、最容易出错;
    • 你希望能「一键搞定」的那一刻是什么样子。

    我这边会优先把这些高频、痛点明确的场景做成内置模板,方便大家直接拿来用,也能帮我验证一下,这个方向到底值不值得继续重仓做下去。

    11 条回复    2025-12-22 16:48:30 +08:00
    ajan
        1
    ajan  
       5 天前
    已收藏
    lingyired
        2
    lingyired  
       5 天前
    https://100.agitao.net 这个网站用的是什么 UI 框架和主题? 感觉很有意思
    leyoumake1997
        3
    leyoumake1997  
       5 天前
    牛的牛的。求 ui 主题
    ns2250225
        4
    ns2250225  
       5 天前   1
    @lingyired #2 应该是用了 Neo Brutalism 新粗野/新野格
    510908220
        5
    510908220  
       5 天前
    厉害,楼主朝气蓬勃,以后很有前途
    Peiiii
        6
    Peiiii  
       5 天前 via Android
    很有趣,有过相关的想法。当时的考虑是做成浏览器插件,AI 生成自动化脚本,提供快捷操作。没考虑到把多个网站串到一个流程中。
    MaskerPRC
        7
    MaskerPRC  
    OP
       5 天前
    项目完全开源,感兴趣的可以直达下载最新版本: https://github.com/MaskerPRC/tab-hive/releases/latest
    MaskerPRC
        8
    MaskerPRC  
    OP
       5 天前
    @510908220 感谢
    bigShrimp8577
        9
    bigShrimp8577  
       5 天前
    对我这种,好像没啥用
    ricwangcom
        10
    ricwangcom  
       2 天前
    现居地:山西 / 西安
    unco020511
        11
    unco020511  
       2 天前
    这个如果做好了,我感觉会很有用,你这个想法还是比较牛的
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1002 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 36ms UTC 19:07 PVG 03:07 LAX 11:07 JFK 14:07
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86