V2EX greentim
 greentim 最近的时间轴更新
greentim

greentim

V2EX 第 616819 号会员,加入于 2023-03-03 10:21:52 +08:00
greentim 最近回复了
哈哈哈,首先说真的很有才
抛开个人层面,我指的是。 对工程师确实是双城记:尤其擅长软件架构设计,产品需求沟通的资深工程师、架构师,反而人的价值更高了。公司里面给这样的人薪水更高了,相对研发人员数大幅度减小。
这个话题确实很招恨,但是真实情况的确往这个方向发展了
哈哈,这么狠哦!
@BeautifulSoap 我是感觉:并非除了开发上,包括过去需求分析、需求设计、早期实施,后期维护、故障排查修复、都有本质的提效。
@nevin47 哦,学习了
而我们的 RPA Skill 在网页数据提取时,引入了视觉大模型( Vision )模式。它不依赖底层的 HTML 代码,而是像人眼一样直接“看”网页截图。只要屏幕上显示了“价格”和“评分”,它就能精准提取。网站底层怎么改,影响不到它。

大模型视觉识别 VS 传统爬虫(如 Python/Scrapy )
像 Airbnb 这种现代网站,大量采用 SPA (单页应用)技术,数据都是动态加载的,甚至网页元素会随着鼠标滚动不断变化。传统爬虫极度依赖底层的 HTML 代码结构,面对这种复杂的 SPA 网站几乎束手无策;一旦网站稍微改版,爬虫代码直接报废,维护成本是个无底洞。

我刚发了一个“Airbnb 民宿竞品比价机器人”案例,Airbnb 、携程ctrip.com 就是典型做了防爬的 SPA 复杂网站 。案例完整介绍 https://github.com/laziobird/openclaw-rpa/blob/main/articles/scenario-airbnb-compare.md
我们在 Airbnb 比价案例中,视觉提取底层使用的是阿里最新开源的 Qwen3-VL 视觉大模型。它不仅识别极其精准,而且花费的 Token 极小!作为开源模型,你甚至可以将其本地私有化部署 (GitHub: Qwen3-VL),彻底解决企业数据隐私的后顾之忧
@JShen 调用 api_call 指令,会让 AI 自动生成 API 调用代码,基于 httpx 框架
@JShen 如果录制 Browser ,我的建议

**不建议使用容易失败或需要人工干预:**
| 场景 | 原因 |
|------|------|
| **高度动态的 SPA**(重度客户端路由、DOM 频繁变动) | 选择器在每次渲染间可能发生偏移; snapshot 可能遗漏未渲染内容 |
| **登录后才可访问且无保存会话的流程** | 需手动处理账号密码与二次验证,回放前须先登录 |
| **无稳定 ID 的无限下拉流** | 渐进式探测有帮助,但结果可能不稳定 |
@To5tE 具体可以去 github 提 issue 功能,我会定期看看大家需求,然后看看要不要增强。
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1171 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 30ms UTC 17:53 PVG 01:53 LAX 10:53 JFK 13:53
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86