Update 最近折腾 AI 视频生成的一些心得(顺便分享下我做的小工具) - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Kelly00
V2EX    视频技术

Update 最近折腾 AI 视频生成的一些心得(顺便分享下我做的小工具)

  •  
  •   Kelly00 2025 年 11 月 14 日 1098 次点击
    这是一个创建于 81 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近这段时间因为在研究短视频营销,顺便也去试了不少 AI 视频生成工具,发现一个很有意思的现象: 绝大多数视频模型的“能力”其实不错,但真正能用于商业或者电商场景的,反而非常少。

    原因大概有几个: 1.生成时间太长,随便一次就是 2 ~ 5 分钟。 2.只能做 2 ~ 3秒的单镜头,没办法做故事。 3.有水印不能商用。 4.很多地区直接打不开,要等邀请码。 5.电商相关的“产品手持、展示、生活场景”模型不太稳定。

    我和几个做 TikTok Shop 的朋友聊之后,他们最头疼的其实不是“模型效果多好”,而是:有没有 干净、可直接用 的视频?能不能一键生成 20 秒以上?产品能不能在不同镜头里保持一致?有没有简单的“产品展示模板”?结果这类需求反而是现有工具最薄弱的地方。因为好奇,我就尝试自己写了一个 demo ,想看看能不能做出一个至少能用的版本: 1.单镜头 10 秒视频 2.简单的多镜头( 25 秒) storyboard 3.图生视频:把商品图转成一个生活类短片 4.尽量不让人物、产品在不同镜头变来变去

    期间踩了很多坑,包括: 1.prompt 拆帧会乱跑 2.镜头切换会抖 3.人物肤色、衣服一致性难控制 4.模板难设计(电商场景比想象中复杂) 5.模型挑 prompt ,很“挑食” 不过折腾下来之后,至少能跑起来了。我把它放在 Saro2.ai 这个域名上,算是一个半实验性质的小工具。不是开源的,需要登录(为了防滥用 + 控制算力),不过已经能用。

    分享几个让我觉得“AI 视频比想象中更难”的点

    1. 视频最难的是“稳定”,不是画质 画质现在的模型都不差,但稳定性才决定能不能用来卖货。
    2. 多镜头比单镜头难一个次元 因为镜头之间的“连贯”完全是 pipeline 做出来的,而不是模型懂的。
    3. prompt 工程真的非常玄学 字多了不行,字少了也不行,有时候非常好的效果只是随机种子幸运。
    4. 做商家视频比做创意视频难太多

    因为必须要:真实、不跳帧、不变形、产品不能乱改、不能乱加奇怪东西、模型很容易“发挥创造力”,但商家要的是“不要发挥”。我觉得 AI 视频这个方向会越来越“工具化 / 场景化”,真正好用的工具未必是最强模型,而是最懂商业使用场景的。

    有在做 TikTok Shop 、Shopify 商品视频、UGC 、AI 生成视频、视频工具插件、欢迎留言交流下经验。

    如果想看看我上面说的那个 demo ,这里:Saro2.ai (一个我自己做的小的实验站)

    CatGo
        1
    CatGo  
       2025 年 12 月 8 日
    你怎么用 ai 做长视频啊,拆分脚本吗
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     4170 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 54ms UTC 01:21 PVG 09:21 LAX 17:21 JFK 20:21
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86