批量进行 AI 视频分析，时长 1 小时的那种，求个好的方案♂

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 84 天前的主题，其中的信息可能已经有所发展或是发生改变。

需要通过 API 来批量的上传和获取 AI 视频分析的结果。 1 、文字提取和总结 2 、关键帧识别

请问呢大家有推荐的服务商来处理上述任务吗，准备试试 gemini api ，但是不清楚效果以及单次成本，大家有好的方案组合可以推荐吗感谢

AI 视频分析

批量上传

API

13 条回复 2025-11-13 21:20:35 +08:00

malusama

2025 年 11 月 12 日

上传到 youtube ，然后使用 gemini
https://aistudio.google.com/ 现在免费啊

HeyCaptainJack

2025 年 11 月 12 日

@malusama 需要通过 API 的方式去调用

RangerWolf

2025 年 11 月 12 日

@malusama 好方法啊

kmoui

2025 年 11 月 12 日

Qwen VL 系列呢，但你视频需要预处理吧，比如降低分辨率和帧率，分割小段。

dismantle

2025 年 11 月 12 日 via Android

@malusama 邪修哈哈

wdoit9

2025 年 11 月 13 日

之前捣鼓过本地处理视频提取音频，然后调语音识别模型转文字，然后调 LLM 总结文字内容，关键帧倒是没有啥好办法

div class="fr"> 7

kingofzihua

2025 年 11 月 13 日

https://aistudio.google.com 选择 build->app-> 搜索 video_analyzer

代码下下来看看，文档说最长支持 2h 的视频，或者你上传到 youtube 给他视频链接

https://ai.google.dev/gemini-api/docs/video-understanding?hl=zh-cn

wnpllrzodiac

2025 年 11 月 13 日

@kingofzihua 女幽分析器是吧。。。哈哈哈哈

guaguaguaxia1

2025 年 11 月 13 日

火山引擎里的豆包视觉模型看看

shellus

2025 年 11 月 13 日

感觉楼上说的方案，或者说使用大模型来实现的方案，都会成本爆炸。

HeyCaptainJack

2025 年 11 月 13 日

@kmoui 好的，我来研究一下，谢谢

HeyCaptainJack

2025 年 11 月 13 日

@wdoit9 嗯，我之前也没怎么研究，但是市面上这种产品倒是挺多，多找找应该没问题

HeyCaptainJack

2025 年 11 月 13 日

@guaguaguaxia1 好的，感谢，我去看看