
需要通过 API 来批量的上传和获取 AI 视频分析的结果。 1 、文字提取和总结 2 、关键帧识别
请问呢大家有推荐的服务商来处理上述任务吗,准备试试 gemini api ,但是不清楚效果以及单次成本,大家有好的方案组合可以推荐吗感谢
1 malusama 34 天前 上传到 youtube , 然后使用 gemini https://aistudio.google.com/ 现在免费啊 |
2 HeyCaptainJack OP @malusama 需要通过 API 的方式去调用 |
3 RangerWolf 34 天前 @malusama 好方法啊 |
4 kmoui 34 天前 Qwen VL 系列呢,但你视频需要预处理吧,比如降低分辨率和帧率,分割小段。 |
6 wdoit9 33 天前 之前捣鼓过本地处理视频提取音频,然后调语音识别模型转文字,然后调 LLM 总结文字内容,关键帧倒是没有啥好办法 |
7 kingofzihua 33 天前 https://aistudio.google.com 选择 build->app-> 搜索 video_analyzer 代码下下来看看,文档说最长支持 2h 的视频,或者你上传到 youtube 给他视频链接 https://ai.google.dev/gemini-api/docs/video-understanding?hl=zh-cn ![]() |
8 wnpllrzodiac 33 天前 @kingofzihua 女幽分析器是吧。。。哈哈哈哈 |
9 guaguaguaxia1 33 天前 火山引擎里的豆包视觉模型看看 |
10 shellus 33 天前 感觉楼上说的方案,或者说使用大模型来实现的方案,都会成本爆炸。 |
11 HeyCaptainJack OP @kmoui 好的,我来研究一下,谢谢 |
12 HeyCaptainJack OP @wdoit9 嗯,我之前也没怎么研究,但是市面上这种产品倒是挺多,多找找应该没问题 |
13 HeyCaptainJack OP @guaguaguaxia1 好的,感谢,我去看看 |