使用 whisper 制作音频转文字网站 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
eightdoor
V2EX    分享创造

使用 whisper 制作音频转文字网站

  •  
  •   small class="gray">eightdoor 2023 年 9 月 25 日 2914 次点击
    这是一个创建于 882 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前实现

    • 使用 openai/whisper python+fastapi 实现音频、视频文件上传,后台通过 whisper 转换文字内容 存储数据库,通过定时任务,后台自动转换,目前只支持单个转换 不能并行转换

    计划

    其他

    • 目前服务器是通过 frp 内网直接代理出去的,配置 e5+amd580 (搭配 rocm ),运行的模型大小是 medium 。如果有盈利点,可以买点好的配置服务器
    • 目前只想到这样做,可以后续提供 api 接口直接调用,提供付费服务。
    • 不知道想法是否可行,能不能产生盈利点,大家有什么好想法或者建议吗
    21 条回复    2023-09-25 17:20:50 +08:00
    jayzau1973
        1
    jayzau1973  
       2023 年 9 月 25 日
    你可以搜搜之前有个老哥做的 AI 字幕机,实现了盈利。
    不过他是打包成软件,用客户端资源进行计算,你这用自己的服务器成本会不会太高?
    z7356995
        2
    z7356995  
       2023 年 9 月 25 日 via Android
    我是用 google colab 免费 gpu 计算,速度快
    UKnowMe
        3
    UKnowMe  
       2023 年 9 月 25 日
    1. “目前只支持单个转换 不能并行转换” 这个指的是用户 A 每次只能转换 1 个,还是说用户 A 、用户 B 、用户 C 加起来只能转换 1 个,若 A 转换中,则 B 、C 阻塞?

    2. 你有什么比得过 https://freesubtitles.ai/ 的?无恶意,单纯觉得人家已经有了你所说的 “后续提供 api 接口直接调用,提供付费服务” ,那么是否意味着你比人家的功能还少?莫非你打算通过推广来赢得市场还是啥?

    3. 免费用户一直用脚本调用你的功能,你咋办?因为我正好有音频转文字的需求,未登录的用户,你该如何防止?还是说需要登录才能使用功能,通过登录用户来进行精准限制。
    molezznet
        4
    molezznet  
       2023 年 9 月 25 日
    580 传家宝啊
    z7356995
        5
    z7356995  
       2023 年 9 月 25 日 via Android
    其实赢利点不是音频转换,而是英语有声书网站,有很多有名的英语有声书,要嘛找得到 mp3, 要嘛找不到对应的逐句复读的材料,国外有一个 pt 有声书网站,可以下载各种有声书,然后提取转换 srt 字幕,就可以供英语学习者边看有趣的内容边听了,下什么内容转换可以按搜索量,或有偿加速,版权问题,,你看看每日英语听力,有几个音频字幕买了版权?
    z7356995
        6
    z7356995  
       2023 年 9 月 25 日 via Android
    国外 pt 网站可以下载 mp3
    z7356995
        7
    z7356995  
       2023 年 9 月 25 日 via Android
    一次转换可以多次贩卖
    eightdoor
        8
    eightdoor  
    OP
       2023 年 9 月 25 日
    @jayzau1973 我找找看看,服务器成本很高,要是转换的话
    qW7bo2FbzbC0
        9
    qW7bo2FbzbC0  
       2023 年 9 月 25 日
    如果 使用者传入涉政暴恐的录音,并且进行关联传播,你有做关键词屏蔽和错杀恢复逻辑吗?
    qW7bo2FbzbC0
        10
    qW7bo2FbzbC0  
       2023 年 9 月 25 日
    如果你使用墙内的基础设施提供服务,如果不幸被关联到非法信息使用上,很快会被查水表吧
    eightdoor
        11
    eightdoor  
    OP
       2023 年 9 月 25 日
    @UKnowMe 1 、同时只能转换 1 个。2 、freesub 做的已经比较好了,我的功能是比较少的,看看有没有小众的需求,做免费的也可以。3 、通过登录可以转换,但是还是免不了 接口恶意调用,加安全策略。
    eightdoor
        12
    eightdoor  
    OP
       2023 年 9 月 25 日
    @z7356995 这个不错 有声书或者现在好多的免费视频 字幕也可以做
    zhch602
        13
    zhch602  
       2023 年 9 月 25 日
    现在 whisper 的入门门槛太低了,免费的客户端软件也有很多,用服务器的话可以白嫖 google colab ,看不到什么盈利点
    eightdoor
        14
    eightdoor  
    OP
       2023 年 9 月 25 日
    @qW7bo2FbzbC0 应该去筛选的 上传完成了,转换完成了 关键词屏蔽和错杀恢复逻辑。 其实最好的还是做个客户端工具 利用本地资源去转换 我看 whisper 有几个开源的是可以 window 或者 mac 端直接使用的
    tool2d
        15
    tool2d  
       2023 年 9 月 25 日
    whisper 的模型英文识别度高,但是中文效果挺一般的。
    anmie
        16
    anmie  
       2023 年 9 月 25 日
    会做实时转录吗?
    thinkm
        17
    thinkm  
       2023 年 9 月 25 日
    门槛太低了,全是开源的,是几行命令的事情,就算能盈利,马上一大堆人来价格比你低 配置比你好
    z7356995
        18
    z7356995  
       2023 年 9 月 25 日 via Android
    模式参考每日英语听力,但收集各种推荐书单,做好各种阅读量高的书的 seo ,然后流量的话,人家找书搜索书名的话就到你的网站下来了,,网站做好信息隔离,,万一有人告,要找不到人
    xyy003
        19
    xyy003  
    PRO
       2023 年 9 月 25 日
    基本没有盈利点
    eightdoor
        20
    eightdoor  
    OP
       2023 年 9 月 25 日
    @anmie 会做
    eightdoor
        21
    eightdoor  
    OP
       2023 年 9 月 25 日
    @z7356995 说的对,感觉做网站 不如直接做客户端实在啊,服务器数据做了存储 就有很多问题
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2273 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 03:45 PVG 11:45 LAX 19:45 JFK 22:45
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86