找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 文档 工具 设计
查看: 309|回复: 0

python基本功,自动生成字幕软件

[复制链接]

1万

主题

915

回帖

2万

积分

超级版主

教育辅助界扛把子

附加身份标识
精华
1
热心
2
听众
1
威望
57
贡献
11948
违规
0
书币
5648
注册时间
2020-4-8

论坛元老灌水之王

发表于 2020-5-5 04:23 | 显示全部楼层 |阅读模式
一直在看字幕组的作品,非常喜欢,致敬!

之前因为需要给大量视频自动生成字幕,发现了一个开源的工具:https://github.com/BingLingGroup/autosub
这个工具(autosub)可以自动提取视频中的音频,然后切分成若干个小段,然后用语音识别引擎转录为文字。最后得到的结果就是一个srt字幕。我试过它的结果还是比较准确的。因为我知道字幕组做字幕需要先把文本transcript下来,然后也需要打轴,这款工具似乎可以在这两步上减少一定的工作量。Autosub在命令行下调用,但是并不复杂,相信字幕组的技术可以搞定。

这个工具也可以用翻译引擎自动翻译字幕,但是效果不太给力,错误比较多,有兴趣你们可以试一下。

另外还有一款类似的工具,https://github.com/wxbool/video-srt-windows/ ,但是我没能使用成功。供参考。

有类似需求的朋友也可以关注一下这两款工具。

简单叙述一下这个软件的各个不同构成部分。

https://github.com/BingLingGroup/autosub/raw/dev/docs/workflow.zh-Hans.png

时间轴生成使用的是auditok,一个python库,在本地离线识别时间轴,准确率比subtitleedit稍高一些,前提是音频要降噪(非语音音量较小)且语音音量标准化且音频非歌曲类(歌曲类可能需要调参,详见auditok选项)

语音识别目前支持一个chrome逆向出来的免费api和付费的google cloud speech-to-text api,两者在中文的识别准确率上相近,未测试过英文的……两者都是只支持短语音识别,前者不支持长语音识别,而后者是代码里还没做长语音识别的支持。另外后者api应该是支持精细到单词的时间戳,类似youtube那种效果,可以进一步精确时间轴,不过我还没做支持。现在准备加上自定义请求json的支持和一些国内api的支持。

翻译使用的是py-googletrans,一个python库,逆向了网页版的谷歌翻译,如果使用-surl translate.google.cn即国内可直连的那个谷歌翻译可以不需要梯子即可直接翻译。

以上所有功能均可分步执行,详见readme。
Great works are not done by strength, but by persistence! 历尽艰辛的飞升者,成了围剿孙悟空的十万天兵之一。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则 需要先绑定手机号


免责声明:
本站所发布的第三方软件及资源(包括但不仅限于文字/图片/音频/视频等仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢某程序或某个资源,请支持正版软件及版权方利益,注册或购买,得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To: admin@cdsy.xyz

QQ|Archiver|手机版|小黑屋|城东书院 ( 湘ICP备19021508号-1|湘公网安备 43102202000103号 )

GMT+8, 2024-4-25 09:46 , Processed in 0.041772 second(s), 30 queries .

Powered by Discuz! CDSY.XYZ

Copyright © 2019-2023, Tencent Cloud.

快速回复 返回顶部 返回列表