两天时间,在GPT的辅助下,搭建了一个 “视频配音生成器” ,自用是足够了。
使用的编程语言是 Python。
关于 Python 这门编程语言,上大学的时候很着迷。
因为不同的项目依赖的版本以及库不同,所以Python环境装了卸,卸了装,但是没有一个明确的,想要实现的目标,所以也没学出什么成绩。
后来了解到 Conda,针对不同的项目,可以分别用不同的虚拟环境来实现,彼此独立。
至此,才逐渐在本地部署了很多 Python 项目。
我有一款产品,一直在国内短视频平台发布视频,前两天突然想到,既然视频已经做好了,完全可以换个语言,发布到国外的短视频平台,不仅受众更广,因为汇率差,价格或许也可以卖的更贵一些。
这就是 “ 配音工坊 – DubCraft Studio ” 这个小工具的由来。
可以实现的功能:
标准配音:使用内置声音快速生成语音(仅限英语)
支持选择多种内置声音
支持输入文本,生成对应音频
支持上传Srt文件,生成对应音频
支持上传Srt文件+原视频,生成对应音频的新视频
声音克隆:上传音频,生成相同声音的配音(多语言)
支持上传音频,克隆声音
支持输入文本,生成对应音频
支持上传Srt文件,生成对应音频
支持上传Srt文件+原视频,生成对应音频的新视频
假如你有一个原视频(中文配音),想要生成一个新视频(英文字幕+英文配音)。
使用这个工具,你需要做四步:
从原视频分离出 中文Srt文件
将 中文Srt文件 翻译为 英文Srt文件
上传 英文Srt文件 + 原视频 ,生成新视频
给新视频 添加字幕
其中1,2,4,这三个步骤,目前都有工具可以快速完成,我做的这个小工具,负责的是3。
好处是全程都支持优化,比如:
对中文Srt文件进行修正
将英文Srt文件更加本地化
对字幕格式进行任意修改
坏处是稍显繁琐。
当然会有更好的方案,用户只需要上传原视频,就可以自动生成 对应字幕+对应配音 的新视频。
但是依赖项太多,调试过程很容易出Bug,对于我目前的水平来说,很费精力。
或许等我时间充裕的时候,会尝试一下。
Copyright ❤ NSR