Skip to content

这是一个全自动(音频)视频翻译项目。利用Whisper识别声音,AI大模型翻译字幕,最后合并字幕视频,生成翻译后的视频。

License

Notifications You must be signed in to change notification settings

zhuixing05/Chenyme-AAVT

Repository files navigation



英文 下载 群组 Latest Release PyPI - Version License Open In Colab


Note

🌟 如果本项目对您有帮助,记得 Star 🌟 支持一下吧~

📝 推荐识别时使用 Large 模型以获取更好的体验!由于正在备考,更新速度会放缓,感谢理解!

📖安装教程 | ❓ 常见问题 | 💬 电报群组


项目介绍

Chenyme-AAVT 全自动视频翻译项目 致力于提供一个简便高效且免费的媒体识别与翻译自动化流程,帮助您快速完成音视频字幕的识别、翻译和处理等多种功能,当然目前项目已经不仅仅是帮您识别并翻译声音,还可以自动化生成营销图文、对字幕单独翻译。计划未来会基于现有基本功能继续加入更多有意思的工具,比如 实时识别、口型校正、声音克隆、音色辨别 等等,敬请期待!

当前已支持的基本功能,非全部功能:


20240820210851.jpg


项目亮点

TODO | 待办

识别相关

  • 更换更快的Whisper项目
  • 支持本地模型加载
  • 支持个人微调Whisper模型
  • VAD辅助优化
  • 字词级断句优化
  • 更多的语种识别

翻译相关

  • 翻译优化
  • 更多的语种翻译
  • 更多的翻译模型
  • 更多的翻译引擎
  • 支持本地大语言模型翻译

字幕相关

  • 个性化字幕
  • 更多字幕格式
  • 字幕预览、实时修改
  • 自动化字幕文本校对
  • 双字幕

其他

  • AI助手
  • 视频预览
  • 视频生成博客
  • 实时语音翻译
  • 视频中文配音
  • 音色辨别
  • 声音克隆
  • 口型校对
  • 支持识别和翻译多种语言
  • 支持 全流程本地化、免费化部署
  • 支持对视频 一键生成博客内容、营销图文
  • 支持 自动化翻译二次修改字幕预览视频
  • 支持开启 GPU 加速VAD 辅助FFmpeg 加速
  • 支持使用 ChatGPTClaudeGeminiDeepSeek 等众多大模型翻译引擎

如何部署

若需要验证,密码为:chenymeaavt,此为新功能,可在设置中关闭项目保护

Windows 部署

📖安装教程 | Release 中带有 Full 的是已打包了FFmpeg库的版本

  1. 安装 Python (请确保Python版本大于3.8!)

  2. 安装 FFmpeg (请不要忘记设置为环境变量!)

  3. 安装 CUDA (CPU部署可忽略,推荐版本为 CUDA11.8、12.1、12.4!)

  4. 运行 0_Check.bat (检查有哪些环境还没有正确安装,以免出错)

  5. 运行 1_Install.bat(环境检查通过后,界面内选择您对应的版本继续安装!)

  6. 运行 2_WebUI.bat(运行成功即可)


docker 部署

注:目前 项目最新版本为 V0.9.0 此 Docker 的版本为0.8.x,

docker pull eisai/chenyme-aavt

具体使用方法,请查阅:eisai/chenyme-aavt,感谢 @Eisaichen 提供此版本


Google Colab 部署

请点击后阅读相关部署教程 | Open In Colab,感谢 @Kirie233 提供此版本


Mac os 部署

已支持,近期会写教程

其他环境部署

  • Linux

由于近期那台电脑丢在学校,暂时没研究,其实我觉得解决 FFMpeg 和 Cuda,应该就没问题了


Star History

Star History Chart


主页BOT

11


部分设置

12


音频识别

13


视频识别

14


图文博客

15


字幕翻译

16


声音模拟

17


鸣谢

本人是 AI 时代的受益者,本项目的开发基本是站在巨人的肩膀上实现的。感谢开源精神,感谢 OpenAI 、 Streamlit 、 FFmpeg 、Faster-whisper 等开发人员!

About

这是一个全自动(音频)视频翻译项目。利用Whisper识别声音,AI大模型翻译字幕,最后合并字幕视频,生成翻译后的视频。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 94.3%
  • Jupyter Notebook 3.0%
  • Batchfile 2.3%
  • Other 0.4%