Chenyme-AAVT V0.7.1

AI Auto Video(Audio) Translation

非常感谢您来到我的 AI Auto Video-Audio Translation 项目！该项目旨在提供一个简单易用的全自动视频（音频）识别、翻译工具，帮助您快速识别声音并翻译生成字幕文件，然后将翻译后的字幕与原视频合并，以便您更快速的实现视频翻译。

Note ：字幕翻译的错位问题会逐步优化。由于考研，更新速度可能会放缓，感谢理解~~~

Tips：推荐选用 Faster-whisper 和 Large 模型以获得最好的断句、识别体验。

命令行模式开发中

AAVT项目文档-持续更新中

给一颗免费的星鼓励一下叭~感谢!!!

群聊二维码	说明
	我是一位学生，目前在备考可能不会及时看issues，还请多多担待。本项目开源，但由于个人技术水平有限，项目的很多地方还不尽人意，在这里欢迎各位大佬和朋友加入群聊交流，有任何问题可以在群里提出，让我们可以一起完善这个项目，感谢支持！

测试效果点击下载

项目亮点

支持 openai调用和 faster-whisper 本地运行。

支持 GPU 加速、VAD辅助。

支持 ChatGPT、KIMI、DeepSeek翻译。

支持本地大语言模型翻译。

支持识别、翻译多种语言。

支持输出多种字幕格式。

支持对字幕修改、微调、预览。

支持对音频直接进行AI总结、问答。

支持视频生成博客。

如何安装

使用 CPU 运行

1. 安装 Python >= 3.8

2. 安装 FFmpeg , 并设置 FFmpeg 环境变量

Win+R 快捷键打开运行对话框。
输入 rundll32 sysdm.cpl,EditEnvironmentVariables。
在用户变量中找到 Path。
点击新建，输入 FFmpeg 的路径。示例：D:\APP\ffmpeg\bin（请根据自己的实际路径调整）。

3. 下载依赖库

运行 install.bat，等待安装所有依赖库
运行 webui.bat，启动项目。

使用 GPU 运行

项目默认的 Pytorch 为CPU版本，若要使用 GPU，请重新安装 Pytorch

1. 下载 CUDA

安装 CUDA（必须12以上版本）
对于 CUDA11，可以参考下方:CUDA12 之前的版本如何使用

2. 安装 PyTorch

卸载之前的CPU版本（若已经运行过install.bat）
```
pip uninstall torch -y
pip uninstall torchvision -y
```
安装对应版本 PyTorch（请注意版本要和CUDA对应）

3. CUDA12 之前的版本如何使用?

说明：由于Faster-whisper的最新版本仅支持 CUDA12。对于 CUDA11，当前的有效解决方法是降级ctranslate2。
```
pip install --force-reinsall ctranslate2==3.24
```

TODO

识别相关

翻译相关

字幕相关

其他

注：含`*`的功能还不稳定，可能存在某些BUG。

特别鸣谢

本人是 AI 时代的受益者，本项目的开发基本是站在巨人的肩膀上实现的。主要基于 OpenAI 开发的 Whisper 来识别声音和 LLMs 辅助翻译字幕，利用 Streamlit 搭建快速使用的 WebUI 界面，以及 FFmpeg 来实现字幕与视频的合并。

Name		Name	Last commit message	Last commit date
Latest commit History 122 Commits
config		config
models		models
project		project
public		public
utils		utils
1_install.bat		1_install.bat
2_webui.bat		2_webui.bat
AAVT.py		AAVT.py
LICENSE		LICENSE
README-EN.md		README-EN.md
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Chenyme-AAVT V0.7.1

给一颗免费的星鼓励一下叭~感谢!!!

项目亮点

如何安装

使用 CPU 运行

1. 安装 Python >= 3.8

2. 安装 FFmpeg , 并设置 FFmpeg 环境变量

3. 下载依赖库

使用 GPU 运行

1. 下载 CUDA

2. 安装 PyTorch

3. CUDA12 之前的版本如何使用?

TODO

识别相关

翻译相关

字幕相关

其他

注：含`*`的功能还不稳定，可能存在某些BUG。

特别鸣谢

非常感谢 OpenAI 、 Streamlit 、 FFmpeg 、Faster-whisper、kimi 等开发人员！

如有问题和建议，随时联系我!

项目界面截图

主页面

设置

日志

音频

视频

视频生成

视频二次修改

About

Releases

Packages

Languages

License

popsc30/Chenyme-AAVT

Folders and files

Latest commit

History

Repository files navigation

Chenyme-AAVT V0.7.1

给一颗免费的星鼓励一下叭~感谢!!!

项目亮点

如何安装

使用 CPU 运行

1. 安装 Python >= 3.8

2. 安装 FFmpeg , 并设置 FFmpeg 环境变量

3. 下载 依赖库

使用 GPU 运行

1. 下载 CUDA

2. 安装 PyTorch

3. CUDA12 之前的版本如何使用?

TODO

识别相关

翻译相关

字幕相关

其他

注：含*的功能还不稳定，可能存在某些BUG。

特别鸣谢

非常感谢 OpenAI 、 Streamlit 、 FFmpeg 、Faster-whisper、kimi 等开发人员！

如有问题和建议，随时联系我!

项目界面截图

主页面

设置

日志

音频

视频

视频生成

视频二次修改

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

3. 下载依赖库

注：含`*`的功能还不稳定，可能存在某些BUG。

Packages