このソフトウェアは、音声コーパスの作成を容易にするために設計された音声録音ヘルパーです。 ファイル名の管理や録音スクリプトの表示を自動化することで、コーパス録音のプロセス効率化を実現します。
音声コーパスの表示と録音機能、ファイル管理機能を備え、今までのコーパス作成で大変だったコーパス原稿の確認、ファイル名管理、再録音の作業を効率化します。
- Corpus Display: アプリケーションがサポートする音声コーパスを簡単に閲覧できます。
- Recording Functionality: ガイド付きプロンプトで声を録音し、コーパス作成時の一貫性と品質を保証します。
- Automated Management: コーパスファイル名と録音スクリプトの管理を自動で行い、手作業と潜在的なエラーを減らします。
- 自動ルビふり 提供されたコーパスに対して、pykakasiを用いて自動読み仮名ふりを行います。原稿に読み仮名が自動生成されるため、原稿の読み間違えリスクを軽減します。
-
ita-corpus - ITAコーパスは、合計424文からなる,音素バランスを考慮したパブリックドメインの日本語テキストコーパスです.<パブリックドメイン> https://github.com/Haruqa/ita-corpus
-
JVNV - JVNVは,言語音声と非言語音声から成る日本語感情音声コーパスです.<CC BY-SA 4.0> https://sites.google.com/site/shinnosuketakamichi/research-topics/jvnv_corpus
-
JSUT - JSUT コレクションは,声・歌・音声模倣をつなげるための音声コーパスです.<CC BY-SA 4.0> https://sites.google.com/site/shinnosuketakamichi/publication/jsut
-
JVS voiceactress100 - JVSコーパスvoiceactress100は、声優統計コーパス部族のバランス分に対して句読点情報が付与されたものになります。日本声優統計学会にて推奨されているコーパスです <CC BY-SA 4.0> https://sites.google.com/site/shinnosuketakamichi/research-topics/jvs_corpus
※コーパスの追加依頼がございましたらissueより提案ください。
Voice Recording Helperをインストールするには、システムにPython(開発バージョン:3.10.13)がインストールされている必要があります。
Python環境準備後、以下の手順で始めましょう:
- リポジトリをクローンするか、ソースコードをダウンロードしてください。
- ソースコードがあるディレクトリで端末またはコマンドプロンプトを開きます。
- 必要な依存関係をインストールするために、次のコマンドを実行してください:
pip install -r requirements.txt
必要な依存関係をインストールした後、Streamlitを使用してアプリケーションを開始できます。
起動するには、端末またはコマンドプロンプトで次のコマンドを実行するか、run.bat
を実行してアプリケーションを開始できます。
streamlit run app.py
これにより、ウェブブラウザでアプリケーションが開始されます。画面上の指示に従って、音声コーパスを閲覧および録音してください。
録音された音声データは、同一ディレクトリ内のsaveフォルダーにwavファイルが保存されます。
A: コーパスレコーダーでは、/modules/corpus_dict.pyを編集することによって簡単に、任意のコーパスを追加することができます。詳細は、corpus_dict.pyを参照ください。
A:コーパスの追加依頼は、Github issueよりご依頼ください。
対応ボイスコーパスの追加依頼、バグの報告がありましたら、Issuue機能より相談ください。
このソフトウェアはMITライセンスの下でリリースされています。詳細については、ソースリポジトリのLICENSEファイルを参照してください。
This software is a Voice Recording Helper designed to facilitate the creation of voice corpora. It streamlines the process of corpus recording by automating file name management and the display of recording scripts. With features to display and record voice corpora, this tool simplifies the previously complex tasks involved in corpus recording, making it more efficient and user-friendly.
- Corpus Display: Easily view the voice corpora that are supported by the application.
- Recording Functionality: Record your voice with guided prompts, ensuring consistency and quality in corpus creation.
- Automated Management: Automatically handles the management of corpus file names and recording scripts, reducing manual effort and potential errors.
To install the Voice Recording Helper, you need to have Python installed on your system. Follow these steps to get started:
- Clone the repository or download the source code to your local machine.
- Open a terminal or command prompt in the directory where you have the source code.
- Run the following command to install the required dependencies:
pip install -r requirements.txt
After installing the necessary dependencies, you can start the application using Streamlit. To do so, run the following command in the terminal or command prompt:
streamlit run app.py
This will start the application in your default web browser. Follow the on-screen instructions to view and record voice corpora.
We welcome contributions from the community. Whether it's improving the documentation, fixing bugs, or adding new features, your contributions are appreciated. Please feel free to fork the repository and submit pull requests.
This software is released under the MIT License. See the LICENSE file in the source repository for more information.