Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

fix!: StyleVersionSpeakerVersion #931

Merged

Conversation

qryxip
Copy link
Member

@qryxip qryxip commented Jan 22, 2025

内容

関連 Issue

その他

おそらく #370 の時点から、2年間私含め誰も気付かなかったことになります。「リリースは小まめにやった方がよい」にまた一つ説得力が発生してしまった!

Copy link
Member

@Hiroshiba Hiroshiba left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

!!!

これちょっとかなりややこしいんですけど、StyleVersionがどちらかというと合っていて、ドキュメントの「話者のバージョン。」がずれているかもです!
でも将来的なことを考えると、これは話者のバージョンを意味していた方が良さそう。なのでこのプルリクエストの形にするのが良さそう!!


整理すると・・・

  • スタイルごとにバージョンがある想定、1つのスタイルだけバージョンが上がる可能性もあり得る
  • ただ現状、1つのmetas.json内に含まれる同一話者の別スタイルは全て同じバージョン
  • なのでSpeakerMeta内にスタイルのversionがある
    • という解釈だけど、もともとスタイルを増やす想定をしていなかったので、話者の下にversionを作ってしまったのが根本にある

という感じ。で、話者ごとにバージョンを作るか、スタイルごとにするかだけど、

  • もし話者ごとに共通のバージョンとすると、1つのVVMにスタイルを追加したとき、その話者が含まれる全VVMのその話者のバージョンを上げる必要がある
    • 別にこの運用でも良いかもしれない
  • スタイルごとにバージョンを付ける場合、1つの話者の複数のスタイルがバラバラのバージョンになる可能性がある
    • 特に問題にはならない・・・・・はず・・・?
  • 将来的に1つのVVMの中に複数の同種のonnxモデルを搭載できるようになると便利そう
    • こうなるとSpeakerMetaの直下にStyleVersionがある場合に辻褄が合わなくなる

どっちの方がいいかわからないけど、とりあえずの運用として、SpeakerMetaの直下にあるversionはSpeakerVersionじゃないといけなそう!
ということで冒頭のコメントをした次第でした。

もし真のStyleVersionを作るなら、stylesの下に置く必要がありそう。
まあ必要になったらで良さそう!

Copy link
Member

@Hiroshiba Hiroshiba left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

LGTM!!

そういえば将来的にソングが増えた時、SpeakerをCharacterにした方が良いかもです!
もう0.16までに変えてしまってもいいかも?

@qryxip qryxip mentioned this pull request Jan 23, 2025
@qryxip qryxip merged commit d55e408 into VOICEVOX:main Jan 23, 2025
30 checks passed
@qryxip qryxip deleted the fix-rename-style-version-to-speaker-version branch January 23, 2025 13:37
qryxip added a commit that referenced this pull request Jan 25, 2025
ソングを見据え、エンジンの内部実装のように「キャラクター」としてしまう。

これで`speaker_uuid`と(**何故か残っている**)`speaker_id` ("話者ID")以
外、"speaker"/"話者"という表現は消える。

BREAKING-CHANGE: `SpeakerMeta` → `CharacterMeta`。
BREAKING-CHANGE: `SpeakerVersion` → `CharacterVersion`。

Refs: #931 (review)
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants