VoiceTraining

 

概要

『VoiceTraining』は与えられたVSQファイルのDYNと出力を調整するアプリです。

VOCALOID2では、フレーズ、歌詞により自動調整されるため、実際の出力とDYNが比例していません。そこで、与えられたVSQファイルのDYNが実際の出力になるように補正したVSQファイルを生成します。

一言で言ってしまえば、『DynAdjust』のVSQ版です。『DynAdjust』も『VoiceTraining』も必ずしも期待した通りの出力が得られるとは限りません。近づける努力はします。努力と言っている辺り…効果は察してください。間違っても『VocaListener(ぼかりす)』のようなものを期待してはいけません。

『VoiceTraining』は処理の過程で『VOCALOID2 Editor』を起動します。『VoiceTraining』起動中は『VOCALOID2 Editor』の操作はしないでください。

EXEと同じフォルダにTempフォルダを作成し、その中にテンポラリファイルを作成します。

EXEと同じフォルダにINIファイルを作成します。INIファイルが作成できる場所に置いてください。

『VoiceTraining V0.10』

EXEと同じフォルダに『はちゅねのないしょ』様にて公開されている『VSQBridge.exe』『VSQ2WAV.exe』を置く必要があります。

『VoiceTraining V0.11』

EXEと同じフォルダに『はちゅねのないしょ』様にて公開されている『VSQBridge.exe』を置く必要があります。

『VoiceTraining V0.12』以降

『VSQBridge.exe』『VSQ2WAV.exe』は不要です。

 

注意事項

『VoiceTraining』は原則フリーウェア扱いとしますが、商用利用に関しては作者の承諾を得る必要があるものとします。
また、作者の承諾なしに『VoiceTraining』を再配布することを禁止します。(メール等の連絡手段は公開しておりませんが…)

使用制限はVocaloid関連で議題として上げられている著作権等の問題に対する配慮のつもりです。
個人的な私的利用に関して制限をかけるものではありません。

『VoiceTraining』により生じたいかなる損失も作者は一切の責任を負いません。自己の責任においてお使いください。
Windows2000上で作成されています。他OSでの動作は未知です。

『VOCALOID2 Editor Version 2.0.4.1』に依存する可能性のある処理が含まれています。さらに、『VoiceTraining V0.11』以降はWindows2000に依存する可能性のある処理が含まれています。ご注意ください。

『VoiceTraining V0.12』において、手動でVSQ→WAV変換を行うことで環境に依存しないようにする処理を追加しました。

 

更新履歴

Ver 0.12    2008.09.10    VoiceTraining_v012.zip
        音量差圧縮処理追加。
        環境依存処理を手動で行うことにより、非依存にする処理を追加。

Ver 0.11    2008.08.30    VoiceTraining_v011.zip
        レンダリングを『VSQ2WAV』から『VOCALOID2 Editor』に変更。
        出力VSQの精度をそのままに保つように変更。
        DYN調整アルゴ変更。

Ver 0.10    2008.08.28    VoiceTraining_v010.zip
        どの程度耐久力があるかは未知。フォーマット解析等に不安あり。
        仕様未公開の物に対応したアプリのお約束事項。取り扱い注意。


余談

VSQからWAVにした際の実際の出力を得る為、レンダリング(VSQ→WAV変換)を行います。

レンダリング処理において、外部アプリを起動します。

『VoiceTraining V0.10』

『VSQBridge』      VXT→VSQ変換(VSQとしては不完全)
『VOCALOID2 Editor』 不完全なVSQファイルを完全なVSQファイルに変換
『VSQ2WAV』      VSQ→WAV変換

『VoiceTraining V0.11』

『VSQBridge』      VXT→VSQ変換(VSQとしては不完全)
『VOCALOID2 Editor』 VSQ→WAV変換。

『VoiceTraining V0.12』以降

『VOCALOID2 Editor』 VSQ→WAV変換。

内部処理は音符(歌詞)単位に値を測定し、測定値に合わせて調整するだけです。音量測定は音符単位ですがVSQへの書き込み精度はV0.10で四分音符の1/16、補間1/48。V0.11以降は使用したVSQの精度が維持されます。VOCALOID2は楽譜通りに歌うわけではないので、実際の発声位置の微妙なズレ、子音強度、音量調整機能の影響等により単純なアルゴでは補正に限度があります。

例えば『あ』『い』と個別に発声させた場合と『あい』と発声させた場合、同じDYN値を指定しても実際の出力は異なります。調整処理の過程でも同様にVOCALOID2の音量調整機能の干渉を受ける為、期待値に完全に収束させるのは困難です。処理結果、最大誤差の最も小さいVSQを出力します。

DYNだけでなくPIT等を含めた高精度な調整(ミリ秒単位での調整)は今のところ考えていません。これは理論的に不可能ということではなく、労力対効果が割りに合わないという判断によるものです。高精度な調整を行うには VOCALOID2の内部仕様が詳細に公開されない限り困難を伴います。先行発声、音量調整機能、DYN&PITの応答時間等、ミリ秒の世界では無視できない問題となります。

VoiceTraining V0.10 追記

『VSQ2WAV』のWAV変換に少々問題があるかもしれません。音が欠けたり、最後が切れることがあるようです。詳細は調べていません。当方の問題、VSTiの問題の可能性もありますので、『VSQ2WAV』開発元への問い合わせはご遠慮ください。当サイト公開アプリは人柱用です。ご理解ください。
暫定処置として『VSQ2WAV』の生成した最後のWAVファイルを出力VSQの拡張子をWAVとした形で残すようにしました。音欠けが気になる方は確認してください。

『VOCALOID2 Editor』の出力と『VSQ2WAV』の出力とを比べると微妙にテンポズレしていることが分かりました。少し長めのVSQを扱うと音の位置ズレが無視できなくなります。『VSQ2WAV』には手を付けたくないので『VOCALOID2 Editor』にレンダリングさせる方向で考えていますが、この修正を加えると、『VOCALOID Editor』のバージョン依存(この依存はかなり甘いはずで他バージョンでも動く可能性が高い)に加え、OS依存がほぼ確定します。開発元はWindows2000ですから『VoiceTraining V0.11』以降、Windows2000限定になりそうです。

『VOCALOID2 Editor』、OSのバージョン依存になるのは、ユーザ操作をプログラムで擬似的に再現する為です。レンダリングを手で行うのと同様の動きをするように、プログラムで『VOCALOID2 Editor』を操作します(『VOCALOID Editor』のバージョン依存処理)。途中、ファイル選択ダイアログがでますので、ファイル選択ダイアログ操作がOS依存になります。

VoiceTraining V0.11 追記

レンダリング処理を『VSQ2WAV』から『VOCALOID2 Editor』に変更しました。V0.10追記に記した通り、バージョン依存処理が増えています。同じ環境であっても確実に動くという保証はありません。

レンダリングを『VOCALOID2 Editor』に変更したことによりV0.10に比べ、DYN調整誤差の収束が早くなっています。V0.10開発時に問題となっていた事柄の多くが音の位置ズレによるものである可能性があり、『VOCALOID2 Editor』に変更したことにより改善されているのかもしれません。

アプリ同様、『VoiceTraining』も放置される可能性大です。

 

本サイトのVocaloid関連ソフトウェアのTOPは

http://www15.plala.or.jp/whimsoft/Vocaloid/index.html

になります。