VsqMaker
概要
『VsqMaker』はWAVファイルからVSQファイルを生成するアプリ(採譜アプリ)です。
WAVファイルは日本語ボーカル音声のみ、音域C3〜C4程度、44.1KHz、16ビットモノラルのPCMファイルを想定しています。WAVファイルの前方2秒、後方1秒程度は無視されます。エフェクトの掛かっていないものが好ましいでしょう。
精度はあまり高くありません。『WaveCapture』を用いる際に使用するVSQファイルの雛型を作成する程度のものとお考え下さい。『VsqMaker』が算出するVSQファイルは人間の期待する音程にはなりません。
EXEと同じフォルダにTempフォルダを作成し、その中にテンポラリファイルを作成します。
注意事項
『VsqMaker』は原則フリーウェア扱いとしますが、商用利用に関しては作者の承諾を得る必要があるものとします。
また、作者の承諾なしに『VsqMaker』を再配布することを禁止します。(メール等の連絡手段は公開しておりませんが…)
使用制限はVocaloid関連で議題として上げられている著作権等の問題に対する配慮のつもりです。
個人的な私的利用に関して制限をかけるものではありません。
『VsqMaker』により生じたいかなる損失も作者は一切の責任を負いません。自己の責任においてお使いください。
Windows2000上で作成されています。他OSでの動作は未知です。
更新履歴
Ver 0.10 2008.10.14 VsqMaker_v010.zip
どの程度耐久力があるかは未知。フォーマット解析等に不安あり。
仕様未公開の物に対応したアプリのお約束事項。取り扱い注意。
余談
音声を精度良く音節に分解するのは難度が高く、実用に耐えるレベルのVSQファイルを作ることは困難と考えています。
内部定数を操作することである程度は歌詞分解性能が改善しますが、内部定数を操作しても『VsqMaker』では特定の語の組み合わせを分割することができません。
※作者の手抜きによりUIによる定数操作はできません。
テストデータ不足により、声質により出来が大きく左右されるかもしれません。データ検証不足。
手軽に済ませたいのであれば『MikuMikuVoice』の方が良いでしょう。中の人の趣味の問題で本サイトはオートマ志向ではなくマニュアル志向です。マニュアル志向にした方がユーザ編集による自由度が高いという判断です。ツールとしての完成度が低いということでもありますが…。
※現在は本サイトにて『MikuMikuVoice』相当品である『VoiceCapture』が公開されています。
お好きな方をお使いください。作者としては『VoiceCapture』を推奨しておきます。
使い方の例
1.『VsqMaker』でWAVファイルからVSQファイルを作成する。
2.作成したVSQファイルを『Vocaloid Editor』で読み込み、『WaveCapture』を起動する。
3.『WaveCapture』のテンポを120にし、位置情報を初期化する。
基本情報固定のチェックボックスを外しテンポを一旦変更する等すれば位置情報が初期化されます。
『VsqMaker』で作成したVSQファイルの初期位置は元となったWAVファイルに一致します。4.『WaveCapture』にVSQ生成時に使用したWAVファイルを指定し各音符を再生。正しいか確認し誤りがあれば手動で修正。
『WaveCapture』は前回終了時の位置情報を記憶していますのでVSQファイルを変更した場合は位置情報の初期化を行ってください。5.『WaveCapture』でWAVファイルの音と音符の開始位置を合わせ、編集内容ファイル(WCX)を作成する。
6.『NoteMove』に編集内容ファイル(WCX)を与え、VSQファイルの音符位置を調整した後『Vocaloid Editor』で音符長を調整し、歌詞を入力する。
7.『WaveCapture』でDYN, PITを取り込み、必要であれば『VoiceTraining』を掛けて完成。
アプリ同様、『VsqMaker』も放置される可能性大です。
追記
現状、母音や『ん』の連結は内部定数を操作してもうまく分割できません。
これは音量ベースのアルゴを用い子音が入ることによる音量減少を判断材料にしている為です。
音量変化を判断材料にしていることから、ビブラートも分割対象となってしまい過剰分割する傾向にあります。
(現行版はビブラートを無視する処理の影響で分割可能な音節でも分割しないことがあります。)
プログラム作成労力を考慮すると、現状以上のアルゴを求めるのは困難と判断しています。
現在のアルゴのまま、内部定数を操作するユーザインターフェイス(UI)を作成しユーザによる調整を行った後、
過剰分割部の結合、ユーザ指定の強制分割、歌詞の入力を行えば、VSQ生成から調整までを行うことも完成度は別として手が届く領域になってきます。
WAV(原音)を音節分解しVSQ(1)を生成。VSQ(1)からWAV(2)を生成し音節分解したVSQ(2)を生成。
VSQ(1)とVSQ(2)の時差を反映させたVSQ(3)を生成しVSQ(3)に原音を取り込むことにより、そこそこ安定した取り込み結果がテストした範囲内では得られていますが、プログラム作成量対効果という面では割に合わない気がしています。
※上記はテストの為、それぞれのVSQは手作業による修正を加えての検証です。
コスト対効果によりこの案は破棄されており、安定した取り込みは現在の『VoiceCapture』で事が足りると考えています。
本サイトのVocaloid関連ソフトウェアのTOPは
になります。