WaveCapture

 

概要

VOCALOID2 Vocaloid Editor の拡張プラグイン『はちゅねのないしょ』の『TextEdit』用外部アプリです。『TextEdit』に添付されている『TextEdit.txt』を熟読し登録してください。

WaveCaptureはWAVファイルからDYNとPITを取り込むアプリです。取り込みは四分音符の1/16単位で行い、3倍の1/48に補間して書き込みます。取り込み精度を上げる(時間間隔を短くする)ことは可能ですが、今のところ考えていません。
※V0.16に倍精度を実装しました。

取り込みにはボーカル音声のみ、44.1KHz、16ビットモノラルのPCMファイルを想定しています。取り込み精度の都合で細かい波はうまく反映できない場合がありますが、取り込み位置をずらすことにより改善できることがあります。

対応音域の都合で音域はC3〜B3を中心としたもの(女性ボーカル)推奨です。

類似機能を持つアプリとしてはMikuMikuVoice(MMV)が有名です。MMVはWAVファイルからVSQファイルを生成するアプリです。

EXEと同じフォルダにINIファイルを作成します。INIファイルが作成できる場所に置いてください。

蛇足になりますが『TextEdit』用外部アプリはVXT形式のTrack.txtを与えれば単独で起動することができます。

 

注意事項

『WaveCapture』は原則フリーウェア扱いとしますが、商用利用に関しては作者の承諾を得る必要があるものとします。
また、作者の承諾なしに『WaveCapture』を再配布することを禁止します。(メール等の連絡手段は公開しておりませんが…)

使用制限はVocaloid関連で議題として上げられている著作権等の問題に対する配慮のつもりです。
個人的な私的利用に関して制限をかけるものではありません。

『WaveCapture』により生じたいかなる損失も作者は一切の責任を負いません。自己の責任においてお使いください。
Windows2000上で作成されています。他OSでの動作は未知ですが特殊な処理は含まれていません。
どの程度実用に耐えるかは未知数です。動作テスト不足。今後バグFIX等行うかどうかも不明です。

 

更新履歴

Ver 0.17    2008.10.07    WaveCapture_v017.zip
       PIT算出処理のバグ修正。

Ver 0.16    2008.09.17    
       倍精度取り込み、PBS倍取り込みを実装。
       『取り込み感度を下げる』オプションを廃止しONに固定。

Ver 0.15    2008.08.18    
       PIT算出アルゴ調整。

Ver 0.14    2008.08.15    
       PIT算出アルゴ調整。『取り込み感度を下げる』を追加。

Ver 0.13    2008.08.14    
       波形ウインドウの目盛り表示間隔変更。取り込み時にプログレスバー表示。PIT算出アルゴ強化。

Ver 0.12    2008.08.11    
        PIT算出アルゴのみ変更。v0.11に比べノイズの影響を受け易いはず。一長一短あり。

Ver 0.11    2008.08.08    
        ユーザインターフェイス強化。細かい処理に手抜きあり。      

Ver 0.10    2008.08.02    
        どの程度耐久力があるかは未知。フォーマット解析等に不安あり。
        仕様未公開の物に対応したアプリのお約束事項。取り扱い注意。


余談

WAVファイルから情報を取り込めばオリジナル通りに歌うというほどVocaloidは甘くありません。過度な期待はなさらないように。使用するボーカル音声はエフェクトが掛かっていない方が良いようです。聞くに堪えないものに変換されることもありますが仕様です。諦めてください。

VXT形式の都合上、テンポの入力が必要です。テンポ以外にTimeFormatが必要なのですがTimeFormatは480固定としています。また、PBSは書き込みませんが2固定としています。
※V0.16の倍精度実装に伴い、PBS(2or4)を書き込むようにしました。

取り込み間隔が四分音符の1/16(補間により1/48)と粗いのは作者の好みによるものです。ある程度細かく取得すると、毛羽立った波形になります。滑らかにするには、その上に最小二乗法等を用いなければならなくなり、中途半端に細かく取り込む意義が薄いという判断です。高精度で取り込むとDYN,PITのデータ量が膨大になりますので、Vocaloid EditorのVSQファイルの読み込み、書き込みが極端に遅くなります。大きいVSQファイルを扱う人には不都合でしょう。
※V0.16に倍精度を実装しましたが、倍精度の方が再現性が高くなるとは限りません。

DYNは実際の出力と比例していません。Vocaloidの仕様で発声する言葉にかなり左右されるようです。DYNは『VoiceTraining』を使用することにより、ある程度改善することができます。

PITは子音の影響等もあり、うまく取り込めない場合があります。算出アルゴ強化で改善できる可能性はありますが、弊害を生む可能性もあり、過度に賢いアルゴにはしていません。

『WaveCapture』の取り込みはVSQと対になったボーカル音声を想定していますが、DYN,PITを取り込むだけですので、極端な話、単音であれば肉声である必要はありませんし、PITもデータ化してしまえば音符からの相対値になります。DYN,PITを抽出し調整することにより、元となったボーカル音声とは異なる音程の異なる歌詞にしてしまうことも可能です。PBS4で取り込み、PBSを下げ音程調整すれば音痴も改善できます。美味く活用していただければ幸いです。

他アプリ同様、『WaveCapture』も放置される可能性大です。

 

追記

下記の画像は『初音ミク』で生成したWAVファイルを『WaveCapture』で取り込んだもののPIT部の画像。
Vocaloidの仕様、取り込み精度の問題等で完全に一致するわけではありません。
PITが変動していない部分は無音(音符なしor取り込み失敗)です。

オリジナル

WaveCapture 単精度での取り込み結果

WaveCapture 倍精度での取り込み結果

 

上記とは別データですがサンプル(Ver 0.16使用)を一つ。ハレ晴レユカイ.vsq ハレ晴レユカイ.wav

著作権上、問題がありそうな気もしますが、この長さで著作権を主張するものでもない気もします。
不都合があるようでしたら削除します。(それとは別に本サイトのアクセスが極端に増えるようなことがあれば削除するつもり。)

『ハレ晴レユカイ ハルヒVer』の冒頭、『なぞなぞみたいに』という部分だけを取り込んだものです。
有名であり、元音声もYouTube等で試聴できることから取り込んでみました。

サンプル作成は『WaveCapture』『NoteMove』『VoiceTraining』を使用しました。手作業による加工はしていません。
単にDynamicsとPitchBendを取り込んだだけでは、この程度にしかなりません。
『WaveCapture』では書き込んではいませんが、先頭部分(『なぞなぞ』の『な』の前)のDYNを0にした方が良いようです。
先行発声部分に掛かるDYN&PITの影響は未調査ですが、影響はある模様。

PITがパルス状に乱れる場合、実際の音声の周波数が取得範囲外になっている可能性があります。音符の位置(音程)を調整してください。

機械的に作られたものは別として、見慣れてくると取り込まれた波形が何種類かに分類可能で、ある程度の規則性があるということに気が付くのではないでしょうか?。であれば、基本となる波形は限られていて、その組み合わせ+必要によりビブラート付与で基本的な部分は済むということになります。ビブラートはVOCALOID Editorに任せるとすれば、発声語、前後関係により基本波形決定。前後を滑らかに繋げ感情を表現する為に基本波形に加算&乗算という操作ができれば、音声データ無しでもそれなりのものができそうです。取り込みデータを正規化(整形)するという実装方法もあるでしょう。

これは作成当初から予測していたことで、NoteEditに波形セーブ&ロード機能を付けている理由でもあります。NoteEditは諸問題放置の当座しのぎ版で実用には厳しいですが、自動で個々の音に基本波形を決定。その後、ユーザ修正という流れのアプリがあれば実用的でしょう。私は作る気力はもう無いですが、その程度の機能はVOCALOID Editor標準で用意して欲しいものです。

 

本サイトのVocaloid関連ソフトウェアのTOPは

http://www15.plala.or.jp/whimsoft/Vocaloid/index.html

になります。