VoiceCapture

 

■概要

WAVファイル(日本語ボーカル音声のみ)からVSQファイルを作成するVSQ作成補助アプリケーションです。
精度には留意しているつもりですが、人手による修正が入ることを前提に作成されています。

有名な『MikuMikuVoice』の類似品。本サイト過去の試作品の『VsqMaker』+『WaveCapture』+『VoiceTraining』に当たるアプリです。

取り込みにはボーカル音声のみ、44.1KHz、16ビットモノラルのPCMファイルを使用してください。
エフェクトの掛かっていないもの、残響音の少ないものが好ましいでしょう。

EXEと同じフォルダにINIファイルを作成します。INIファイルが作成できる場所に置いてください。

EXEと同じフォルダにTempフォルダを作成し、その中にテンポラリファイルを作成します。

       

 

■注意事項

『VoiceCapture』は原則フリーウェア扱いとしますが、商用利用に関しては作者の承諾を得る必要があるものとします。
また、作者の承諾なしに『VoiceCapture』を再配布することを禁止します。(メール等の連絡手段は公開しておりませんが…)

使用制限はVocaloid関連で議題として上げられている著作権等の問題に対する配慮のつもりです。
個人的な私的利用に関して制限をかけるものではありません。

『VoiceCapture』により生じたいかなる損失も作者は一切の責任を負いません。自己の責任においてお使いください。
Windows2000上で作成されており、環境に依存する可能性がある処理が含まれています。
『VOCALOID』,『VOCALOID2』の仕様は未公開の為、独自の調査により作成せざるを得ない部分があり、
多くの環境で動作するようになっているとは思いますが、お使いの環境で動作するとは限りません。
どの程度実用に耐えるかは未知数です。動作テスト不足。今後バグFIX等行うかどうかも不明です。

『VoiceCapture』で作成したVSQを用いて音声や動画等を作成し公開する場合、
可能であれば『VoiceCapture』を使用していることを明記してください。
作者が今後バグ修正等を行うかの判断材料になります。

 

■更新履歴

Ver 0.20    2011.08.13    VoiceCapture_v020.zip
        音符指定ダイアログで音階を変更した場合、音階再計算を行う。
        歌詞ウインドウ入力時、SHIFTキーを押していれば一つ目の発音記号だけが入力される。
        歌詞ウインドウのシステムメニューにページ切り替えを追加。
        区間分割処理と区間単位での音量、音高を操作する機能を追加。
        CsvEdit実行機能追加。
        全体の音階を±6までシフトする機能を追加。
        発声評価による補正VSQファイル作成機能を追加。
        その他、仕様調整等。

        ※V0.19aとV0.20とでは補正VSQファイル作成処理結果に若干の差異が生じます。
         V0.19形式のVCXファイルを読み込めますが、保存形式はV0.20形式となり下位互換はありません。

Ver 0.19a    2010.04.14    VoiceCapture_v019a.zip
        周波数詳細解析処理の調整。

        ※詳細解析処理の精度がV0.18より大きく劣るケースが確認されたため改訂しました。
         VCXはV0.19とフォーマットの互換性はありますが、WAV+CSVで再構築してください。
         音符指定ダイアログのPitchBend値は測定値からの差分として管理されていますので、
         V0.19とV0.19aとではPitchBend指定の結果に差異が生じます。

        ※本ページ掲載サンプルを VoiceCapture v0.19a で作成したものに差し替えました。

Ver 0.19    2010.03.31    
        連続した区間を連結し1音としてVSQに書き込む機能を追加。
        音符指定ダイアログに表示されるグラフ内容の変更、追加。
        波形グラフに信頼度表示を追加等、ユーザインターフェイス調整。
        解析処理の高速化と調整。
        VSQ生成時のDYN, PITの補間アルゴリズム変更。
        CSVファイル仕様拡張。
        その他、機能調整等。

Ver 0.18    2009.12.14    
        『VOCALOID』用の『音符指定ダイアログ』追加。
        CSVファイル仕様拡張
        その他、機能調整。

Ver 0.17    2009.11.06    
        従来の『Rendering.exe』を『Rendering2.exe』に名称変更。
        『VOCALOID Editor』用の『Rendering1.exe』を追加。
        音符割全体を移動させる機能を追加。
        補正VSQ生成処理に基礎データのキャッシュ機能を追加。
        音符付加情報全初期化追加。
        波形グラフに歌詞表示追加。
        波形グラフの右ダブルクリックに波形リストとの同期機能追加。
        その他、機能調整。

Ver 0.16    2009.07.01    
        VSQファイルから時刻、音階、歌詞、発音記号を読み込む機能を追加。
        音量補正処理アルゴリズム変更。機能統廃合、調整等。
         ・音符内DYN補正処理をベースとした補正処理に変更
         ・発声評価によるVSQ生成機能削除
         ・音量補正VSQファイルの無音区間のDYN上限指定削除
         ・音符指定ダイアログ関連の仕様調整
         ・その他、機能調整

Ver 0.15    2009.06.07    
        音符の表情コントロールプロパティ等の指定機能追加。
        VSQファイルのテンポ、PBS指定追加。
        音量補正VSQファイルの無音区間のDYN上限指定追加。
        音量補正VSQファイル生成時に同名のWAVファイル生成機能追加。
        PIT補正機能。音量補正VSQファイル作成後、1回限りの演算処理。
        CSVファイル仕様拡張。
        ユーザインターフェイスのバグ修正と変更。

Ver 0.14    2009.02.14    
        『VOCALOID2 Editor』を利用したVSQ→WAV変換アプリケーション『Rendering.exe』を追加。
        音量補正VSQファイル作成に反復修正処理を実装。変更に伴う機能調整。
        歌手選択、スムージング処理、音符内音量補正処理追加。
        歌詞指定ダイアログ追加。
        CSVファイル読み込み処理修正。

Ver 0.13    2009.01.17    
        CSVファイル(時刻、音階、歌詞、発音記号)の入出力。
        WAVファイル初期解析時の音符分割処理に微小音量領域の音符削除処理追加等。
        音符の自動音階決定処理変更。
        周波数解析に高速解析を追加。
        (Ver0.12版相当の周波数解析は詳細解析とし、通常は詳細解析を使用)
        評価値に発声評価を追加したことによる各機能調整。
        画面レイアウト等、表示部の変更他、内部構造変更に伴う修正多数。
        
Ver 0.12    2008.12.31    
        音階算出アルゴリズム調整と内部定数調整等、調整多数。

Ver 0.11    2008.12.28    
        リファレンスファイル読み込みと破棄、音量補正VSQ生成処理(反復修正なし)を追加。

Ver 0.10    2008.12.25    
        どの程度耐久力があるかは未知。フォーマット解析等に不安あり。
        仕様未公開の物に対応したアプリのお約束事項。取り扱い注意。

 

■サンプル

サンプルの提示は著作権上問題がありますが、長いものでも30秒程度に留めています。
ファン活動の一部として好意的に解釈していただけることを期待します。
ZIP(VSQ,MID)はVoiceCaptureで作成したもから該当箇所をVOCALOID EDITORで切り出したもので、
MP3は特に記述が無ければ原曲のオケと合わせたものです。

『初音ミク』会話サンプル。原音は『アニメ 化物語 つばさキャット』。
VoiceCapture_Talk.zip VoiceCapture_Talk.mp3 (Ver 0.19a使用, DYN倍率 8)

『初音ミク』歌唱サンプル。原音は『Dearest -浜崎あゆみ-』。
VoiceCapture_Miku.zip VoiceCapture_Miku.mp3 (Ver 0.19a使用, DYN倍率 8)

『鏡音リン ACT1』歌唱サンプル。原音は『PHANTOM MINDS -水樹奈々-』。
VoiceCapture_Rin.zip VoiceCapture_Rin.mp3 (Ver 0.19a使用, DYN倍率 8, オケ:ニコニコ動画 sm9942184 dango様)

『鏡音リン ACT2』歌唱サンプル。原音は『Pray -水樹奈々-』。
VoiceCapture_Rin_ACT2.zip VoiceCapture_Rin_ACT2.mp3 (Ver 0.19a使用, DYN倍率 12)

『巡音ルカ』歌唱サンプル。原音は『DESIRE -情熱- -中森明菜-』。
VoiceCapture_Luka_JPN.zip VoiceCapture_Luka_JPN.mp3 (Ver 0.19a使用, DYN倍率 12)

『MEIKO』歌唱サンプル。原音は『深愛 -水樹奈々-』。
VoiceCapture_MEIKO.zip VoiceCapture_MEIKO.mp3 (Ver 0.19a使用, DYN倍率 12, オケ:ニコニコ動画 sm6664523 Eleken様)

 

注意) サンプルの出来が使用したボーカロイドの応答性の良し悪しを示すものではありません。
     VSQ1トラックでのサンプルの為、無理もありますし、対象ボカロに対する熟練度、ミックス技術も影響します。
     サンプルはあくまでサンプルですので、志ある方は思う存分手間を掛けて作り直してください。
     ニコニコ動画に公開したサンプルもありますが、多少変更している為、微妙に異なります。

     サンプルは気が向けば差し替えますが、手を掛け始めると切が無いのである程度で妥協しています。
     下記サンプル『SECRET AMBITION -水樹奈々-』は少々古いものです。

 

長いサンプルも用意すべきだろうと悩んだ末、止むを得ずニコニコ動画のIDを取りました。
『VoiceCapture』のみでの作成なので仕上げは少々荒いです。
声質の変化に伴う周波数の乱れが大きい部分は、表現が違うのを承知で音程を割り当てている個所もあります。
この部分を美味く調整するのは『VOCALOID Editor』等による手修正の領域と判断しています。
作者の割り当てミスもあるでしょうから、意欲のある方は修正版でも作ってください。

『SECRET AMBITION -水樹奈々-』。使用ボーカロイドは『鏡音リン Act.1』。
日を置いて聞いてみると、最後の方、特に粗が目立ちますね…もう少し調整すべきでした… orz。

正直、ニコニコ動画の暗黙のルール等、良くわかっていません。
致命的なミスがあれば教えていただけると助かります。

 

■ 余談

『VoiceCapture』は本サイトで公開している過去の試作品の機能を組み合わせて作成されています。
統合の際に仕様調整や不備修正を加えている為、旧アプリを組み合わせて使用しても生成されるVSQファイルとは差異が生じます。

個人的にはしゃべりより歌に使っていただきたいと思っています。
自身が歌うことにより調声するというスタイルがある程度一般化することを期待します。

ボーカロイドに歌わせるために人が歌ったものを用意しなければならないのは本末転倒ではないかと考える人もいるようですが、
入出力を正確に対応付けするというのはデジタル処理の基本であり、全てはここから始まると考えていいでしょう。

音をDYN、PITとして数値化した場合、音符毎に区切れば音程に依存しない再利用可能な素材となります。
これらを繋ぎ合わせれば人間らしく歌わせることができそうです。
DYN、PITを切り貼りするツールがどの程度実用に耐えるのか興味はあるのですが、本件の人柱は辞退することにします。

他アプリ同様、『VoiceCapture』も放置される可能性大です。

 

Ver 0.19追記

音符分割は、ある程度まともに音声認識処理を実装しないと実用レベルは確保できないと考えています。
音符分割処理に小細工を重ねると計算量ばかり増える割に効果が薄い為、音量を指標としたシンプルなものに留めています。
外部音声認識エンジンの利用等も含め、検討すべき項目は多々ありますが音符分割処理強化予定はありません。

音量補正と周波数補正により、理論上は『ぼかりす(VocaListener)』に近い矯正力があるはずです。
作者はキャプチャーツールを作っているだけで、『ぼかりす』を作る気は全くありません。
それでも結果として似てしまうのは類似機能を持つアプリの宿命でしょう。

音量補正が稀に理論値から大きく外れること、
周波数補正が PBS 4 固定で有効範囲内に収まらず十分な補正が得られないことがありますが、
区間分割、音階調整、Dynamics調整等により十分対処できる範囲でしょう。
内部処理 PBS 4 固定の為、音符割り付けに工夫が必要ですが変更予定はありません。

ボーカロイドの仕様で、後に続く音符の先行発声により音符の発声時間が短くなることがあります。
必要に応じてトラック分け等で対処してください。

『VoiceCapture』は『VOCALOID2』に合わせて作成されています。
『VOCALOID』と『VOCALOID2』の音量に関する仕様差は考慮されていません。
その為、補正VSQファイルの出力は『VOCALOID2』使用時に比べ、音量補正の効きが大きく下がります。

補正VSQファイルは原音とレンダリングされたWAVファイルとの比較により調整されます。
補正VSQファイルを別のボーカロイドで使用したり、音符の音高、歌詞を変える等した場合、
補正処理は意味の無いものとなり、出力誤差を拡大させる可能性があります。

 

アプリケーションのデザイン統一やアプリアイコン等…は、実利も画才も無いので現状放置中。
将来的なデザイン統一を検討していない為、今後もリリース毎にいろいろ変わるでしょう。

作者の気力の問題もあり、どこまで開発が継続されるかは未定です。

 

本サイトのVocaloid関連ソフトウェアのTOPは

http://www15.plala.or.jp/whimsoft/Vocaloid/index.html

になります。