Art Studio まほろば

楽譜・フリーソフト・作曲・音楽理論・DTMなど、ミュージシャンに役立つ情報を発信しています。

ボーカルキャンセラー2の使い方

      2016/04/30

CDからWAVファイルを取り出す

本アプリケーションはWindows標準のWAVファイルにのみ対応しています。カラオケ作成を始める前に、まずCDなどからWAVファイルを取り出す必要があります。

CDからWAVファイルを取り出すにはリッピングソフトというものがありますが、最も手軽にできる方法としては、Windows標準のメディアプレイヤーを利用します。MediaPlayer 10以降のバージョンではCDからの取り込みに対応していますので、まだアップグレードしていない方は最新版にアップデートして下さい。以下、MediaPlayer 12の画面で説明します。

mediaplayer_1
メディアプレイヤーを起動してCDを挿入すると、「取り込みの設定」メニューが現れます。ここで「形式→WAV(無損失)」の順に選択します。この設定は一度行うと、次からは必要ありません。

mediaplayer_2
次に取り込みたい曲にチェックマークを付けてから「CDの取り込み」ボタンをクリックすると取り込みが始まります。

取り込まれたWAVファイルは「ライブラリ→ミュージック→マイ ミュージック」の下にフォルダが作成されて保存されていますので、エクスプローラなどで探して下さい。これで準備は完了です。

なおネット配信でダウンロードしたMP3やAACなどのファイルは、ファイルコンバータを利用してWAVファイルに変換して下さい。フリーのソフトがたくさん出回っています。MP3は独Fraunhofer社と仏Thomson社が特許を保有しており、本アプリケーションはライセンスの関係上、今後もMP3に対応する予定はありません。

より便利にお使いいただくため、ほとんどの音声ファイルや動画ファイルからWAVに変換するフリーソフト「何でもWAVに変換!」を開発しました。ボーカルキャンセラー2と組み合わせるために機能を絞っていますので、とてもシンプルになっています。どうぞご利用下さい。

ボーカルキャンセラー2をダウンロード

スポンサーリンク

ボーカルキャンセラー2の各操作部分について詳細に説明します。

vocalcanceler2_screenshot

[ソースファイル]パネル

本アプリケーションで処理可能なファイルは拡張子が".wav"のWAV形式のみです。量子化ビット数が24bit/16bit/8bitのリニアPCMフォーマットのみ対応しています。それ以外の特殊なフォーマットはサポートしていません。サンプリングレートに制約はありませんが、できるだけCDで使われている16bit/44.1kHzを推奨します。Ver.1.54以降では未対応のWAVファイルを入力するとメッセージを表示するようになりました。

またソースは必ずステレオである必要があります。モノラルの音源は原理的に処理できません。ステレオであっても限りなくモノラルに近い音源は処理するとほぼ無音になります。

Ver.1.40より、複数ファイルのバッチ処理が可能になりました。ただし、フリー版ではバッチ処理機能は使えません。ファイルはいくつでも追加することができますが、実際に処理されるのは最初の1ファイルのみとなります。

ファイルリスト

処理の対象となるWAVファイルをファイルリストに追加します。エクスプローラなどからファイルをウィンドウ内にドラッグ&ドロップすることによっていくつでも追加することができます。

ファイルリスト上の一行をクリックすると選択された状態になります。ファイルリストへの操作は選択して反転されたものが対象となります。

追加したファイルの左端にはチェックボックスが付いています。ここにチェックを入れたファイルだけがバッチ処理の対象となります。デフォルトではすべてチェックされた状態になっています。ファイルリストの下にあるチェックボックスをクリックすることにより、すべてのファイルをまとめてチェック、あるいはチェックを外すことができます。

同じファイルを複数追加することもできます。キーチェンジは1行ごとに個別に設定できますので、たとえば同じ曲でキーの異なるバリエーションを自動的に作成することができます。

[ファイルを追加]ボタン

クリックすると「ファイルを開く」ダイアログが開き、ファイル名を選択します。複数ファイルを選択することも可能です。OKボタンをクリックすると選択したファイルがリストに追加されます。

[リストから削除]ボタン

選択されたファイルをリストから削除します。

[クリア]ボタン

リストに追加されているファイルをすべて削除します。

[処理モード]パネル

[ボーカル除去]を選択するとボーカルを除去(低減)し、[ボーカル抽出]を選択するとボーカルを抽出(強調)します。

[帯域除去]を選択すると、下限周波数と上限周波数で設定された帯域を完全に除去します(バンドリジェクトフィルタ)。[帯域抽出]を選択すると、下限周波数と上限周波数で設定された帯域のみ通過させ、それ以外の帯域を完全に除去します(バンドパスフィルタ)。

[キーチェンジのみ]を選択すると、ボーカルカット処理をバイパスしてキーチェンジのみ行います。

[キーチェンジ]パネル

テンポを変えずに曲のキーを半音単位で上げ下げします。±7半音の範囲で指定でき、スライダーを右に動かすとキーを上げ、左に動かすとキーを下げます。0を指定するとキーチェンジ処理を行いません。

バッチ処理では、ファイルリストの1行ごとに個別にキーチェンジを設定することができます。ファイルリストでファイルを選択してからキーチェンジスライダーを動かすことにより、キーチェンジの値が変化します。従来バージョンとの互換性を保つため、ファイルが1個だけの場合に限り、選択しなくてもキーチェンジが反映される仕様になっています。

キーチェンジ処理は原理上、必ず音質が劣化します。特に大きく変化させると音質が大幅に劣化しますので、なるべく±4の範囲内でお使い下さい。

[オプション]パネル

ノーマライズする

このオプションをチェックすると、歪まない範囲で音量を最大まで引き上げて出力します。1ステップ増えますので処理時間がかかります。少しでも処理を速くしたいときや、音量を変更したくないときはチェックを外して下さい。

MIDIファイルを出力する

このオプションをチェックすると、ボーカル抽出を行った後に自動採譜を行い、音高を推定してMIDIファイルを出力します。MIDIファイルは指定した出力フォルダに元のファイル名と同じ名前で出力されます。MIDIファイルはシーケンサーソフトで読み込めますので、ボーカロイドのデータ作成などに利用できます。

このオプションは処理モードが「ボーカル抽出」のときのみ実行されます。

自動採譜は大変難しい技術なので完全ではありません。また単音にしか対応していませんので、和音は推定できません。純粋に歌声だけならほぼ正確に採譜できますが、少しでも楽器音が混じっているとうまく行きません。特にドラムの音が強く残っている音源は無理と考えて下さい。後から必ず修正が必要になりますので、あくまでも耳コピの参考程度にお使いになることをおすすめします。

[自動採譜の設定]ボタン

このボタンをクリックすると、次のようなダイアログが表示されます。

WaveToMidi_dialog

この設定は必須ではありませんが、テンポ・クオンタイズ・拍子を曲に合わせて設定するとシーケンスソフトでの修正作業が楽になります。

入力感度

設定できる値の範囲は-100~0dBです。入力レベルがこの値を下回ると無音とみなし音符を出力しません。余計な音を拾ってしまうときは高めに(0dBに近づける)設定して下さい。また音が出なかったり途切れるときは低めに設定して下さい。

テンポ

設定できる値の範囲は24~240BPMです。単位は1分間あたりの4分音符の拍数を表します。小数点以下も入力できます。この値を曲のテンポと一致させることにより、シーケンサー上での音符の長さが正しく再現されます。

クオンタイズ

MIDIノートに変換される最も短い音符の長さを指定します。つまり時間的な分解能です。これより短い音高の変化は独自のアルゴリズムによって平均化されます。音価を短くするほど細かい音高変化まで再現できますが、微妙な音程の揺れまで拾ってしまうため修正が大変になります。また音価を長くすると細かい音高変化は平均化されて一定になります。通常は16分音符か8分音符で十分ですが、曲に合わせて適切な種類を選択して下さい。

拍子

分母は拍の基準となる音価で、分子は1小節あたりの拍数を表します。これを曲の拍子に合わせて設定すると、シーケンサー上で小節の区切りが一致します。

音色

GMで定義された128音色から選択します。これによってプログラムチェンジが送信されます。

ベロシティー

出力するMIDIノートのベロシティー(強さ)を設定します。設定できる値の範囲は0~127の整数です。

[ユーザー設定]パネル

Ver.1.53より、現在の設定をユーザー設定に登録してワンタッチで呼び出せるようになりました。製品版では10個まで登録することができます。

[ユーザー設定]ドロップダウンリスト

定義済みのユーザー設定を選択すると即座に設定が呼び出されます。[初期設定]を選択すると起動時の状態に戻ります。未登録の設定を選択しても何も起こりません。

[登録]ボタン

登録したいユーザー設定を[ユーザー設定]ドロップダウンリストから選択し、[登録]ボタンをクリックすると現在の設定が登録されます。一度登録するとソフト終了時に自動保存されるため、次回起動したときも有効です。登録済みの設定を選択すると上書きされますので注意して下さい。

登録できるパラメータは次の通りです。

  • 処理モード
  • 振幅許容度
  • 位相許容度
  • フレームサイズ
  • 帯域制限オプション
  • 下限周波数
  • 上限周波数

フリー版ではユーザー登録機能は使えません。

[ファイル出力]パネル

Ver.1.40より、処理されたファイルは出力フォルダへ一括して保存する仕様に変更されました。ファイル名はソースファイル名を元にして自動的に付けられます。

【ファイル命名規則】
処理モードに応じて、元のファイル名の末尾に下記の文字列が追加されます。

ボーカル除去→_rem
ボーカル抽出→_ext
帯域除去→_BRF
帯域抽出→_BPF
キーチェンジのみ→_trs

またキーチェンジを0以外に設定した場合は、さらに末尾に下記の文字列が追加されます。

キーを上げる(#)→_s + 1~7
キーを下げる(♭)→_f + 1~7

[処理開始]ボタン

クリックすると出力先フォルダの選択ダイアログが開きます。ここでファイルを出力したいフォルダを選択して下さい。新しいフォルダを作成することもできます。フォルダを選択してからOKボタンをクリックすると、処理を開始します。マシンパワーにもよりますが、5分程度の曲で30秒ほどかかります。キーチェンジ処理を追加するとさらに時間がかかります。出力されるファイルは16ビット・ステレオ固定となります。サンプリングレートはソースファイルと同じになります。

フリー版では音源の長さが3分45秒を超えた場合、残りの部分はカットされます。

[中止]ボタン

処理中にクリックすると処理を中断します。ファイルは途中まで作成されていますので、パラメータを変更しながら確認したい場合に便利です。なおキーチェンジ処理中に中止すると出力ファイルは空になります。

[詳細設定]パネル

ボーカルカットの処理を行う際のパラメータを調整します。通常はデフォルトのままでほぼうまく行きますが、音源によってはボーカルが消えにくいこともあります。その場合は結果を確認しながら試行錯誤でパラメータを調整してみて下さい。なお処理の実行中にパラメータを操作しても反映されません。

振幅許容度

左右チャンネルでスペクトル比較を行う際、振幅ずれの許容度を設定します。単位はdB(デシベル)です。右へ行くほど許容度が大きくなるのでボーカルを消す効果は強くなります。

位相許容度

左右チャンネルでスペクトル比較を行う際、位相ずれの許容度を設定します。単位は°(度)です。右へ行くほど許容度が大きくなるのでボーカルを消す効果は強くなります。

いずれのパラメータも右へ行くほどボーカルを消す効果は強くなりますが、背景の音まで一緒に消えたり、音質が劣化します。むやみに効果を強めるのではなく、できる限り左寄りでボーカルが消えるポイントを探すのが高音質に仕上げるコツです。また2つのパラメータはそれぞれ相乗的に作用します。片方を右へ、もう片方を左へ動かせば効果はほぼ一定になります。2つを同じ方向へ動かすよりは、逆の方向へ動かした方がより良い結果が得られます。

音源によっては効果を最強にしてもボーカルが残ってしまう場合があります。その場合はボーカルが中央に定位していないなどの問題が考えられますので、残念ながら原理的に取り除くことは不可能です。

なおボーカル抽出の場合は、ボーカル除去とは逆にスライダーを左へ動かすほどボーカルだけを残す効果が強くなります。これは「許容度を超えた成分を消す」という動作になるためです。両方とも左いっぱいまで寄せるとかなりこもった音質になってしまいますので、少し右寄りに動かしてやるとボーカルだけをきれいに取り出せます。これもボーカル除去と同じく、音源によっては背景の音まで一緒に拾ってしまう場合がありますが、それを防ぐことは原理上できません。

フレームサイズ

FFTを実行する際のサンプル数を指定します。本アプリケーションではソースファイルからここで指定されたサンプル数ずつ読み込んでFFTを行い、ボーカルカット処理を行っています。フレームサイズを大きくするほど周波数分解能は向上しますが、時間分解能は低下します。またフレームサイズが小さすぎると処理精度が不足してノイズが発生しやすくなります。一般的にはテンポの速い曲では小さめに、ゆったりした曲では大きめに設定するのが効果的です。プツプツというノイズが気になるときは最大に設定してみて下さい。

帯域制限する

このオプションをチェックするとボーカルが含まれる周波数帯域に限定してボーカルカット処理を行います。チェックを外すと、以下の[下限周波数][上限周波数]の設定は無視され、全周波数帯域に対してボーカルカット処理を行います。

帯域制限はボーカルカットの処理を行う周波数をボーカルの帯域に制限することにより、ボーカル以外の背景音が一緒に消えてしまうのを防ぐ効果があります。特に中央に位置するバスドラムやベースの音を残すのに有効です。

帯域プリセット

下限周波数、上限周波数を音源に合わせて最適な値に設定します。通常は標準設定でほぼ問題ありませんが、より品質を高めたいときは音源ごとに最適な設定を選択して下さい。

下限周波数

ここで設定する周波数以上に対してのみボーカルカット処理を行います。これより低い周波数はそのまま通過させます。ボーカル抽出モードではこれより低い周波数帯域をカットします。男性ボーカルの場合は120Hz程度、女性ボーカルの場合は200~250Hz程度が適当です。

上限周波数

ここで設定する周波数以下に対してのみボーカルカット処理を行います。これより高い周波数はそのまま通過させます。ボーカル抽出モードではこれより高い周波数帯域をカットします。音声には倍音成分が含まれていますので、声質によって倍音がどこまで広がっているかは異なります。特にサ行の音は高次の倍音まで含んでいます。通常は10000Hz程度で十分ですが、ボーカルに伴うガサガサという音が気になる場合は少し高めに設定してみて下さい。

定位

ボーカルカット(抽出)の対象となる定位を調整します。数値は中央が50で、左いっぱいが1、右いっぱいが99となります。
ボーカルが中央から少しずれているような場合に微調整するとより良い結果が得られることがあります。また特定の定位にある楽器の音を抽出するような目的にも使えるかもしれません。

[中央]ボタン

定位を中央に戻します。

[リアルタイムプレビュー]パネル

[再生]ボタン

ソースファイルリストで再生したい曲を選択してからクリックすると現在のパラメータ設定を反映して処理結果をプレビューします。再生中にパラメータを変更することが可能です。
ソースファイルが何も選択されていないときは、ファイルリストの先頭にあるファイルがプレビュー対象になります。

フリー版ではリアルタイムプレビューは使えません。

フレームサイズはプレビュー中に変更できませんので、いったん停止してから再設定して下さい。
キーチェンジはリアルタイムでプレビューすることができません。
処理に時間がかかるため、パラメータを変更してから反映されるまでに若干の遅延が生じます。
フレームサイズに2048や4096を選択すると音飛びが起こることがあります。

[停止]ボタン

プレビューを途中で中止します。もう一度再生すると曲の先頭に戻ります。

[音量]バー

リアルタイムプレビューの音量を調整します。

[再生位置]バー

現在の再生位置を表示するとともに、スライダーを動かすと再生位置を移動することができます。

ボーカルキャンセラー2をダウンロード

 - ソフトウェアライブラリ, ボーカルキャンセラー2