冗長情緒

冗長なオタクの備忘録。ポケモンUNITE・VOICEROID系・動画編集 etc. 趣味の雑多なことを書くつもり。

【Voicemeeter Banana】仮想オーディオミキサーを応用する備忘録

この記事ではボイスロイドなどの音声をマイクから出す、ということは直接的に説明してません。
が、似たようなことは書いてます。

主題は「仮想オーディオミキサーを用いて複数の音声の入出力を管理し、配信・VC・自分のデバイスetc. に上手く出力してあげよう」。

図解と称して1枚だけ作図していて、Voicemeeter bananaのイメージをしたい、という人はそこだけ見てみると理解しやすくなるかもしれない。

やってることはデバイスの設定とA1だかB2だかをガチャガチャしてるだけ。
まぁそれが難しかったんだけども…。

 

 

Voicemeeter Bananaについて。詳細はここが分かりやすかった。
特にPC起動時の設定とかはその他の設定という項目から確認できる。便利設定。

Voicemeeter Banana のダウンロードと使い方 - k本的に無料ソフト・フリーソフト

他に何か欲しければこちらから。

Voicemeeter Banana - 新・VIPで初心者がゲーム実況するには

この2つのサイトがあれば十分理解できたが、VOICEROIDなどの合成音声ソフトなどを用いて応用するならまた別個に検索するとNote+など見つかるのでそれで。

 

目的

まず、

  • Youtubeのコメントの読み上げ音声は聞きたくない
    でも配信には読み上げ音声を乗せたい
  • 合成音声でVCをしたい

こういうことがしたい。

 

原理・図解/解説

今まではウィンドウの音とヘッドフォン・スピーカー(物理デバイス)などとで1:1の入出力を行っていた。
なのでこうなる。

  • ウィンドウの音(PC出力) → スピーカー(デバイス入力)

でもこうはなっていない。

  • ウィンドウの音(PC出力) → マイク(デバイス出力)

こういうことをするには実際の配線を組むかのように、入出力を管理してあげる必要がある。
(丁度switchのHDMI出力をPCに挿しても何もならないのと同じ)

なので、この間にPC内部のインターフェースとして仮想オーディオミキサー"Voicemeeter Banana"を挟み、物理デバイスのマイク入力やヘッドフォン出力、仮想オーディオの入出力などを結ぶことで解決を図る。

なのでこうなる。

使用仮想デバイス:合成音声ソフト(ガイノイドTalk"鳴花ヒメ")、Discord、OBS、chrome(デスクトップ音声)

使用物理デバイス:マイク、キャプチャーボード(Mirabox)、モニター、ヘッドフォン

 

左から5つ分のゲージは出力。これを、右5つ分の入力先を決めてあげることで各デバイスで音が鳴る。
うち、最右端2つ分はマイク入力となっている。

 

実は少しズルをしているが今は無視してほしい。
後述するが、今はとりあえず"合成音声ソフトがマイク入力に入っている"、ということで。

 

操作例

適当な例として合成音声がYoutubeの読み上げをしているとして、

  1. Discordに参加している人は私のマイク入力から読み上げ音声を聞いている
  2. OBSによるYoutube配信では読み上げ音声が鳴っている
  3. 私は読み上げ音声を聞いていない

ということをしたい、とする。丁度図中の黄色矢印がこれに該当する。
(実際にそんなことがしたいかはさておき)

  1. 合成音声側の出力先をInput2に設定する (ズルしてます)
  2. ヘッドフォン入力はOutput2のA2なので、ここにチェックをしない(上記項目3.)
  3. Discordのマイク入力はOutput4のB1なので、チェックをいれる(上記項目1.)
  4. OBSのマイク入力はOutput5のB2なので、チェックをいれる(上記項目2.)
  5. 完成

という風になる。

当然だが入出力を管理するだけでなく、各音量をいじれるのもミキサーの便利なところ。
なので、

  • Discord参加者が合成音声の音をもう少し大きく聞きたい
  • Youtubeに入る合成音声の音をもう少し小さくしたい
  • モニターのスピーカーに出力したい

となったら

  • B1を上げる
  • B2を下げる
  • Input2のA1にチェックを入れる

をすればOK。

 

メリット・デメリット

改まって書くことでもない気もするが。

  • 音声の入出力および調整を1つのソフトで行える
  • 操作が煩雑

この2点に尽きる。そもそもミキサーなんてもの自体大概面倒な代物ではあるんだけども。

機能を100%活かすのであれば間違いなく便利な部分が多すぎる。
VSTの適応やノイズの低減、コンプレッサやゲインなどによる基礎から応用までの音調整と多岐にわたる。なんだったら録音とかも。

が、真面目な話ここまでする人間は非常に少なく配信をするにしてもここまで扱うかどうかすら怪しい。

本業の人間であれば十全に使えるものを、素人が機能の10%や20%しか使わないのであれば、何か別の方法を探した方がいいんだろうなとは思った。

だが、今時解説の記事も多く出ているソフトウェアなのだから、まぁこれでもいいかな、とも。

 

注意点

入出力の確認は1人ないし1つのデバイスだけでは確認不足だということ。
実際に配信をする・録画する・人に聞いてもらう・別垢で聞く、etc. いろいろ試行錯誤できるとベスト。

Voicemeeter bananaのウィンドウ上UIもガチャガチャやっていじることが出来れば使い方はどんどん覚えていけたし、ここまで理解することもできた。

 

逆に、このあたりが適当だと例えば、

  • すべてのB1にチェックしてしまって、VCの音がそのままマイクに入って、VCに入っている人は音声を2重に聞いてしまう
    (入出力がループしてしまっている)
  • 音がめちゃくちゃ右から聞こえる
    (UI中央行にある赤点を操作するとこうなる "パン振り"で検索するとわかる)
  • 音割れを起こしたり、逆に聞こえなくなる
    (鼓膜が破れたことを指した訳ではないがもしそうなら耳鼻科に行った方がいい)

こういった不便な現象が起きるので要確認。

後変に設定が初期化されたり不具合があったりすると設定の見直しをイチからすることにもなるので、用途がそこまでないとかならいっそアンインストールしておくことも手段の1つだとは思う。普通こんなのなくても困らないと思うし。

ただあると、便利。すごい便利。

 

余談"ズル"

先ほどのズルについて。

私の環境は少しマニアックで、デスクトップ音声のうち合成音声ソフト・ゲーム・DiscordのVCの音3つの音を取り出し管理する必要があった。

DiscordのVCの出力量というのは個々のマイクデバイス環境による。小さい人もいれば大きい人もいる。
なので、当然小さい人を基準に音量を設定するため、基本的に大きくしたいものとなる。

だがゲームや合成音声ソフトは内部で設定できる。
そのため、まずDiscordのVCを分離。

次に、合成音声ソフトをマイク入力にするためにも分離。

最期に残ったゲーム音は、デスクトップ音声のうちとして扱う。

よって、DiscordのVC、合成音声ソフト、ゲーム音ないしデスクトップ音声、の3つの分離した音源を制御することになる。

 

だが、Voicemeeter bananaでは仮想オーディオの格納先が2か所しかないため、これのみでは実現ができない。

そこでもう1つ仮想オーディオミキサーを導入し、1つだけ"物理マイクinput扱いにする"ことで解決した。

もっと複雑に色んなデバイス・仮想オーディオを用いる場合は更にミキサーがいるんだと思う。やばそう。

今回用いた追加の仮想オーディオミキサーはYAMAHAのSYNCROOM。
合成音声ソフトのみを登録しているのでそこまで難しいことはしていない。

 

素材・使用ソフトウェア

Canva
ガイノイドTalk キャラクター"鳴花ヒメ" および 一止月サノツキ様の2次創作頒布物
いらすとや