KernelTender今回は対話型音声データ作成法についてです。
啓発や教育、あるいはドラマ仕立てのコンテンツなど、目的によって最適な方法は異なりますが、大きく分けて「AI合成音声を使う方法」と「生身の声(録音)を使う方法」の2つがあります。
それぞれの作り方の流れを整理しました。
最近のAI音声合成ツールは非常に自然で、キャラ設定も容易です。
おすすめのツール
Vrew(ブリュー): 動画編集ソフトですが、テキストを入力するだけで「Aさん」「Bさん」と話者を分けてAI音声を作成できます。
VOICEVOX: 無料で使える高品質な音声合成ソフト。ずんだもん等、キャラクターごとに声質がはっきり分かれているため、対話形式に向いています。
OpenAI TTS / Google Cloud Text-to-Speech: より自然で落ち着いた、プロフェッショナルなトーンの対話が作れます。
作成手順
❶台本(スクリプト)作成: 「A:こんにちは」「B:どうしました?」といった形式でテキストを用意します。
❷話者の割り当て: ツール上で、Aさんに「落ち着いた男性」、Bさんに「明るい女性」などの声を割り当てます。
❸書き出し: 1つの音声ファイルとして書き出すか、編集しやすいように一文ずつ書き出します。
必要なもの
録音機材: スマートフォン(ボイスメモ)でも十分ですが、静かな場所で録るのがコツです。
編集ソフト: Audacity(無料・PC用)や、スマホアプリのGarageBandなどが便利です。
作成手順
❶別々に録音する: * 二人同時に録るのが難しい場合は、まず一人が自分のパートを読み、その「間」を空けてもう一人が録音します。
・あるいは、自分のセリフだけを録ったファイルを二つ用意します。
❷編集(ミキシング): * 編集ソフトに2つの音声トラックを並べます。
・Aさんの発言が終わったタイミングでBさんの音声が流れるように、タイミングを左右にずらして調整します。
・「間」を意識する: 障害に関する深い話をする際、即レスではなく、少し「考え込む間」を入れるだけで、ぐっとリアリティと説得力が増します。
・音量バランス: 二人の声の大きさが違いすぎると聞き手が疲れてしまいます。編集ソフトの「ノーマライズ(正規化)」機能を使って音量を揃えましょう。
・左右の定位(パン): わずかにAさんの声を左から、Bさんの声を右から聞こえるように設定すると、二人が対面している臨場感が出ます。