音声の物理
02 | 音声の物理
デジタル音声記録の原理
音波に限らず、すべての波には周波数と振幅という2つのパラメータがあります。デジタル録音では、本来連続的なアナログ値であるこの2つのパラメータを、離散的な数値=デジタル値に置き換えており、下表のように対応しています。
音声のパラメータ | デジタル化 |
---|---|
振幅方向の分割 | 量子化 |
周波数方向の分割 | サンプリング周波数 |
量子化とサンプリング周波数
DVカメラの録音モード設定には、通常12bit/32kHzと16bit/48kHzの2種類があります。
例えば16bit/48kHzとは、量子化16bit/サンプリング周波数48kHzでデジタル化する、ということを表しています。具体的には、ある瞬間の音の振幅=音量を、16bit=2の16乗~65536段階のデジタル値で表し、時間方向には、サンプリング周波数48kHz=1秒間に4万8000回データを記録する、ということになります。
分割数を多くするほど、より原音に近い音として聞こえることになります。
サンプリング周波数と再現される音
なお、音として再現される周波数の上限は、サンプリング周波数の約半分です。すなわち、サンプリング周波数が48kHzであれば、その半分の24kHz程度までの音を再現できます。人間の耳で聞くことができる周波数の上限は約20kHzなので、その倍の40kHz以上のサンプリング周波数があれば、原理的には平均的な人間が聞くことができる音をすべてデジタル化できることになります。CDのサンプリング周波数が44.1kHzなのは、若干余裕を見て設定されているわけです。(なお、20kHzを超える音も人間は感じている、との説もあります。)
デシベル(dB)と音量比
音量は、デシベル(dB)と言う単位で表すのが一般的です。
デシベルは、ある基準音量X0に対する評価音Xの相対的な大きさで、次のように表せます。
この定義式より、代表的なデシベル表示による音量比は下記のようになります。覚えておくと便利でしょう。
デシベル | 音量 |
---|---|
+12dB | 約4倍 |
+6dB | 約2倍 |
+3dB | 約1.4倍 |
±0dB | 1倍(不要) |
-3dB | 約0.7倍 |
-6dB | 約0.5倍 |
-12dB | 約0.25倍 |
録音レベルは-6dB~-12dBで調整するのが目安
なお、デジタル録音では通常0dBが量子化の最大値に定義されます。すなわち、0dBを超える音は正常に記録できません。実際の録音現場では、録音対象にもよりますが、ひとつの目安として-6dBから-12dBあたりに録音したい音声が入るように録音レベルを調整します。