アナログ・デジタル変換(AD変換)とは
世の中にはアナログなものとデジタルなものがあります。アナログとは連続的に変化するものであり,自然界における変化は基本的にアナログです。しかし,コンピュータ上では,その変化はデジタルなものとして(つまり,不連続的なものとして)扱わなければなりません。そのため,アナログなものをコンピュータで扱う際には,アナログからデジタルへの変換(アナログ・デジタル変換;analog-to-digital conversion;AD変換)が必要となります。
音も自然界においてはアナログであるため,コンピュータで分析するためにはAD変換が必要となります。近年はデジタルな録音機が普及しているため,録音の段階でAD変換が行われることが多いです。
録音する際には,AD変換の設定(サンプリング周波数や量子化ビット数)を指定する必要があります。また,分析の段階になって設定に変化を加える必要が生じることもあります。目的に応じて適切に設定できるようになるためには,デジタル信号処理の基礎を理解しておく必要があります。
サンプリング(標本化)と量子化
デジタル信号処理において,サンプリング(sampling; 標本化)とは,信号を一定の時間間隔で測定することを意味します。
一方,量子化(quantization)とは,サンプリングされた時間における値を離散的な値で近似することを意味します。
わかりやすい言い方をすれば,横軸を時間,縦軸を振幅とした音の波形において,横(時間)方向にどの程度細かくするかがサンプリングであり,縦方向(振幅)にどの程度細かくするかが量子化だということができます。
音のサンプリングと量子化については,以下の動画が参考になります。
サンプリングの単位
サンプリングの精度は,サンプリング周波数(sampling frequency)によって表されます。サンプリング周波数とは,1秒間に何回サンプリングを行うかを意味しており,単位は Hz (ヘルツ)です。サンプリング周波数が10000 Hz (10 kHz)だとすると,1秒間に10000回サンプリングされるということになります。サンプリングは等間隔で行われるので,サンプリング周波数が10000の場合,サンプリングの間隔は1/10000秒ということになります。
私たちの身近なものでは,サンプリング周波数は一般に次のようになっています。
- 電話:8 kHz
- 音楽CD:44.1 kHz
- デジタルケーブルテレビ:48 kHz
量子化の単位
量子化の精度は一般に,ビット(bit)数で表されます。ビット数は2の何乗かで表します。例えば16 bit は 216 = 65536 であり,波形を縦(振幅)方向に 65536 に切り分けた精度で近似していることを意味します。
一般的なデジタル録音は 16ビットでなされることが多く,音声学の研究においても 16ビットの量子化が一般的です。
ナイキスト周波数とエイリアシング
サンプリング周波数をいくつにするかは,音声の周波数成分の分析に大きくかかわります。1周期を捉えるには最低二つのサンプルが必要です。言い換えれば,ある周波数成分を捉えるには,その2倍のサンプリング周波数が必要だということになります。サンプリング周波数が対象となる音の周波数成分の2倍に満たない場合にどうなるかというと,その周波数成分を誤ったかたちで再現してしまいます。これをエイリアシング(aliasing)といいます。
なお,サンプリング周波数の半分の周波数をナイキスト周波数(Nyquist frequency)と呼びます。サンプリング周波数が10000 Hz の場合,ナイキスト周波数は 5000 Hz です。上に述べたように,ナイキスト周波数を超える周波数は適切に捉えることができず,エイリアシングを生じさせてしまいます。
以下の動画は以上のことを視覚的に説明していて参考になります(特に3分40秒ぐらいまで)。
上に述べたように,ナイキスト周波数を超える周波数成分はエイリアシングを生じさせます。そのためAD変換に際しては,対象となる音について,サンプリング周波数を超える周波数成分を除去するという操作が必要になります。これはアンチエイリアシングフィルタをかけることで成し遂げることができます。ただ,実際のところ,こんにちではデジタル録音をしたり,アナログ録音したものをデジタルに変換したりする際には,自動的にアンチエイリアシングフィルタがかかるので,普段は意識しなくても大丈夫です。
サンプリング周波数やナイキスト周波数を意識することは,音声の分析において重要です。例えば,母音の分析において重要となる成分は一般的に 5000 Hz よりも下に現れるので,サンプリング周波数が 10000 Hz であれば問題なく分析できるはずです。一方,子音のうちでもとりわけ [s] などの摩擦音の分析において重要となる成分は 8000 Hz 付近に現れるので,10000 Hz ぐらいまでは分析する必要があり,サンプリング周波数は最低でも 20000 Hz が必要だということになります。
もちろん,サンプリング周波数を高めにとっておけば,母音の分析にも子音の分析にも問題なく対応できます。ただ,サンプリング周波数を必要以上に高くしすぎると,ファイル容量が大きくなったり,コンピュータ上での処理に時間がかかったりするので,注意が必要です。
学習案内
Johnson, K. (2011) Acoustic and auditory phonetics, 3rd edition. Chichester: Wiley-Blackwell. [Amazonリンク]
[音響音声学をメインとした教科書で、Chapter 3でデジタル信号処理の基礎が詳しく説明されています。]