このページでは、Praatで母音のフォルマントを測定する方法を学んでいきます。なお、「フォルマント」とは何かについては、ここでは扱いません。本サイト内の以下のページを参考にしてください。
SoundEditorでフォルマントを確認する
ここでは、以下のサンプルファイルを用いることとします。日本語で「イ、エ、ア、オ、ウ」を5回発音したものです。
ファイルを読み込みSoundオブジェクトを選択し、いつものようにView & Editを押してSoundEditorを開きましょう。そして1回目の「イ、エ、ア、オ、ウ」の部分だけズームしてみましょう。
設定によっては青い線(基本周波数)や黄色い線(インテンシティー)や赤い線(フォルマント)が見えるかもしれません。今はスペクトログラムがよく見えるように、Show pitch、Show intensity、Show formantsのチェックを外すことで、それらの線を出さないようにしておきましょう。(チェックを外す手順については、こちらのページで説明しています。)
ここでサウンド・スペクトログラム上に現れた濃く黒い横棒がフォルマントを示しています。下から順に第1フォルマント(F1)、第2フォルマント(F2)、・・・といいます。たとえば,「イ」の第1フォルマントは,下図のカーソルをあてたあたりの周波数にあります。
Praatでは、フォルマントの周波数を推定してくれる機能があります。最も手軽なのは、SoundEditor上で上部メニューからShow formantsにチェックを入れるという方法です。
すると以下のように表示されるはずです。
ただし、ここでは、特に4番目の「オ」が特徴的ですが、第2フォルマントが乱れて表示されています。これは実際にフォルマントがこのように乱れているというのではなく、フォルマントがうまく検出できていないことに起因しています。そこで、設定を調整する必要があります。
フォルマント検出の設定を調整する
フォルマント検出の設定を変えるには、SoundEditor上部メニューから、Formants > Formant settings を選択します。
設定を変更する前に、Praatがどのような設定を推奨しているかを見てみましょう。設定ウィンドウ下部のHelpを押すと、以下のような説明があります。
ここの説明からわかるように、Praatでは maximum frequency の設定値を、女性では 5500 Hz、男性では 5000 Hz にすることを推奨しています。そこで、先ほどの設定画面に戻り、以下のように Formant ceiling を 5000 Hz に変えてみましょう。
すると、サウンド・スペクトログラム上にフォルマントが以下のように乱れなく表示されるはずです。
まだ第4フォルマント以上が乱れているところはありますが、母音の分析において重要なのは第1フォルマントと第2フォルマントなので、問題ありません。
ところで、フォルマントの設定についてもう少し説明しておきます。Praatのフォルマント検出においては、特定の周波数の範囲内にいくつのフォルマントを出すかをあらかじめ決めた上で、検出を行います。Formant settings において Formant ceiling が 5000 Hz、Number of formants が 5.0 ということは、0~5000 Hz の周波数域に5つのフォルマントが現れるという想定にもとづいて分析するということです。(ちなみに、これはLPC(線形予測符号化)という手法にもとづいています。LPCでは係数の設定が重要になりますが、number of formants で指定された値の2倍が係数となります。)
男性と女性では一般に男性の方が声道が長い傾向にあり、それに伴ってフォルマントが全体的に低く現れる傾向にあります(これについては、本サイトの別の「共鳴と母音のフォルマント」でも少し説明しています)。そのため、formant ceiling の設定を男女で変えることが推奨されるのです。なお、Praatのフォルマント設定における初期設定や、formant ceiling を 5500 Hz / 5000 Hz にすることは、これまでの音声学・音声科学の知見にもとづいています。通常の成人男女の音声を扱うのであれば、ひとまずこの設定にしたがっておくのがいいでしょう。
なお、設定をいろいろいじっているうちに、初期設定がなんだったかがわからなくなってしまうことがあるかもしれません。その場合は、formant settings のウィンドウの下部にある Standards というボタンを押せば、初期設定に戻すことができます。
フォルマント周波数を記録する
ここまでの手順でSoundEditor上で検出した(赤いドットで示される)フォルマントカーソルを合わせると、おおよそのフォルマント周波数がわかります。例えば、イの母音区間の中央付近で、縦軸については第1フォルマントのあたりに、カーソル(赤い点線)をあてましょう。
すると、横方向のカーソルの左、サウンドスペクトログラムの外側に、周波数が表示されるはずです。上の図では、298.5 Hz となっていますが、手でカーソルを合わせているので、作業する人によって値の示され方には微妙な違いはあるはずです。このような手順で、各母音の第1フォルマント、第2フォルマント付近にカーソルをあてれば、フォルマントの計測をすることができます。
別の方法としては、母音の中央付近にカーソルがあてられた状態で、Formants > Formant listing というメニューを選択するという方法があります。
これをすると、以下のように、カーソルをあてた時間軸上の位置における第1~第4フォルマントの値が表示されます。
ここでは縦軸方向(周波数)は自動で計測していますが、横軸方向(時間)は手でカーソルをあてているので、依然として作業する人による計測値の違いは、多少出てきます。
なお、音声学の研究において、どの時点でのフォルマントを計測するか(つまり、時間軸方向でのカーソルをどこにあてるか)は、様々な方法があります。母音区間の中央の時点にすることが最も一般的だと思いますが、そのほかに例えば、インテンシティが最大となる時点で計測するという方法がとられることもあります。
フォルマントは何を示唆するのか
フォルマントとは何か、それが調音音声学上の母音の基準とどう関わるのかについては、「共鳴と母音のフォルマント」にまとめたとおりです。ここで重要なポイントだけ改めて述べておきます。
まず、三つのレベルを分けて考える必要があります。一つは、調音音声学上の母音空間(IPAにおける母音チャート)です。左上に [i]、左下に [a]、右上に [u] が位置するおなじみのチャートです。二つ目のレベルとして、舌の最高点の高さと前後位置という基準があります。これは一つ目のレベルと混同されがちですが、IPAの母音チャートは(X線撮影やMRIで計測されるような厳密な意味での)舌の最高点の高さ・前後位置とは一致しないことが知られています。そして、三つ目のレベルとして、音響音声学上の指標としてのフォルマント(特に第1、第2フォルマント)があります。
三つのレベルは同じではありませんが、それらには一定の相関があります。フォルマントに関していえば、次の通りです。第1フォルマントは、母音チャートの縦軸と、そして舌の最高点の高さと、相関があります。母音チャートの縦軸について下にいくほど、そして舌の最高点が低いほど(つまり、[i]、[u] よりも [a] のほうが)、第1フォルマントが高くなる傾向にあります。一方、第2フォルマントは、母音チャートの横軸と、そして舌の最高点の前後位置と相関があります。母音チャートの横軸について左にいくほど、そして舌の最高点が前寄りになるほど(つまり、[u]、[o] よりも [i]、[e] のほうが)、第2フォルマントは高くなる傾向にあります。なぜこのようになるか、これまでの研究で明らかにされています。ただし、第1フォルマントや第2フォルマントの値に影響する要因は複雑であるため、一つ目や二つ目のレベルと完全に一致するわけではないということに注意が必要です。
本サイト内の関連ページ
文献案内
(母音のフォルマントについて理解するための文献)
川原繁人(2018)『ビジュアル音声学』三省堂. [Amazonリンク]
【3.3 共鳴、3.4.1 日本語の母音、3.4.2 英語の母音】
Johnson, Keith (2012) Acoustic and auditory phonetics, third edition. Chichester: Wiley-Blackwell. [Amazonリンク]
[Chapter 6: Vowels.]