適正な処理条件で発話者の覚醒度に相関する指数値が計算可能に

SiCECA(Shiomi’s Cerebral Exponent Calculation Algorithm) により音声信号を処理す れば,処理パラメータの設定,音声データの信号雑音比,等々の幾つかの条件が十分に適正であれば発話者の覚醒度に相関する指数値を計算する事ができます が,全ての条件が適正でなければ何時でも発話者の覚醒度に相関する様な指数値が計算できる訳ではありま せん。例えばラジオで或る放送に同調すればその放送が,別な放送に同調すれば別な放送 が聴ける様に, SiCECAの実装は形式的な処理手続型プログラムで,覚醒度評価に適正な パラメータの設定がなされた場合に,音声から発話者の覚醒度に相関する指数値がCEM (Cerebral Exponent Macro)値として算出可能となるのです。

CEM値から覚醒度に相関する指数値を算出するためには、SiCECAパラメータの適正な設定 は第1に必要ですが、CEM値をテキスト等の朗読音声から算出する場合には、朗読テキストの違いによりCEM値に有意な差異が発生する事が確認されていま す。この差異が単に音韻構成や順序の差異によるものであるのか、或いはテキストの意味に対するメンタルな反応の影響が大きいのか、現時点では良く分かって いません。(情動刺激の強い文章を朗読した様な場合には、メンタルな反応の影響が大きいと思われるCEM値の変化が観測されることが有ります。)

doc-11右図は音声資源コンソーシアム提供によるAWA-LTRコーパスの内の50の単文を10時朗読した場合のCEM値と、13時に朗読した場合のCEM値の対応関係を示したものです。個々のプロットが1つの文章に対応しており、は52回の朗読による平均値を、は1回目の朗読によるCEM値、は 2回目の朗読によるCEM値を表しています。平均値の対応(R2=0.93)では、10時にCEM値が小さい文章であれば、13時に読んでもCEM値が小 さい傾向が強く現れています。個々の(毎回の)対応ではR2=0.04~0.6となり、CEM値の大小関係に対応が殆ど見られない場合もあります。

上 記の朗読テキストの差異によるCEM値の差異については、人間の覚醒度に相関すると考えられるCEM値を算出するための設定(SiCECAパラメータ:埋 込み次元Dを5、埋込み遅延時間τdを0.46ms、発展時間τeを1.10ms)とした場合で、D、τd、τeの一つでも変化させれば、その状況は変化 します。時には、全く異なった分布に大きく変化してしまいます。

また、上記の変化については、多くの人に共通なものであるのか? 或いは個 人差が強いものであるのか? 2013年時点では十分なデータが無くSiCECAパラメータとの関係も複雑なので、未だ結論は出ていません。毎回の発話に おいて、CEM値は発話者の状態等を含めて様々な要因で変化し、また誤差が発生します。電子航法研究所の音声分析技術を利用しようとする場合には、CEM 値は統計的な、確率的な指数値と考える必要があります。