カオス論的音声解析

世の中には予想ができることと、予想ができないことが様々存在します。予想ができることとできないことは、もしかするとカオス度の差、カオスの度合 いの違いなのかもしれません。SiCECA.orgでは、その「カオス度」を測ることで、数値化することで、なかなか測ることができない人間の喜怒哀楽と いった感情、興奮、昂揚、イライラといった心身状態、眠気、疲労などの指標としてカオス論的数値解析の研究を行っています。その基礎となる「カオス理論」 について解説します。

  • カオスとは —カオス理論の目的

① カオス論的現象とは気象のような性質を有する現象であり
② カオス理論とは,
“ある期間”を越えての予測の不可能な現象の構造を解明 するための理論です。
人間の生体活動から得られる多くの信号もカオス論的な挙動を示すことが知られており,脈波や瞳孔径の変化からストレンジ・アトラクタを生成することができることが知られています。

『カ オス』の意味をを辞書で引きますと、『混沌、混乱するほど複雑』といった意味になりますが、『初期条件・境界条件を定めると以後の運動が決まるような簡単 な系であっても、初期条件のわずかな差で大きく違った結果を生ずるような現象であり、気象現象・乱流や生態系の変動などに見られる。』
 となります。カオス理論は、
“ある期間”を越えての予測の不可能な現象の構造を解明するための理論である。
 とまとめられます。
  また、人間の生体活動から得られる多くの信号もカオス論的な挙動を示すことが知られており,脈波や瞳孔径の変化からストレンジ・アトラクタを生成すること ができることが知られており、『人間の発話音声』にもカオス論的な変化が観測されたことをきっかけにSiCECA(CENTE)の研究・開発をしていま す。

  • カオスであること —カオスの特徴的なひとつの例

 

1)  snowbordslow図の中で示される曲線は、山の斜面を滑らせられたスノーボードの軌跡です。

2) スノーボードは全く同じポイントから滑りましたが、それは初期状態にほとんど起因しない全く異なる地点に達します。

3) カオス理論は異常なまでの複雑さを理解する必要のある(かなり難しい)理論です。

 カオスは非常に難しく、この中の説明だけでカオスについて正確にかつ簡単に説明することは非常に難しいことですが、以降の説明で、少しでもカオスの正しいイメージを持っていただければ幸いです。
 この例は(カオス理論の父と言われる)ローレンツによって書かれた本から抜粋したものです。
 この図の中で示される曲線は斜面上方から滑らせられたスノーボードの軌跡です。スノーボードは全く同じポイントから滑りましたが、それは初期状態にほとんど起因しない全く異なるポイントに達します。
 この現象は、必ずといってよいほど存在することが確認されております。カオス理論は異常なまでの複雑さを理解する必要のある理論でして、かなり難しい理論であると言えます。

  • カオス理論の解説

 それでは、SiCECA(CENTE)の研究・開発でも入力信号(解析対象)としております『音声』を対象としてカオスについてなるべくわかりやすく、カオスとはどういうものか、カオスをとらえ客観的な数値として状態の変化を示すとはどういうことかについて説明していきます。tplot

上の図は、人間の発話音声信号です。これらの2つの図は、言葉に表した『あ』の音の波形を示しています。
左の図は、正常な時の波形で、右の図が疲労時の波形を示します。
一般には、恐らく正常な時の声と疲労した声を聞き分けることが容易であると思います。
しかし、被験者の中には、右の図のそれのような波形であっても、正常な状態である人もいます。
また、右の図の中の波形は左の図の波形にいくつかの種類のノイズを加えることにより、比較的容易に人為的に作ることができます。
実際にはこのように波形を見ただけでは、『見た目は似ているが、厳密な波形は同じではない』程度のことはわかりますが、どれほど『揺らいでいる』とか、どれほど『状態が違う』とか、定量的に表現することはできません。powerspectrum

 上の図は、人間の発話音声のパワースペクトルを表したものです。これらの2つの図は、正常な『あ』の音、および疲労時の『あ』音のパワースペクトルを示しています。
疲れている時には『低周波領域』にノイズがのり、1番目、2番目、3番目のピークが若干高くなり、5番目、6番目のピークは逆に低くなっているように思われます。
しかし、すべてのピークの周波数はほとんど変わりません。これを見て、周波数分析などの従来の方法により、正常な時と疲れているときの声を識別することは難しいことがわかるかと思います。tplot
上の図は、発話音声のストレンジ・アトラクター(ターケンス・プロット)です。これらの2つの図は、人間の音声の特性を示しています。
これらの2つの図はストレンジ・アトラクターあるいはターケンス・プロットと呼ばれます。
これらの図から、正常な音声(左の図)より疲労した声(右の図)のほうが、より多くの変動があることがわかります。
右図の多数のスパイク波形から、疲労した音声には多くの雑音が含まれていることがわかります。
軌跡の幅は、変動の程度を意味します。疲労した音声は、より高い程度の変動を確認することができます。
カオス理論では、この軌跡の安定度を示すのにリアプノフ指数という値を用います。
この場合の軌跡の変動の程度は、疲労による人間の音声に含まれる雑音、揺らぎの度合いを示していると言えます。
実は、このアトラクタの図そのものは、定性的にカオスらしさを表すものであり、定量的にカオス性を示すリアプノフ指数の計算について、次に説明します。lyapunovexp

 この図は、先ほどのストレンジ・アトラクタの軌跡の変動の程度を示すリアプノフ指数の計算方法を示しています。
さきほど、アトラクタの図そのものはリアプノフ指数の計算には重要ではないと申し上げましたが、 この図を構成する、点の分布が、ある(発展)時間後にどのように変化したかを観測し、その変化率を求めることにより定量的にカオス性を表現することができることになります。
以下にリアプノフ指数の計算手順をご説明します。
1)まずはじめに、軌跡上にある「ある点」に着目し、そこから「ある(微小の)距離」以内にある点(近傍点)というものを探します。
2)次に近傍点のすべての組み合わせにおいて離れていく速度(Speed of Separation)を計算します。
一般的に、近傍点は固まりで多く存在します。人間の発話音声のステオレンジ・アトラクタの場合も多くの近傍点の固まりが存在します。11,025Hzでサ ンプリングした音声データの場合、数百の固まりで近傍点が存在します。従って、すべての近傍点に対してリアプノフ指数を計算し、その平均を求めようとする と、最新の高速なPCを使ったとしても、数秒の計算時間を要することになります。signplot
これらの図は、ターケンスプロットの表示方法を示すものです。
この例は、サイン波を2次元空間に埋め込んだ場合のものです。
ターケンス・プロット上のすべてのX軸とY軸の点の組み合わせが、左の図に示されるサイン波を表しています。
X軸とY軸の間のそれぞれの点は、 『埋め込み遅延時間:Td』と呼ばれるある一定の時間差を持っています。
そして『埋め込み発展時間:Tau』もまた左図に示すように一定となります。onseitar
人間の発話音声のストレンジアトアクタでは、左図に示されたすべての点がアトラクタ上に表されます。
音声波形のすべての点は4つ以上の要素の値を表しています。
そしてそれぞれの要素はまったく異なる固有の遅延時間を持っています。
この例では、右図に示すとおりPn からPn+1, そしてPn+1からPn+2, さらにPn+2 からPn+3と埋め込み点が移動していきます。このように点の移動が繰り返され、最終的に人間の発話音声のストレンジ・アトラクタが描かれます。tarplots
上段の図は、ホワイト・ノイズをターケンス・プロット表示した例です。
ホワイト・ノイズの場合、ターケンス・プロットを描くことはできません。
埋め込み点の移動が、無限に長い時間であれば全空間をカバーするかもしれませんが、軌道変化に規則性を見出すことができません。
下段の図は、米国マサチュセッツ工科大学のローレンツ教授が発見したカオス学において非常に歴史的に重要な図です。このローレンツ教授の発見以前には、左 の波形は、ある種のランダムな雑音から成るとされていた。しかし、ローレンツ教授の発見により、科学者達はカオスはある規則性を持つものでありランダムな ものではないと思うようになりました。

さあ、いかがでしょうか。カオス理論についてお解りいただけましたでしょうか。