|
|
基本情報 |
|
氏名 |
畔津 忠博 |
氏名(カナ) |
アゼツ タダヒロ |
氏名(英語) |
AZETSU Tadahiro |
第16回日本知能情報ファジィ学会中国・四国研究会予稿集, pp.21-26
本報告では,まずヒトの聴覚末梢系を模擬した数理モデルを構成する.次に,聴覚末梢系モデルの出力として得られる多次元パルス信号を用いて,雑音の多い環境における話者識別への応用可能性を検討する.ここで採用する聴覚末梢系モデルは,基底膜,有毛細胞および聴神経に着目したモデルである.このモデルへの入力は音声信号で,出力は多次元パルス信号である.話者識別には,聴覚末梢系モデルの出力である多次元パルス信号の各パルス系列から得られるPost-stimulus time histogram(PSTH)を用いる.次に,聴覚末梢系モデルの聴神経におけるパルス生成時のしきい値決定法を提案する.この手法は膜電位の時間平均と聴神経の特性を用いる.実験では,男女計12 名(男性9 名,女性3 名)に5つの母音を発話してもらい,その5 セットを用いて,話者識別率の評価を行う.提案手法の有効性はLPC スペクトルおよび
Excitation pattern と比較することによって示される.
|