今読むべき優良ビジネス書が
すぐ見つかり、読んだ本を
しっかり自分の知識にするサイト

本を検索する

カテゴリーから探す

人気のタグ

お知らせ


Android無料アプリ配信中

音声認識の歴史

音声認識は、1952年にアメリカで単語認識の世界から始まり、日本では1960年に京都大学と日本電気が共同で音声タイプライターの開発を始めたことが源となっている。音声認識技術の市場化は誰もが考え、アメリカでも数多くのベンチャーが登場したが、誰も成功しなかった。

実用化への試みは、1960年頃に始まり、1980年代にはNTTの前身である日本電信電話公社が開発した『銀行ANSER』と呼ばれる金融機関取引の電話照会システムで初めて一般ユーザー向けにも音声認識が使われるようになった。
とはいえ当時の音声認識は、せいぜい数十種類の単語を認識するのがやっとというところ。あらかじめ決まった単語のコマンドを音声で指示することしかできなかった。

1990年代になると、連続した会話を書き起こすために音声認識技術が使われ始める。そこでは非常にばらつきの大きい人間の音声を確率モデルとして使った統計的パターン認識で音声認識の精度を上げる方法なども用いられるようになった。

2000年代に入り、アドバンスト・メディア社が開発した『AmiVoice』で初めて一般向けに実用化された大語彙連続音声認識システムによって、自然な長文会話であっても高速・高精度認識が実現した。

音声認識は進化を遂げ、2008年頃からはモバイル対応、家電や自動車で利用されるようになった。

文化が必要

20世紀のような経済中心の時代から、21世紀は人間中心の時代、一人ひとりの幸せを真面目に考える時代になる。キーボードやマウスのように、人が機械に合わせないと意思が伝達できない「ハードコミュニケーション」の時代から、人が自然に意思を伝えられる「ソフトコミュニケーション」の時代に変革する必要がある。

私たちは「見た事がないもの」に対しては距離を置いてしまう。音声認識では、テクノロジーを普及させるのではなく、「文化を普及させる」ことが重要になる。つまり、機械に対して喋る文化がないところに、いくら音声認識の革新的なテクノロジーに訴えても奇異に思われるだけで、誰も機械に向って喋ってみようとは思わない。

スティーブ・ジョブズが遺した音声アシスタント『Siri』が『iPhone 4S』に搭載されるよりも、ずっと前の2000年にアドバンスト・メディア社はそれを実現していた。しかし、当時はこの人間と機械の新しいコミュニケーションは戸惑いをもって受け取られた。

音声認識のいま

現在、音声認識は次のような分野で利用されている。

①医療記録やデータの音声入力:忙しい医師の負担軽減
②患者の薬歴、服薬指導の音声入力:薬剤師の仕事効率化
③コールセンターの会話記録
④モバイル端末の音声入力・検索
⑤英語学習における発音評定
⑥議事録のリアルタイム記録