聞き耳コンピュータ

近頃、技術革新が激しい「音声入力」について、先日に引き続き考えてみました。

今のスマートフォンは、普通に話しかけるとその言葉が文章として入力されたり、話した言葉をコマンドとして認識し、地図を表示したり、検索したりと言った「操作」を行う事が出来るようになっています。

Ｇｏｏｇｌｅなどは人間が入力した文章を元に、あれだけの精度で世界中から集めた情報を取捨選択し、必要なモノをリスト化してくれるわけです。

あの技術を使えば・・・

入力された声の波形から近いモノを検索し、希望するモノはコレだという予測を「かなりの精度で」行う事も、できるのでしょう。

使う人が多ければ多いほど、どんどんノウハウが蓄積されていくわけですから、現在主流となっているｉＯＳやＡｄｎｒｏｉｄ系が有利なのは間違いありません。

ちょっとおさらい。

今のコンピュータやスマートフォンは、

・日本語で話しかければ、その言葉を文章として入力する事が出来ます。

・日本語を与えれば、その言葉の意味を検索する事が出来ます。

・検索した結果を、入力者にフィードバックしてくれます。

・・・・・と、いうことは。

街角の監視カメラに音声認識用のマイクも付けておいて、コンピュータはマイクに入ってくる人間の会話をすべて内部で文章化し、インターネットで検索をかけ、今、目の前を歩いている人がどんな会話をしているかを瞬時に判断し、その人が向かう進行方向に興味のありそうな広告を表示する・・・なんて。

そんな「コンピュータが聞き耳を立てている」時代は、もうすぐそこまで来ているのかも知れません。

posted with amazlink at 15.02.12

荒木雅弘