近頃、技術革新が激しい「音声入力」について、先日に引き続き考えてみました。
今のスマートフォンは、普通に話しかけるとその言葉が文章として入力されたり、話した言葉をコマンドとして認識し、地図を表示したり、検索したりと言った「操作」を行う事が出来るようになっています。
Googleなどは人間が入力した文章を元に、あれだけの精度で世界中から集めた情報を取捨選択し、必要なモノをリスト化してくれるわけです。
あの技術を使えば・・・
入力された声の波形から近いモノを検索し、希望するモノはコレだという予測を「かなりの精度で」行う事も、できるのでしょう。
使う人が多ければ多いほど、どんどんノウハウが蓄積されていくわけですから、現在主流となっているiOSやAdnroid系が有利なのは間違いありません。
ちょっとおさらい。
今のコンピュータやスマートフォンは、
・日本語で話しかければ、その言葉を文章として入力する事が出来ます。
・日本語を与えれば、その言葉の意味を検索する事が出来ます。
・検索した結果を、入力者にフィードバックしてくれます。
・・・・・と、いうことは。
街角の監視カメラに音声認識用のマイクも付けておいて、コンピュータはマイクに入ってくる人間の会話をすべて内部で文章化し、インターネットで検索をかけ、今、目の前を歩いている人がどんな会話をしているかを瞬時に判断し、その人が向かう進行方向に興味のありそうな広告を表示する・・・なんて。
そんな「コンピュータが聞き耳を立てている」時代は、もうすぐそこまで来ているのかも知れません。