2017年1月20日金曜日

音声認識の応用先


Ultrabook With Gesture Recognition Camera by Intelfreepress via Attribution Engine. Licensed under CC BY.

Amaon Echo、Google Home、Googleアシスタント、Siri、Cortana、… 最近音声認識が話題だ。日本のそれは精度が悪く使い物にならない印象だが、英語ではかなり精度が上がっていて、そろそろ使い物になるレベルになっている。

Amazon Echoの紹介ページを見ると、音楽再生やピザの注文までできるようになっている。またインテリジェントLEDランプとのセット販売や、交換用の部屋の照明スイッチが売っていて、照明のオンオフはもうDIYでも音声で操作可能になっているようだ。

これは家庭中心の見方だが、企業側から見ると、一例として、電話受付の多くの場面で改善が望まれる。近年多くなっていたプッシュボタンを使う無機質な音声応答が、会話を中心としたインタラクティブなものに変わってくれたらと思う。ずいぶん人間的な対応になるはずだ。

電話で使えるなら窓口でも使えるはずだから、窓口がある多くの業務(役所、銀行、携帯電話、・・・)では使い出があるはずだ。将来的にはロボット対応やネット(オンライン)対応まで間口が広がる。

だが本命は、ソフトウェアのUI改善と言えるだろう。例えば、保険や役所手続きのような、条件分岐が激しく理解しづらい業務においては、メニューや入力フォームが複雑になり、よく理解しないと使いこなせない。これに音声を付け加えることで、階層化メニューからしか選べない操作が一発で出せたり、コマンドの名前を正確に覚えていなくても、類義語・同義語で検索を掛けることができるようになる。

以前の投稿「コマンドのAI解釈」ではキータイプで考えたが、音声の方が本当はしっくりしているように思う。

0 件のコメント:

コメントを投稿

注目の投稿:

超音波モーターの原理によるVR用トレッドミル

  VRにおけるリアリティ問題の一つに、その場で動くのではなく移動する場合、つまり歩いたり走ったりすることが挙げられる。実際にはその場にいるので、歩いたかのように足場を調節してやる必要がある。 これを実現する方法として、すり鉢状の滑りやすい足場を作っておく方法と、トレッドミルを使...

人気の投稿: