2018年6月25日月曜日

AI学習「辞書」の扱い


IMEの辞書にはローカルデータがあるが、AIには今のところない。これを検討すべきだ、というのが今回の主張だ。

AIを使うとき、ユーザ専用のAIを用意してユーザのデータで学習すするのか、あらかじめベンダが学習されたAIを使うのか、というのは問題だ。あまりに初期のAIがお粗末だと売り物として問題になる。そして折角ユーザデータで鍛えても、その結果はベンダにフィードバックされない。一方で、ユーザとしても自らのデータを大量に揃えるのは面倒だ。そのためにはベンダにあらかじめ学習しておいて欲しいが、そのデータはユーザ側にある。

Googleのような使い方では、ユーザデータ(検索キーワード)は全面的にGoogleに渡ってしまう。だからユーザ辞書に相当するものはない。しかし業務システムでは、この問題は重要だ。ライバル会社のデータで賢くなったものを貰えればその会社はありがたいが、そんなものをベンダ経由であっても他社に渡すというのは抵抗があるだろう。

この問題を解決するのは容易ではない。アーキテクチャを分離して、ユーザが渡してよいと思うものを(AIで?)選別し、貰えるデータはベンダAIの学習に、貰えないデータはユーザAIの学習に使い、その結果を統合する、という仕掛けが必要なのだが、AI同士をどう結びつけたらよいのか分からないのだ。

もしこの研究が上手くいけば、以前の提案「AIの三階層アーキテクチャ」の解決にも道が開ける。これを研究しているところがあるのだろうか、非常に気になる。

0 件のコメント:

コメントを投稿

注目の投稿:

超音波モーターの原理によるVR用トレッドミル

  VRにおけるリアリティ問題の一つに、その場で動くのではなく移動する場合、つまり歩いたり走ったりすることが挙げられる。実際にはその場にいるので、歩いたかのように足場を調節してやる必要がある。 これを実現する方法として、すり鉢状の滑りやすい足場を作っておく方法と、トレッドミルを使...

人気の投稿: