2018年6月25日月曜日

AI学習「辞書」の扱い


IMEの辞書にはローカルデータがあるが、AIには今のところない。これを検討すべきだ、というのが今回の主張だ。

AIを使うとき、ユーザ専用のAIを用意してユーザのデータで学習すするのか、あらかじめベンダが学習されたAIを使うのか、というのは問題だ。あまりに初期のAIがお粗末だと売り物として問題になる。そして折角ユーザデータで鍛えても、その結果はベンダにフィードバックされない。一方で、ユーザとしても自らのデータを大量に揃えるのは面倒だ。そのためにはベンダにあらかじめ学習しておいて欲しいが、そのデータはユーザ側にある。

Googleのような使い方では、ユーザデータ(検索キーワード)は全面的にGoogleに渡ってしまう。だからユーザ辞書に相当するものはない。しかし業務システムでは、この問題は重要だ。ライバル会社のデータで賢くなったものを貰えればその会社はありがたいが、そんなものをベンダ経由であっても他社に渡すというのは抵抗があるだろう。

この問題を解決するのは容易ではない。アーキテクチャを分離して、ユーザが渡してよいと思うものを(AIで?)選別し、貰えるデータはベンダAIの学習に、貰えないデータはユーザAIの学習に使い、その結果を統合する、という仕掛けが必要なのだが、AI同士をどう結びつけたらよいのか分からないのだ。

もしこの研究が上手くいけば、以前の提案「AIの三階層アーキテクチャ」の解決にも道が開ける。これを研究しているところがあるのだろうか、非常に気になる。

0 件のコメント:

コメントを投稿

注目の投稿:

砂の船

  免震構造については過去いくつか提案しているが、これの新しい版である。 以前、難燃性の油の上に浮かべた船の構造を提案したことがある。あれの砂版である。つまり、砂のプールを作っておいて、その上に浮かべるというものだ。砂が抵抗となって振動を軽減する。 ただし、油や水と違って砂の...

人気の投稿: