2018年6月25日月曜日

AI学習「辞書」の扱い


IMEの辞書にはローカルデータがあるが、AIには今のところない。これを検討すべきだ、というのが今回の主張だ。

AIを使うとき、ユーザ専用のAIを用意してユーザのデータで学習すするのか、あらかじめベンダが学習されたAIを使うのか、というのは問題だ。あまりに初期のAIがお粗末だと売り物として問題になる。そして折角ユーザデータで鍛えても、その結果はベンダにフィードバックされない。一方で、ユーザとしても自らのデータを大量に揃えるのは面倒だ。そのためにはベンダにあらかじめ学習しておいて欲しいが、そのデータはユーザ側にある。

Googleのような使い方では、ユーザデータ(検索キーワード)は全面的にGoogleに渡ってしまう。だからユーザ辞書に相当するものはない。しかし業務システムでは、この問題は重要だ。ライバル会社のデータで賢くなったものを貰えればその会社はありがたいが、そんなものをベンダ経由であっても他社に渡すというのは抵抗があるだろう。

この問題を解決するのは容易ではない。アーキテクチャを分離して、ユーザが渡してよいと思うものを(AIで?)選別し、貰えるデータはベンダAIの学習に、貰えないデータはユーザAIの学習に使い、その結果を統合する、という仕掛けが必要なのだが、AI同士をどう結びつけたらよいのか分からないのだ。

もしこの研究が上手くいけば、以前の提案「AIの三階層アーキテクチャ」の解決にも道が開ける。これを研究しているところがあるのだろうか、非常に気になる。

0 件のコメント:

コメントを投稿

注目の投稿:

陰謀論とスピリチュアルと宗教

  あいかわらず生成AIをいじめて遊んでいるのだが、その中で出てきた「自説」を披露する。 結論からすると、陰謀論とスピリチュアルは、現代の宗教と同じ役割を持っており、宗教のネガティブな部分を陰謀論が、ポジティブな部分をスピリチュアルが担っている、そして既存の宗教を信じる者が減っ...

人気の投稿: