2018年6月25日月曜日

AI学習「辞書」の扱い


IMEの辞書にはローカルデータがあるが、AIには今のところない。これを検討すべきだ、というのが今回の主張だ。

AIを使うとき、ユーザ専用のAIを用意してユーザのデータで学習すするのか、あらかじめベンダが学習されたAIを使うのか、というのは問題だ。あまりに初期のAIがお粗末だと売り物として問題になる。そして折角ユーザデータで鍛えても、その結果はベンダにフィードバックされない。一方で、ユーザとしても自らのデータを大量に揃えるのは面倒だ。そのためにはベンダにあらかじめ学習しておいて欲しいが、そのデータはユーザ側にある。

Googleのような使い方では、ユーザデータ(検索キーワード)は全面的にGoogleに渡ってしまう。だからユーザ辞書に相当するものはない。しかし業務システムでは、この問題は重要だ。ライバル会社のデータで賢くなったものを貰えればその会社はありがたいが、そんなものをベンダ経由であっても他社に渡すというのは抵抗があるだろう。

この問題を解決するのは容易ではない。アーキテクチャを分離して、ユーザが渡してよいと思うものを(AIで?)選別し、貰えるデータはベンダAIの学習に、貰えないデータはユーザAIの学習に使い、その結果を統合する、という仕掛けが必要なのだが、AI同士をどう結びつけたらよいのか分からないのだ。

もしこの研究が上手くいけば、以前の提案「AIの三階層アーキテクチャ」の解決にも道が開ける。これを研究しているところがあるのだろうか、非常に気になる。

0 件のコメント:

コメントを投稿

注目の投稿:

ダイナミック租税とその指標

今の法律では、税率は一定の計算式で表されるが、そのパラメータは固定である。需要と供給のバランスによって商品の価格を変えるダイナミックプライシングというのがあるが、あれを租税にも適用してはどうかと考えてみた。 納税者の声をベースにして様々な租税や補助金を自動調節して、どこか一箇所...

人気の投稿: