2019年1月24日木曜日

最適化コーディネーター


GoogleのAlphaZeroは、その基本原理が「強化学習」である。即ち、最終的な「正解」があって、途中に至る「ルール」はあるが、途中で何をするかは何も教えられない。自らが試行錯誤して正解に辿り付いた時、褒められる。基本はこれだけだ。

強化学習の良いところは、大量の学習データを用意しなくてよいというところだ。ただ、ゲームのように白黒はっきりつけられるモノではあまり日常生活の役には立たないから、ここだけは修正するものとして、「正解(より良い解)はあるが途中経路がない」というものをもっと探して機械学習に掛けてやると、世の中はもっと良くなるだろう。AlphaZeroの次の機械学習ねたは、いったい何なのだろう。

それは基本的に「最適化」であるはずだ。例えば電車の運転において、決まった経路を行き来するのに、どこで加速しどこで減速するか。パラメータは「到着時間制限」の他に「最低コスト」即ち電力消費の最小化だ。セールスマン巡回問題も、最低コストの問題と言える。これの応用としては、宅配や郵便配達のルート選定、食堂の仕入れ量など、あらゆるものが考えられれる。

こういったものの多くはタイムラグがあるし、コンピュータで把握しきれないパラメーターが実は重要かもしれない。例えばコンビニの売上でいくと、POSだけ見ていては天気が分からないし、季節、休日や周囲のイベントなども関係するはずだ。だがそれを入れてやれば、学習自体はさほど難しくない。碁や将棋と違うのは、シミュレーションで学習するのではなく、実地で学習するところだけだ。

学習するAIはオンラインで用意できるから、後はどうデータをブチ込んでやればよいかを考える。もし足りないデータがあるならそれをオンライン化する。そういうサービスが今後盛んになるのではないだろうか。人呼んで「最適化コーディネーター」の誕生だ。
最適化コーディネーターの仕事は、基本的には「既存データのデータクレンジング」、「足りないデータ探し」、「AIとの接続」、「学習の進捗管理」などとなる。強化学習に特化することにより、従来のデータサイエンティストとは違って、AIプログラミングの深いところはあまり必要ない。

この職業は、AI関連業種の裾野を広げる可能性がある。今後の動向に注目だ。

0 件のコメント:

コメントを投稿

注目の投稿:

ダイナミック租税とその指標

今の法律では、税率は一定の計算式で表されるが、そのパラメータは固定である。需要と供給のバランスによって商品の価格を変えるダイナミックプライシングというのがあるが、あれを租税にも適用してはどうかと考えてみた。 納税者の声をベースにして様々な租税や補助金を自動調節して、どこか一箇所...

人気の投稿: