2019年1月24日木曜日

最適化コーディネーター


GoogleのAlphaZeroは、その基本原理が「強化学習」である。即ち、最終的な「正解」があって、途中に至る「ルール」はあるが、途中で何をするかは何も教えられない。自らが試行錯誤して正解に辿り付いた時、褒められる。基本はこれだけだ。

強化学習の良いところは、大量の学習データを用意しなくてよいというところだ。ただ、ゲームのように白黒はっきりつけられるモノではあまり日常生活の役には立たないから、ここだけは修正するものとして、「正解(より良い解)はあるが途中経路がない」というものをもっと探して機械学習に掛けてやると、世の中はもっと良くなるだろう。AlphaZeroの次の機械学習ねたは、いったい何なのだろう。

それは基本的に「最適化」であるはずだ。例えば電車の運転において、決まった経路を行き来するのに、どこで加速しどこで減速するか。パラメータは「到着時間制限」の他に「最低コスト」即ち電力消費の最小化だ。セールスマン巡回問題も、最低コストの問題と言える。これの応用としては、宅配や郵便配達のルート選定、食堂の仕入れ量など、あらゆるものが考えられれる。

こういったものの多くはタイムラグがあるし、コンピュータで把握しきれないパラメーターが実は重要かもしれない。例えばコンビニの売上でいくと、POSだけ見ていては天気が分からないし、季節、休日や周囲のイベントなども関係するはずだ。だがそれを入れてやれば、学習自体はさほど難しくない。碁や将棋と違うのは、シミュレーションで学習するのではなく、実地で学習するところだけだ。

学習するAIはオンラインで用意できるから、後はどうデータをブチ込んでやればよいかを考える。もし足りないデータがあるならそれをオンライン化する。そういうサービスが今後盛んになるのではないだろうか。人呼んで「最適化コーディネーター」の誕生だ。
最適化コーディネーターの仕事は、基本的には「既存データのデータクレンジング」、「足りないデータ探し」、「AIとの接続」、「学習の進捗管理」などとなる。強化学習に特化することにより、従来のデータサイエンティストとは違って、AIプログラミングの深いところはあまり必要ない。

この職業は、AI関連業種の裾野を広げる可能性がある。今後の動向に注目だ。

0 件のコメント:

コメントを投稿

注目の投稿:

超音波モーターの原理によるVR用トレッドミル

  VRにおけるリアリティ問題の一つに、その場で動くのではなく移動する場合、つまり歩いたり走ったりすることが挙げられる。実際にはその場にいるので、歩いたかのように足場を調節してやる必要がある。 これを実現する方法として、すり鉢状の滑りやすい足場を作っておく方法と、トレッドミルを使...

人気の投稿: