2017年8月16日水曜日
賢者学習
従来型の深層学習を見ていると、何だか赤ちゃんが言語を学ぶときのようなもどかしさを感じる。水泳を習うのにいきなり川に投げ込まれるようなもので、いまいちスマートでない。ベタなデータを読むのではなく、教科書を読むとか先生に教わるとかいった、スマートな学習法はないものか。
従来の学習が「経験から学ぶ」型だとすると、「本から学ぶ」型の機械学習があってもおかしくない。つまり、ごく少量のデータだけで多くを学ぶことができるのが、この学習の特徴である。ここでは前者を「愚者学習」、後者を「賢者学習」と呼ぶことにする。
やや乱暴に例えるなら、愚者学習は現在流行りの深層学習、賢者学習は第五世代コンピュータのようなものだ。何だか逆転しているように見える。だが賢者学習はこれからの研究テーマであり、単なるPrologマシンではない。具体的なアーキテクチャを考えてみよう。
教科書として与えられるのは、例えば大学の講義で使われるような、人間が使う教科書と同じものだ。もちろんPDF化くらいは必要だが、自然言語で書かれている。これをデータとして取り込む。
これは、自然言語解釈エンジンによって論理型言語に変換される。これは、言うなればPrologのソースコードだ。だがPrologと決定的に違うのは、その「正しさの程度」は絶対ではない、ということだ。また、この部分は、その論理型言語の記述量さえ少なければ、自然言語から生成するのではなく、直接人がプログラミングすることもできる。
その信頼度には初期値が付けられる。これは、出典の信頼性と書いてある内容の両方から推測されるべきものであるが、初期においては前者だけでよいだろう。例えば有効な法律、顧客の仕様書、専門書などは信頼性が高く、雑誌やSNSの情報は低い、といった具合である。
次に、そのソースコードから、学習用データセットを自動生成する。これは、業務用のダミー住所データのようなもので、ソースコード(ルール)に合った条件でランダムに生成する。これを信頼度に合わせて必要数だけ生成し、愚者学習に読み込ませる。つまり、賢者学習の必要モジュールは、愚者学習のフロントエンドとして機能する。
「信頼度に合わせた必要数」とは、愚者学習で累積で覚えた実地データによって変化する。従って賢者学習は、愚者学習の学習数をモニターし、必要に応じて追加で学習をさせる。これにより、怪しいデータで信頼性の高いルールが汚染されるのを防ぐ。
こうすると、信頼性の高いルールについて強く覚え、低いルールについては弱く覚え、単なるデータに対しては更に弱く覚える、という調節ができる。また、信頼性の高いルール(とされているもの)の間に矛盾があっても、それなりの答を返すことができる。教科書どおりだけではなく実地データも配慮した答を出せる。これは人間の特徴と同じだ。
これを更に信頼性の高いものにするために、ソースコードをそのまま実行する論理マシンを並行して立て、論理マシンの結果と賢者学習の結果を突き合わせて比較し、矛盾があった場合は信頼度を下げる、というような仕掛けも導入が可能である。
賢者学習には、たぶん他のアーキテクチャも考えられるだろう。自分で言っておいてなんだが、上のアーキテクチャでは計算コストが高くつきそうだ。だが研究の取っ掛かりとしては十分に魅力的に見える。
登録:
コメントの投稿 (Atom)
注目の投稿:
ASIの発達と決定論
世の中の話題はAGIを通り過ぎてASIに進んでいる。AGIがGeneral IntelligenceならASIはSuper Intelligence、即ち人類を遥かに超えた知性ということらしい。 2045年にシンギュラリティが起きると予測したのは、人工知能研究の世界的権威であ...

人気の投稿:
-
「生成AIはミーハーである」の回でも少し触れたのだが、生成AIの回答は一次的には誤っていることが多い。それを指摘してAIが回答を修正していく様を見て楽しむ、というのが最近のマイブームだ。 どういう指摘をしているのか、と自己分析してみると、興味深いことに陰謀論者との議論とあま...
-
日本共産党が消費税減税案についてのサンデーモーニングの批判的なコメント(財源を示せ)に対し「財源を示した上で提言している」という反論をしている。そこで同じく、Grok3に計算してもらった。 日本共産党の提言は、2025年4月16日のものの他、幾つか出ている。そのおおよその方向性...
-
以前チラっと書いた、表題の分析の結果を披露しておく。 まず全体像について生成AIと議論した。結果として、その大まかなシナリオとは、 いわゆる減反政策によって、市場におけるゆとり分が減り、ここ数年は需給バランスがタイトになっていた。 農水省は減反政策は止めたと言っているが...
-
免震技術の一つに、「エア免震」というものがある。地震が発生すると、ホバークラフトのように地面から浮き上がる、というものだ。 http://www.airdanshin.jp/ なかなかよいと思うが、普段は浮いていないわけだから、例えば故障していないかどうか確認す...
-
近年の世界的な右傾化、自国第一主義化について、その原因を生成AIと討論しながら考えた結果、そういう結論に達した、というお話。 まずトランプが未だに支持されている理由について議論したのだが、その理由はアメリカ白人低学歴層の貧困化だという。この白人貧困層は、人数的には数千万人と規...
-
色々と生成AIと議論しているが、それに関して最近気付いたことがある。 最初の応答については、あまり深く考えずに世間の評判を基に答えるのだが、それには往々にしてウソ大げさが混じっている。それに対して指摘をし、更にそれを繰り返すことによって、だんだんとそのウソ大げさを理解し、マト...
-
https://jp.techcrunch.com/2018/03/17/2018-03-14-mit-gadget-puts-multiple-artificial-organs-into-a-paperback-sized-connected-system/ 実験の...
-
https://ja.wikipedia.org/wiki/%E4%B8%AD%E5%9B%BD%E8%AA%9E%E3%81%AE%E9%83%A8%E5%B1%8B チューリングテスト に対する反論とも言える思考実験だ。両者の概要はここでは省略する。Wikipe...
-
古くは仮面ライダースナックやビックリマンチョコ、最近では万博パビリオンの時間指定チケットやマクドナルドのちいかわグッズなど、何かと話題になっている転売の是非について考察してみた。これももちろん生成AIを使って、なかなか面白い結論が出た。 最初は万博場ビリオンについて議論したのだ...
-
生成AIに色々な疑問を聞いては楽しんでいるのだが、最近少々面白い発見をした。 景気対策として消費税減税や廃止を唱えている人は多い。素人だけでなく政治評論家や政治家自身にも多く見られる。だがそれは本当に景気の足しになるのだろうか。多くの人は施策のコストや長期的効果に言及していない...
0 件のコメント:
コメントを投稿