2017年8月16日水曜日
賢者学習
従来型の深層学習を見ていると、何だか赤ちゃんが言語を学ぶときのようなもどかしさを感じる。水泳を習うのにいきなり川に投げ込まれるようなもので、いまいちスマートでない。ベタなデータを読むのではなく、教科書を読むとか先生に教わるとかいった、スマートな学習法はないものか。
従来の学習が「経験から学ぶ」型だとすると、「本から学ぶ」型の機械学習があってもおかしくない。つまり、ごく少量のデータだけで多くを学ぶことができるのが、この学習の特徴である。ここでは前者を「愚者学習」、後者を「賢者学習」と呼ぶことにする。
やや乱暴に例えるなら、愚者学習は現在流行りの深層学習、賢者学習は第五世代コンピュータのようなものだ。何だか逆転しているように見える。だが賢者学習はこれからの研究テーマであり、単なるPrologマシンではない。具体的なアーキテクチャを考えてみよう。
教科書として与えられるのは、例えば大学の講義で使われるような、人間が使う教科書と同じものだ。もちろんPDF化くらいは必要だが、自然言語で書かれている。これをデータとして取り込む。
これは、自然言語解釈エンジンによって論理型言語に変換される。これは、言うなればPrologのソースコードだ。だがPrologと決定的に違うのは、その「正しさの程度」は絶対ではない、ということだ。また、この部分は、その論理型言語の記述量さえ少なければ、自然言語から生成するのではなく、直接人がプログラミングすることもできる。
その信頼度には初期値が付けられる。これは、出典の信頼性と書いてある内容の両方から推測されるべきものであるが、初期においては前者だけでよいだろう。例えば有効な法律、顧客の仕様書、専門書などは信頼性が高く、雑誌やSNSの情報は低い、といった具合である。
次に、そのソースコードから、学習用データセットを自動生成する。これは、業務用のダミー住所データのようなもので、ソースコード(ルール)に合った条件でランダムに生成する。これを信頼度に合わせて必要数だけ生成し、愚者学習に読み込ませる。つまり、賢者学習の必要モジュールは、愚者学習のフロントエンドとして機能する。
「信頼度に合わせた必要数」とは、愚者学習で累積で覚えた実地データによって変化する。従って賢者学習は、愚者学習の学習数をモニターし、必要に応じて追加で学習をさせる。これにより、怪しいデータで信頼性の高いルールが汚染されるのを防ぐ。
こうすると、信頼性の高いルールについて強く覚え、低いルールについては弱く覚え、単なるデータに対しては更に弱く覚える、という調節ができる。また、信頼性の高いルール(とされているもの)の間に矛盾があっても、それなりの答を返すことができる。教科書どおりだけではなく実地データも配慮した答を出せる。これは人間の特徴と同じだ。
これを更に信頼性の高いものにするために、ソースコードをそのまま実行する論理マシンを並行して立て、論理マシンの結果と賢者学習の結果を突き合わせて比較し、矛盾があった場合は信頼度を下げる、というような仕掛けも導入が可能である。
賢者学習には、たぶん他のアーキテクチャも考えられるだろう。自分で言っておいてなんだが、上のアーキテクチャでは計算コストが高くつきそうだ。だが研究の取っ掛かりとしては十分に魅力的に見える。
登録:
コメントの投稿 (Atom)
注目の投稿:
ダイナミック租税とその指標
今の法律では、税率は一定の計算式で表されるが、そのパラメータは固定である。需要と供給のバランスによって商品の価格を変えるダイナミックプライシングというのがあるが、あれを租税にも適用してはどうかと考えてみた。 納税者の声をベースにして様々な租税や補助金を自動調節して、どこか一箇所...
人気の投稿:
-
ハクキンカイロの発熱原理を調べていて、これを防災用(キャンプ用でも良いのだが)の湯沸しに使えないかと考えた。 普通、キャンプではガスコンロを持っていく。だがあれは裸火を使うから、熱効率は悪い。これに対してハクキンカイロの仕掛けは、白金触媒を適切な場所に配することで、極...
-
科学者、医者等であっても発言が必ずしも科学的とは限らない。無自覚ならまだ可愛いが、むしろ素人を煙に巻く悪意すら感じることもある。 量的議論がそのひとつであることは言うまでもないが、もっと以前の問題として、論理が破綻していることの多さがある。 そのひとつとして、ス...
-
新型コロナウィルスへの対応で、医療機関の防護服やマスクが足りないことが話題だ。ゴーグルは違うが、その他は使い捨てであるところがネックになっている。作っても作っても、消費の方が激しい訳だ。しかし考えてみれば、そもそも何で使い捨てなんだろう。細菌兵器用の防護服は使い捨てではない...
-
ガートナーが出しているハイプサイクルによると、生成AIはまだ幻滅期の手前にいるらしい。つまり今後大きな幻滅を経て実用域に進んでいくことになる。その幻滅とは、人間なら当たり前にできることでまだ生成AIにできないことが多く分かってくることによる。そしてその幻滅期を乗り越えるのは、...
-
時代が進むことで、昔のSFが奇異に思えるようなことはよくある。抑揚のないコンピュータ音声や、わざとぎこちなく歩く人間型ロボットなどは、もはや過去の遺物である。スタートレックシリーズに出てくるトリコーダーもその一つだ。 トリコーダー本体、また医療用プローブを手に持って...
-
生成AIを使って作成されたイラストに対する極端な非難が相次いでいる。そのどれもが、ちょっと行き過ぎに思える。例えば、事前にAIであることを知らせているもの、絵を描いている本人が確認し承諾したものまでも非難されている。なぜこんなに過剰な反応をするのだろう。単にノイジーマイノリティの...
-
卓上カレンダーのようなものを机に置いておいて、必要に応じてテレビ電話やフォトフレーム、緊急通報など、家で必要とされる様々な機能を集約する機械を考えてみる。 これは、従来は電話やFAXのような位置づけだったものだ。これら以外にも一家に一台の情報機器は考えられるので、それを切り替え...
-
コロナ禍ではあまり本ブログを更新しなかったが、この間は陰謀論が跋扈した時期でもあった。コロナは存在しない、ワクチンは危険、アビガン買いだめ、マスクは意味がないなど、実に様々な陰謀論が飛び交った。 この手の人は今だに存在しており、体感としてはむしろ増えている。それも、身の危険を...
-
自分の知る限りでは、VRChatのワールドで青空文庫が読める図書館があったのと、N高の教室メタバースくらいしかマトモな例がないのが、メタバース内で本を読む方法だ。本や書類がメタバース内で苦も無く読めるようになれば、電子書籍も含めて全部メタバース内に落としてしまいたい、とすら思っ...
-
映画と言えば、今でも娯楽のジャンルの一つとして確立したものではあるが、近年では衰退の兆しがある。そのたびに3DやCGなどのテコ入れが入ってきたわけであるが、ここにきて更に新しい提案ができるようになった。それがタイトルにあるインタラクティブ性の導入である。 とは言っても、...
0 件のコメント:
コメントを投稿