2017年8月16日水曜日
賢者学習
従来型の深層学習を見ていると、何だか赤ちゃんが言語を学ぶときのようなもどかしさを感じる。水泳を習うのにいきなり川に投げ込まれるようなもので、いまいちスマートでない。ベタなデータを読むのではなく、教科書を読むとか先生に教わるとかいった、スマートな学習法はないものか。
従来の学習が「経験から学ぶ」型だとすると、「本から学ぶ」型の機械学習があってもおかしくない。つまり、ごく少量のデータだけで多くを学ぶことができるのが、この学習の特徴である。ここでは前者を「愚者学習」、後者を「賢者学習」と呼ぶことにする。
やや乱暴に例えるなら、愚者学習は現在流行りの深層学習、賢者学習は第五世代コンピュータのようなものだ。何だか逆転しているように見える。だが賢者学習はこれからの研究テーマであり、単なるPrologマシンではない。具体的なアーキテクチャを考えてみよう。
教科書として与えられるのは、例えば大学の講義で使われるような、人間が使う教科書と同じものだ。もちろんPDF化くらいは必要だが、自然言語で書かれている。これをデータとして取り込む。
これは、自然言語解釈エンジンによって論理型言語に変換される。これは、言うなればPrologのソースコードだ。だがPrologと決定的に違うのは、その「正しさの程度」は絶対ではない、ということだ。また、この部分は、その論理型言語の記述量さえ少なければ、自然言語から生成するのではなく、直接人がプログラミングすることもできる。
その信頼度には初期値が付けられる。これは、出典の信頼性と書いてある内容の両方から推測されるべきものであるが、初期においては前者だけでよいだろう。例えば有効な法律、顧客の仕様書、専門書などは信頼性が高く、雑誌やSNSの情報は低い、といった具合である。
次に、そのソースコードから、学習用データセットを自動生成する。これは、業務用のダミー住所データのようなもので、ソースコード(ルール)に合った条件でランダムに生成する。これを信頼度に合わせて必要数だけ生成し、愚者学習に読み込ませる。つまり、賢者学習の必要モジュールは、愚者学習のフロントエンドとして機能する。
「信頼度に合わせた必要数」とは、愚者学習で累積で覚えた実地データによって変化する。従って賢者学習は、愚者学習の学習数をモニターし、必要に応じて追加で学習をさせる。これにより、怪しいデータで信頼性の高いルールが汚染されるのを防ぐ。
こうすると、信頼性の高いルールについて強く覚え、低いルールについては弱く覚え、単なるデータに対しては更に弱く覚える、という調節ができる。また、信頼性の高いルール(とされているもの)の間に矛盾があっても、それなりの答を返すことができる。教科書どおりだけではなく実地データも配慮した答を出せる。これは人間の特徴と同じだ。
これを更に信頼性の高いものにするために、ソースコードをそのまま実行する論理マシンを並行して立て、論理マシンの結果と賢者学習の結果を突き合わせて比較し、矛盾があった場合は信頼度を下げる、というような仕掛けも導入が可能である。
賢者学習には、たぶん他のアーキテクチャも考えられるだろう。自分で言っておいてなんだが、上のアーキテクチャでは計算コストが高くつきそうだ。だが研究の取っ掛かりとしては十分に魅力的に見える。
登録:
コメントの投稿 (Atom)
注目の投稿:
労働生産性向上策2:雇用と賃金
以前も https://spockshightech.blogspot.com/2025/08/blog-post_05.html のようなことを考えてみたが、また別の視点から労働生産性について考えてみた。 日本の労働生産性はOECDの中でも低位にある。何が労働生産性向上の足を引...
人気の投稿:
-
屋根に超音波振動装置を取り付けておく。これによって屋根と雪の間の結合が破壊され、雪が滑り落ちやすくなる。これが題記装置の原理だ。角度によっては放っておいても落ちるだろうし、そうでなくても楽に雪下ろしができる。 まあ超音波でなくて低周波でも良いのだろうが、超音波の方が簡単...
-
過去、 https://spockshightech.blogspot.com/2025/04/blog-post.html https://spockshightech.blogspot.com/2025/04/blog-post_26.html https://spock...
-
努力しても報われない場合はある、というのは一般論として正しいと思うが、成功者は「いや、それは努力が足りないだけだ」と反論する。この構図は昔から存在する。 有名なところでは王貞治の「努力は必ず報われる。もし報われない努力があるのならば、それはまだ努力と呼べない」というもので、同じよ...
-
衆議院議員選挙に際しての各党の公約をAI分析してみる。消費税については https://spockshightech.blogspot.com/2026/01/blog-post_23.html で書いたが、チームみらいは消費税減税を公約としておらず、一覧としても総合的な視...
-
中道改革連合が提案しているジャパンファンドについて調べてみた。 これを大雑把に言うと、政府が色々なところで細かく持っている資産を、一つの「バケツ」に集約し、それをGPIF(年金積立金管理運用独立行政法人)の運用ノウハウをもって運用しようというものだ。資産総額は500兆円、目標...
-
ハクキンカイロの発熱原理を調べていて、これを防災用(キャンプ用でも良いのだが)の湯沸しに使えないかと考えた。 普通、キャンプではガスコンロを持っていく。だがあれは裸火を使うから、熱効率は悪い。これに対してハクキンカイロの仕掛けは、白金触媒を適切な場所に配することで、極...
-
https://gigazine.net/news/20251223-santa-quantum-physics/ こちらで紹介されていた、サンタクロースの量子論的解釈が面白かった。 量子とは、電子やクォークなどを差す。これら量子は、物質としての側面と波動としての側面を持...
-
意味不明と思われるかもしれないが、ちょっと我慢して聞いてほしい。 Youtubeの膨大な動画の中には、書籍を解説したコンテンツが多くある。15~30分程度の要約で、人にもよるが、わかりやすく解説してくれているものも多い。 また、教育コンテンツも多くある。とある男とかカーンア...
-
ディーン・ケーメン氏が発明した浄水器「 スリングショット 」の原理は、いわゆる蒸留である。つまり水を沸騰させて水蒸気にした後、冷やして水に戻す。汚水と蒸留水の間で熱交換を行うことで効率を上げている。 日本では、防災用の浄水器としては中空糸膜や逆浸透膜が殆どだ。これと蒸留式には...
-
日本の全企業数に占める中小企業の割合は 99.7% であり、更に全労働者の約 70% が中小企業で働いている。にも関わらず、大企業と中小企業が生み出すGDPはほぼ同額である。なぜかというと、労働生産性が違うからである。 企業規模 労働生産性(年換算・1人あたり) ...

0 件のコメント:
コメントを投稿