2017年8月16日水曜日
賢者学習
従来型の深層学習を見ていると、何だか赤ちゃんが言語を学ぶときのようなもどかしさを感じる。水泳を習うのにいきなり川に投げ込まれるようなもので、いまいちスマートでない。ベタなデータを読むのではなく、教科書を読むとか先生に教わるとかいった、スマートな学習法はないものか。
従来の学習が「経験から学ぶ」型だとすると、「本から学ぶ」型の機械学習があってもおかしくない。つまり、ごく少量のデータだけで多くを学ぶことができるのが、この学習の特徴である。ここでは前者を「愚者学習」、後者を「賢者学習」と呼ぶことにする。
やや乱暴に例えるなら、愚者学習は現在流行りの深層学習、賢者学習は第五世代コンピュータのようなものだ。何だか逆転しているように見える。だが賢者学習はこれからの研究テーマであり、単なるPrologマシンではない。具体的なアーキテクチャを考えてみよう。
教科書として与えられるのは、例えば大学の講義で使われるような、人間が使う教科書と同じものだ。もちろんPDF化くらいは必要だが、自然言語で書かれている。これをデータとして取り込む。
これは、自然言語解釈エンジンによって論理型言語に変換される。これは、言うなればPrologのソースコードだ。だがPrologと決定的に違うのは、その「正しさの程度」は絶対ではない、ということだ。また、この部分は、その論理型言語の記述量さえ少なければ、自然言語から生成するのではなく、直接人がプログラミングすることもできる。
その信頼度には初期値が付けられる。これは、出典の信頼性と書いてある内容の両方から推測されるべきものであるが、初期においては前者だけでよいだろう。例えば有効な法律、顧客の仕様書、専門書などは信頼性が高く、雑誌やSNSの情報は低い、といった具合である。
次に、そのソースコードから、学習用データセットを自動生成する。これは、業務用のダミー住所データのようなもので、ソースコード(ルール)に合った条件でランダムに生成する。これを信頼度に合わせて必要数だけ生成し、愚者学習に読み込ませる。つまり、賢者学習の必要モジュールは、愚者学習のフロントエンドとして機能する。
「信頼度に合わせた必要数」とは、愚者学習で累積で覚えた実地データによって変化する。従って賢者学習は、愚者学習の学習数をモニターし、必要に応じて追加で学習をさせる。これにより、怪しいデータで信頼性の高いルールが汚染されるのを防ぐ。
こうすると、信頼性の高いルールについて強く覚え、低いルールについては弱く覚え、単なるデータに対しては更に弱く覚える、という調節ができる。また、信頼性の高いルール(とされているもの)の間に矛盾があっても、それなりの答を返すことができる。教科書どおりだけではなく実地データも配慮した答を出せる。これは人間の特徴と同じだ。
これを更に信頼性の高いものにするために、ソースコードをそのまま実行する論理マシンを並行して立て、論理マシンの結果と賢者学習の結果を突き合わせて比較し、矛盾があった場合は信頼度を下げる、というような仕掛けも導入が可能である。
賢者学習には、たぶん他のアーキテクチャも考えられるだろう。自分で言っておいてなんだが、上のアーキテクチャでは計算コストが高くつきそうだ。だが研究の取っ掛かりとしては十分に魅力的に見える。
登録:
コメントの投稿 (Atom)
注目の投稿:
砂の船
免震構造については過去いくつか提案しているが、これの新しい版である。 以前、難燃性の油の上に浮かべた船の構造を提案したことがある。あれの砂版である。つまり、砂のプールを作っておいて、その上に浮かべるというものだ。砂が抵抗となって振動を軽減する。 ただし、油や水と違って砂の...

人気の投稿:
-
屋根に超音波振動装置を取り付けておく。これによって屋根と雪の間の結合が破壊され、雪が滑り落ちやすくなる。これが題記装置の原理だ。角度によっては放っておいても落ちるだろうし、そうでなくても楽に雪下ろしができる。 まあ超音波でなくて低周波でも良いのだろうが、超音波の方が簡単...
-
ディーン・ケーメン氏が発明した浄水器「 スリングショット 」の原理は、いわゆる蒸留である。つまり水を沸騰させて水蒸気にした後、冷やして水に戻す。汚水と蒸留水の間で熱交換を行うことで効率を上げている。 日本では、防災用の浄水器としては中空糸膜や逆浸透膜が殆どだ。これと蒸留式には...
-
自分の知る限りでは、VRChatのワールドで青空文庫が読める図書館があったのと、N高の教室メタバースくらいしかマトモな例がないのが、メタバース内で本を読む方法だ。本や書類がメタバース内で苦も無く読めるようになれば、電子書籍も含めて全部メタバース内に落としてしまいたい、とすら思っ...
-
近年の若年層からの近視の増加傾向は、生活スタイルの変化と関係があると言われている。つまり、外を出歩かず、窓も締め切り、外出してもスマホばかり見ているという、要するに近くばかり見ている生活がその一因である。これは学術的にも証明されていて、外に出歩く機会が多い人ほど軸性近視の確率は少...
-
VAPEとは、液体を使うタイプの電子タバコだ。日本でも既に購入可能だが、あまり普及しているようには見えない。 PG(プロピレングリコール)とVG(ベジタブルグリセリン)からなる液体にフレーバーを混ぜたものを電気で加熱してその蒸気を吸うのだが、この加熱のところがいい加減な...
-
以前の投稿「 AI寿司職人は美味い寿司を握れるか 」と関連して、「AIには絶対できないこと」、と Googleで検索 してみると、出るわ出るわ。無名有名入り乱れ、色々な説が唱えられている。 だがどれも、技術的に不可能であることを証明・説明できていると言えるものはなかっ...
-
映画と言えば、今でも娯楽のジャンルの一つとして確立したものではあるが、近年では衰退の兆しがある。そのたびに3DやCGなどのテコ入れが入ってきたわけであるが、ここにきて更に新しい提案ができるようになった。それがタイトルにあるインタラクティブ性の導入である。 とは言っても、...
-
ハクキンカイロの発熱原理を調べていて、これを防災用(キャンプ用でも良いのだが)の湯沸しに使えないかと考えた。 普通、キャンプではガスコンロを持っていく。だがあれは裸火を使うから、熱効率は悪い。これに対してハクキンカイロの仕掛けは、白金触媒を適切な場所に配することで、極...
-
AGIとは、 汎用人工知能 (Artificial General Intelligence)のことだ。今のところ、研究段階としてはまだ初期の初期だと思われる。一方で、限定的なAIは飛躍的な進歩を遂げている。そこで、AGIを実現するための一つの提案として、 弱いAI の弱い...
-
メタバースが主流の社会では、外出の機会が極端に少なくなる。これによって、大きなダメージを受ける業界が出てくる。それは大雑把に観光業と交通・運輸業、飲食業である。観光にはゲームセンターや映画館、大型ショッピングモール、スポーツ関係なども含まれる。また、雨具の需要も減るだろう。 ...
0 件のコメント:
コメントを投稿