2017年8月16日水曜日
賢者学習
従来型の深層学習を見ていると、何だか赤ちゃんが言語を学ぶときのようなもどかしさを感じる。水泳を習うのにいきなり川に投げ込まれるようなもので、いまいちスマートでない。ベタなデータを読むのではなく、教科書を読むとか先生に教わるとかいった、スマートな学習法はないものか。
従来の学習が「経験から学ぶ」型だとすると、「本から学ぶ」型の機械学習があってもおかしくない。つまり、ごく少量のデータだけで多くを学ぶことができるのが、この学習の特徴である。ここでは前者を「愚者学習」、後者を「賢者学習」と呼ぶことにする。
やや乱暴に例えるなら、愚者学習は現在流行りの深層学習、賢者学習は第五世代コンピュータのようなものだ。何だか逆転しているように見える。だが賢者学習はこれからの研究テーマであり、単なるPrologマシンではない。具体的なアーキテクチャを考えてみよう。
教科書として与えられるのは、例えば大学の講義で使われるような、人間が使う教科書と同じものだ。もちろんPDF化くらいは必要だが、自然言語で書かれている。これをデータとして取り込む。
これは、自然言語解釈エンジンによって論理型言語に変換される。これは、言うなればPrologのソースコードだ。だがPrologと決定的に違うのは、その「正しさの程度」は絶対ではない、ということだ。また、この部分は、その論理型言語の記述量さえ少なければ、自然言語から生成するのではなく、直接人がプログラミングすることもできる。
その信頼度には初期値が付けられる。これは、出典の信頼性と書いてある内容の両方から推測されるべきものであるが、初期においては前者だけでよいだろう。例えば有効な法律、顧客の仕様書、専門書などは信頼性が高く、雑誌やSNSの情報は低い、といった具合である。
次に、そのソースコードから、学習用データセットを自動生成する。これは、業務用のダミー住所データのようなもので、ソースコード(ルール)に合った条件でランダムに生成する。これを信頼度に合わせて必要数だけ生成し、愚者学習に読み込ませる。つまり、賢者学習の必要モジュールは、愚者学習のフロントエンドとして機能する。
「信頼度に合わせた必要数」とは、愚者学習で累積で覚えた実地データによって変化する。従って賢者学習は、愚者学習の学習数をモニターし、必要に応じて追加で学習をさせる。これにより、怪しいデータで信頼性の高いルールが汚染されるのを防ぐ。
こうすると、信頼性の高いルールについて強く覚え、低いルールについては弱く覚え、単なるデータに対しては更に弱く覚える、という調節ができる。また、信頼性の高いルール(とされているもの)の間に矛盾があっても、それなりの答を返すことができる。教科書どおりだけではなく実地データも配慮した答を出せる。これは人間の特徴と同じだ。
これを更に信頼性の高いものにするために、ソースコードをそのまま実行する論理マシンを並行して立て、論理マシンの結果と賢者学習の結果を突き合わせて比較し、矛盾があった場合は信頼度を下げる、というような仕掛けも導入が可能である。
賢者学習には、たぶん他のアーキテクチャも考えられるだろう。自分で言っておいてなんだが、上のアーキテクチャでは計算コストが高くつきそうだ。だが研究の取っ掛かりとしては十分に魅力的に見える。
登録:
コメントの投稿 (Atom)
注目の投稿:
富士山噴火への備え・再考
以前にも https://spockshightech.blogspot.com/2017/10/blog-post_2.html という投稿をしたことがあるのだが、もう少し状況を詳しく知ることができないか、調べてみた。 首都圏の対策としては、『首都圏における広域降灰対策...
.jpg)
人気の投稿:
-
屋根に超音波振動装置を取り付けておく。これによって屋根と雪の間の結合が破壊され、雪が滑り落ちやすくなる。これが題記装置の原理だ。角度によっては放っておいても落ちるだろうし、そうでなくても楽に雪下ろしができる。 まあ超音波でなくて低周波でも良いのだろうが、超音波の方が簡単...
-
一国における貧富の差が余りにも拡大して手が付けられなくなった時に、第二の通貨を発動する、という手が考えられる。お互いの使い方や交換に制限を掛けてやることで、第二通貨が貧乏人の間で主に廻るようにして、独立した(仮想的な)経済圏を作ってやるのがこの目的だ。 低所得層は第二通...
-
ハクキンカイロの発熱原理を調べていて、これを防災用(キャンプ用でも良いのだが)の湯沸しに使えないかと考えた。 普通、キャンプではガスコンロを持っていく。だがあれは裸火を使うから、熱効率は悪い。これに対してハクキンカイロの仕掛けは、白金触媒を適切な場所に配することで、極...
-
「人はなぜ悪に憧れるのか」と「人はなぜ正義に憧れるのか」をGoogle検索してみたところ、前者は素直にヒットするのに後者はひねくれたサイトしかヒットしなかった。どうやら人は悪に憧れているようだ。 前者のサイトを読んでいると、様々な解釈が出てきて面白い。だが、検索前に自分...
-
ディーン・ケーメン氏が発明した浄水器「 スリングショット 」の原理は、いわゆる蒸留である。つまり水を沸騰させて水蒸気にした後、冷やして水に戻す。汚水と蒸留水の間で熱交換を行うことで効率を上げている。 日本では、防災用の浄水器としては中空糸膜や逆浸透膜が殆どだ。これと蒸留式には...
-
不気味の谷というのは人間に似せようとするから起こるのであって、Pepperやaiboには存在しない概念だ。日本にはアニメキャラという秀逸な文化があるのだから、顔にしても動きにしても、そういった一つのカテゴリとして「抽象化ヒューマノイド」(言葉が適切かどうかは分からないが)と...
-
3.11で原発の危険を甘く見ていたように、次は噴火を甘く見ていたと後悔するかもしれない。今の知識を振り返ってみる。 過去の富士山噴火の規模を見ると、溶岩や噴石などの被害はもちろん近隣で発生するとして、広範囲に火山灰が積もる。予測によれば、関東でも数cmは積もる。この量で...
-
Googleがローカルニュース記事を作成するソフトウェア開発に資金を提供した 記事を見ていると窮余の策にも見えるのだが、考えてみるとむしろ好ましいのかもしれない。今まで、ローカルニュースは地方紙の領分であり、全国紙ではローカルニュースは1ページとか、ごく少数しかなかった...
-
FacebookのAIが、英語を使いながらも人間に理解できない文法でしゃべりだし、そのAIが停止された、と言う話が話題になった。その会話を実際に見てみたが、確かに気持ち悪い。この気持ち悪さ、どこかで感じたことがある、と思って思い出してみたら、眉村卓の小説に度々出てくる「産業...
-
コンクリート住宅を3Dプリンタで作る、という試みは、世界中で行われている。しかし日本では、鉄筋なしのコンクリートだけの住宅は認可されない。地震が多い日本では、揺れで簡単に壊れてしまうからだ。コンクリートは圧縮に強いが引っ張りに弱い。鉄筋はその逆だ。鉄筋コンクリートが使われる...
0 件のコメント:
コメントを投稿