2017年8月16日水曜日
賢者学習
従来型の深層学習を見ていると、何だか赤ちゃんが言語を学ぶときのようなもどかしさを感じる。水泳を習うのにいきなり川に投げ込まれるようなもので、いまいちスマートでない。ベタなデータを読むのではなく、教科書を読むとか先生に教わるとかいった、スマートな学習法はないものか。
従来の学習が「経験から学ぶ」型だとすると、「本から学ぶ」型の機械学習があってもおかしくない。つまり、ごく少量のデータだけで多くを学ぶことができるのが、この学習の特徴である。ここでは前者を「愚者学習」、後者を「賢者学習」と呼ぶことにする。
やや乱暴に例えるなら、愚者学習は現在流行りの深層学習、賢者学習は第五世代コンピュータのようなものだ。何だか逆転しているように見える。だが賢者学習はこれからの研究テーマであり、単なるPrologマシンではない。具体的なアーキテクチャを考えてみよう。
教科書として与えられるのは、例えば大学の講義で使われるような、人間が使う教科書と同じものだ。もちろんPDF化くらいは必要だが、自然言語で書かれている。これをデータとして取り込む。
これは、自然言語解釈エンジンによって論理型言語に変換される。これは、言うなればPrologのソースコードだ。だがPrologと決定的に違うのは、その「正しさの程度」は絶対ではない、ということだ。また、この部分は、その論理型言語の記述量さえ少なければ、自然言語から生成するのではなく、直接人がプログラミングすることもできる。
その信頼度には初期値が付けられる。これは、出典の信頼性と書いてある内容の両方から推測されるべきものであるが、初期においては前者だけでよいだろう。例えば有効な法律、顧客の仕様書、専門書などは信頼性が高く、雑誌やSNSの情報は低い、といった具合である。
次に、そのソースコードから、学習用データセットを自動生成する。これは、業務用のダミー住所データのようなもので、ソースコード(ルール)に合った条件でランダムに生成する。これを信頼度に合わせて必要数だけ生成し、愚者学習に読み込ませる。つまり、賢者学習の必要モジュールは、愚者学習のフロントエンドとして機能する。
「信頼度に合わせた必要数」とは、愚者学習で累積で覚えた実地データによって変化する。従って賢者学習は、愚者学習の学習数をモニターし、必要に応じて追加で学習をさせる。これにより、怪しいデータで信頼性の高いルールが汚染されるのを防ぐ。
こうすると、信頼性の高いルールについて強く覚え、低いルールについては弱く覚え、単なるデータに対しては更に弱く覚える、という調節ができる。また、信頼性の高いルール(とされているもの)の間に矛盾があっても、それなりの答を返すことができる。教科書どおりだけではなく実地データも配慮した答を出せる。これは人間の特徴と同じだ。
これを更に信頼性の高いものにするために、ソースコードをそのまま実行する論理マシンを並行して立て、論理マシンの結果と賢者学習の結果を突き合わせて比較し、矛盾があった場合は信頼度を下げる、というような仕掛けも導入が可能である。
賢者学習には、たぶん他のアーキテクチャも考えられるだろう。自分で言っておいてなんだが、上のアーキテクチャでは計算コストが高くつきそうだ。だが研究の取っ掛かりとしては十分に魅力的に見える。
登録:
コメントの投稿 (Atom)
注目の投稿:
スマートグラスによる教育
VRゴーグルを使った教育は、既にN高などで実用化されている。これを更に進め、スマートグラス前提の教育を考えてみる。 N高の時代と違うのは、 強力な生成AIの存在 である。つまり、 教科書と学習指導要領だけを与えることで、教育プログラムを生成AIが自動的に作ってくれる ようになれ...
人気の投稿:
-
高市氏は相変わらず憲法改正にご執心であるが、その内容は過去の自民党案をベースにしていることに変わりない。即ち、⓵自衛隊の明記、②緊急事態要綱、③地方自治体の弱体化、④国民の権利の弱体化、である。要するに中央集権国家にしようとしているわけだ。 一般的にこれらは、社会主義、共産主義...
-
一日あたり(一食あたりではない!) 530円で済む、超低価格の非常食を考えてみた。 いきなりだが以下がレシピである。 コンポーネント 具体的な製品例 1日の使用量 1日あたりのコスト 役割 主食(糖質) ケンミン 業務用はるさめ 400g 約40...
-
カルビーがポテトチップスなどのパッケージを白黒にしたことに対し、政府がヒアリングを行った話。これについて少し調べてみたところ、けっこうとんでもないことが分かった。 パッケージ問題の本質は(ナフサそのものではなく、ナフサから作られる)エチレンの減産であり、その規模は平常時の四...
-
有名な金持ち本「DIE WITH ZERO」における著者の主張について生成AIと議論していたら、いつの間にかそういう結論に達してしまった、というお話。 著者の主張は、必ずしも財産ゼロで死ぬようにしよう、というものではない。多くの人は使い切れずに溜め込んだまま死んでしまう、こ...
-
だいぶ古い話だが、第二次トランプ政権で、多様性政策撤廃の大統領令が発せられた。 https://jp.reuters.com/world/us/IOISYYZHL5IRVEUVZAFA4DAACY-2025-01-20/ パスポートなど政府発行の身分証明書について「男性また...
-
ナフサ供給「年明け以降も確保」 高市首相表明、中東以外で代替調達 このニュースを受けて、石油備蓄は安泰かと思って調べてみたら、全然そんなことはなく、むしろミスリードに近いことが分かった。結果として500日で日本の石油消費量を半減する必要があることが分かったので、その概要とプラ...
-
中島聡氏の著書 2034 - 未来予測 に倣い、私も未来予測をしてみたいと思う。ただ、私はこの本を読んでいない。著書のチャプターのみを題材として、自分なりの予測をしてみる。 Chapter1 AIによる「死生観」のグレート・リセット 既に書いている、 人は死んだらどこへ...
-
日本と世界の右傾化とその理由 の続き。世界的な国粋主義、自国第一主義、覇権主義、暴力肯定、秩序破壊の傾向に関し、その原因について考えてみる。なお、けっこう重い話ではあるのだが、あくまでも『根拠なき自説』であるので、気軽に聞いて頂きたい。 世界的な右傾化の原因は、経済格差や...
-
何もかも失ってしまいもう失うものがない人、という文脈で使われる「無敵の人」という表現だが、別の意味で無敵な人というのを考えてみた。それは、社会からのあらゆるしがらみからいつでも脱却できるために誰にも媚びる必要のない人、というものだ。これを「ポジティブ無敵の人」と命名してみた。...
-
法曹界がIT化する、というのをニュースでやっていた。これは証拠のDB化や手続き等のオンライン化を含むもので、まあ真っ当な進化と言えるのだが、そもそも法律がデジタル化していないのは何なんだろう、さっさとプログラム化してしまえばよいのに、と思っていた。これは以前に、 法のプログ...

0 件のコメント:
コメントを投稿