2018年1月11日木曜日
成長するAI脳
機械学習における興味として、将来的に機能性能を向上したくなった場合に、アーキテクチャをどう拡大したらよいのか、という問題がある。これには二つの側面があり、ひとつは単純に処理性能を増やしたいとき。これは簡単で、学習済みのマシンをコピーして複数並べ、前段で負荷分散すればよい。問題はもうひとつの側面で、より知識を増やしたいときにどうするか、だ。
今はあまり問題になっていないが、アーキテクチャが固定でデータをどんどん投入していくだけ、とはならないはずだ。難しいことを考えれば考えるほど、求める結論が多いほど、きめ細かいほど、元データが多いほど、より大きなアーキテクチャが必要になるはずだ、と考えるのが自然だ。そして往々にして、要求は時間と共にエスカレートするものだ。
ノード数や層数を増やして新しく学習し直す、というのなら話は簡単なのだが、これではその度に学習成果がリセットしてしまう。実験ならともかく、実用マシンでこれを行うのは困難だ。そこで、既存の学習結果を残したまま、アーキテクチャを拡張するためにはどうするか、という学問(技術)が生まれ、検討されるようになるだろう。これを考えてみる。
マクロで考えると、これはスケールアップとスケールアウトということになる。前者は、既存の学習マシンにノードを付け加え、結合を弄る、という考え方になる。後者は、既存の学習マシンはそのままに、別の学習マシンを新たに立て、これを結合する、という考え方になる。だが既存のそれのように単純には行くまい。
まず、スケールアップに関して考えると、学習済みの学習マシンに未学習のノードを付け加えることで、既存の知識が消えたり不具合が出たりする可能性がある。これを防ぎ、更に性能を上げるには、どのような構造にしたらよいか。後者は、そもそもAI同士をどう結合したらよいのかが分かっていないし、新たにつなぐマシンはまっさらだから、繋いだ後にどうデータを流したらよいかも分からない。
前者についてはアイデアがあって、既存のノード1つを2つ、3つと増やし、結合先結合元自体は層に応じて増やし、その初期パラメータを既存の学習結果と同じになるように設定する、というものだ。これを少し解説する。
例えば、既存の学習マシンの中間層のノード各々を全て二つに増やす、と考える。そして、全ての結合は既存のノードに準じたつなぎにする。例えば、既存のノードA1の先にノードB1がつながっているとすると、既存のノードはA1ひとつからA1とA2の二つになり、接続先はB1とB2の二つになる。このとき、A1-B1は既存の接続であるが、この他にA1-B2、A2-B1、A2-B2の接続ができる。この際、新たな三つの接続における影響係数を全てゼロにする。
こうすることにより、新たにこのマシンにデータが流されてきたときに出てくる答えは、既存のマシンが出す答えと同じになる。しかしこれは実働フェーズでの話であって、学習フェーズにおいては全てのノードに公平にフィードバックされるから、新たな学習においてはゼロだった係数は変化していく、というものだ。
後者は更に難しい。まず目的が問題だ。同じデータを使って別の種類の結論を出したい、というのであれば、入力は同じで出力は独立している、お互いのマシンは干渉しない、という形態になる。例えば手書き文字認識において、文字を特定するマシンと、その文字を書いた人物を推定するマシンを並べる、というイメージだ。これは比較的簡単な部類になる。
では、こんなものはどうか。診察結果から病名を診断する「医師マシン」において、今までは掛かりつけ医レベルだったものを総合病院レベルにしたい、と考えたとする。つまり、従来は一人の医者(マシン)だったところ、多くの診療科医(マシン)の集団にして、どの診療科が診るかをまず決めて、あるいは最終的にどの診療科医の結論を尊重するかを決めて診断をする、という形に変えたい。その場合はどのようにすればよいのだろう。
既存の(汎用)医者マシンが出す結論(病名)は、病名+確率のリストである。病名毎に診療科を割り当て、診察結果と医者マシンの結論を診療科医マシンに入力する、という形になる。この際、診療科医マシンには他の診療科の病名は入力されない。
こうすると、初期においては診療科医マシンと医者マシンの結論は同じであるが、学習が進むことで診療科医の診断の方が精度が高くなっていく、ということが考えられる。
もちろんこの他にも考えられるアーキテクチャはごまんとあり、用途目的によって使い分けられることになるのだろう。重要なのは学習し直しが発生しないことで、こうすることによって、アーキテクチャが変わった時期から急激に精度が上がっている、などという効果が期待できる。
登録:
コメントの投稿 (Atom)
注目の投稿:
新社会民主主義構想
先日、舛添要一氏と佐藤優さんの対談を読んだのだが、なかなかに面白かった。それは現在の中国とロシアの街中の話なのだが、両国とも監視カメラが大量にある。さぞ窮屈だろうと思いきや、街は安全になり清潔になり、あるいは交通渋滞が解消されるなど、市民の生活はずいぶんと良くなっているのだそうだ...

人気の投稿:
-
「生成AIはミーハーである」の回でも少し触れたのだが、生成AIの回答は一次的には誤っていることが多い。それを指摘してAIが回答を修正していく様を見て楽しむ、というのが最近のマイブームだ。 どういう指摘をしているのか、と自己分析してみると、興味深いことに陰謀論者との議論とあま...
-
「人はなぜ悪に憧れるのか」と「人はなぜ正義に憧れるのか」をGoogle検索してみたところ、前者は素直にヒットするのに後者はひねくれたサイトしかヒットしなかった。どうやら人は悪に憧れているようだ。 前者のサイトを読んでいると、様々な解釈が出てきて面白い。だが、検索前に自分...
-
近年の世界的な右傾化、自国第一主義化について、その原因を生成AIと討論しながら考えた結果、そういう結論に達した、というお話。 まずトランプが未だに支持されている理由について議論したのだが、その理由はアメリカ白人低学歴層の貧困化だという。この白人貧困層は、人数的には数千万人と規...
-
性善説と性悪説、どちらを取るかと言えば、やや性善説、だろうか。 子供の成長を見ていると分かるのだが、基本的に子供は善だ。だが、同時に自分勝手なところもある。人の持っているものを欲しがり、場合によっては喧嘩してでも奪おうとする。だがこれは「悪」と言えるほどのものではない。 ...
-
電気が止まった時、明かりや暖を取る、あるいは調理のために必要なのが、火だ。カセットコンロを持っている家も多いと思うが、カセットガスを大量に保存するのは躊躇する人も多いのではないか。ガソリンも灯油も同様だ。また、単に漏れるのも心配だが、これらは何れも経年劣化するから、大量に持...
-
https://ja.wikipedia.org/wiki/%E4%B8%AD%E5%9B%BD%E8%AA%9E%E3%81%AE%E9%83%A8%E5%B1%8B チューリングテスト に対する反論とも言える思考実験だ。両者の概要はここでは省略する。Wikipe...
-
別の投稿でも書いているが、VR普及の条件はビジネスに使えることだ。即ち、①会議・打ち合わせ、②プレゼン、③コラボレーション(共同作業)、④PC作業(大画面、多画面)、これらが「使い勝手よく」できる必要がある。 これらに適合するVRアプリとしては、 Engage 、 Bigsc...
-
電子ペーパーを有し、360°回転できるキーボードを備える、Android端末が欲しい。画面サイズはB5くらいがよい。12型くらいか。重さはできるだけ軽く、できれば350g以下、せめて500g程度に。また、電磁ペンを内蔵してほしい。 この端末の用途はアイデア等のメモと...
-
アメリカには バイオスフィア2 という施設がある。日本にも、 閉鎖型生態系実験施設 という類似の施設がある。これに次ぐ新しい施設「バイオスフィア3」を考えてみた。 その目的は当初のものとも日本のものとも違う。地球環境に人間が与える影響を定量化すること、またそのバランスを人工...
-
度々著名人が不用意に発言しては炎上するこの問題だが、それが正しいのか(真っ当な主張なのか)。またそれ以前の問題として、そもそも外国人犯罪者は本当に多いのか。今回はこれを調べてみた。これも生成AIを使ったのだが、なかなか面白い結果が出た。 まず単純に犯罪率を比較してみると、 ...
0 件のコメント:
コメントを投稿