2018年1月11日木曜日
成長するAI脳
機械学習における興味として、将来的に機能性能を向上したくなった場合に、アーキテクチャをどう拡大したらよいのか、という問題がある。これには二つの側面があり、ひとつは単純に処理性能を増やしたいとき。これは簡単で、学習済みのマシンをコピーして複数並べ、前段で負荷分散すればよい。問題はもうひとつの側面で、より知識を増やしたいときにどうするか、だ。
今はあまり問題になっていないが、アーキテクチャが固定でデータをどんどん投入していくだけ、とはならないはずだ。難しいことを考えれば考えるほど、求める結論が多いほど、きめ細かいほど、元データが多いほど、より大きなアーキテクチャが必要になるはずだ、と考えるのが自然だ。そして往々にして、要求は時間と共にエスカレートするものだ。
ノード数や層数を増やして新しく学習し直す、というのなら話は簡単なのだが、これではその度に学習成果がリセットしてしまう。実験ならともかく、実用マシンでこれを行うのは困難だ。そこで、既存の学習結果を残したまま、アーキテクチャを拡張するためにはどうするか、という学問(技術)が生まれ、検討されるようになるだろう。これを考えてみる。
マクロで考えると、これはスケールアップとスケールアウトということになる。前者は、既存の学習マシンにノードを付け加え、結合を弄る、という考え方になる。後者は、既存の学習マシンはそのままに、別の学習マシンを新たに立て、これを結合する、という考え方になる。だが既存のそれのように単純には行くまい。
まず、スケールアップに関して考えると、学習済みの学習マシンに未学習のノードを付け加えることで、既存の知識が消えたり不具合が出たりする可能性がある。これを防ぎ、更に性能を上げるには、どのような構造にしたらよいか。後者は、そもそもAI同士をどう結合したらよいのかが分かっていないし、新たにつなぐマシンはまっさらだから、繋いだ後にどうデータを流したらよいかも分からない。
前者についてはアイデアがあって、既存のノード1つを2つ、3つと増やし、結合先結合元自体は層に応じて増やし、その初期パラメータを既存の学習結果と同じになるように設定する、というものだ。これを少し解説する。
例えば、既存の学習マシンの中間層のノード各々を全て二つに増やす、と考える。そして、全ての結合は既存のノードに準じたつなぎにする。例えば、既存のノードA1の先にノードB1がつながっているとすると、既存のノードはA1ひとつからA1とA2の二つになり、接続先はB1とB2の二つになる。このとき、A1-B1は既存の接続であるが、この他にA1-B2、A2-B1、A2-B2の接続ができる。この際、新たな三つの接続における影響係数を全てゼロにする。
こうすることにより、新たにこのマシンにデータが流されてきたときに出てくる答えは、既存のマシンが出す答えと同じになる。しかしこれは実働フェーズでの話であって、学習フェーズにおいては全てのノードに公平にフィードバックされるから、新たな学習においてはゼロだった係数は変化していく、というものだ。
後者は更に難しい。まず目的が問題だ。同じデータを使って別の種類の結論を出したい、というのであれば、入力は同じで出力は独立している、お互いのマシンは干渉しない、という形態になる。例えば手書き文字認識において、文字を特定するマシンと、その文字を書いた人物を推定するマシンを並べる、というイメージだ。これは比較的簡単な部類になる。
では、こんなものはどうか。診察結果から病名を診断する「医師マシン」において、今までは掛かりつけ医レベルだったものを総合病院レベルにしたい、と考えたとする。つまり、従来は一人の医者(マシン)だったところ、多くの診療科医(マシン)の集団にして、どの診療科が診るかをまず決めて、あるいは最終的にどの診療科医の結論を尊重するかを決めて診断をする、という形に変えたい。その場合はどのようにすればよいのだろう。
既存の(汎用)医者マシンが出す結論(病名)は、病名+確率のリストである。病名毎に診療科を割り当て、診察結果と医者マシンの結論を診療科医マシンに入力する、という形になる。この際、診療科医マシンには他の診療科の病名は入力されない。
こうすると、初期においては診療科医マシンと医者マシンの結論は同じであるが、学習が進むことで診療科医の診断の方が精度が高くなっていく、ということが考えられる。
もちろんこの他にも考えられるアーキテクチャはごまんとあり、用途目的によって使い分けられることになるのだろう。重要なのは学習し直しが発生しないことで、こうすることによって、アーキテクチャが変わった時期から急激に精度が上がっている、などという効果が期待できる。
登録:
コメントの投稿 (Atom)
注目の投稿:
ダイナミック租税とその指標
今の法律では、税率は一定の計算式で表されるが、そのパラメータは固定である。需要と供給のバランスによって商品の価格を変えるダイナミックプライシングというのがあるが、あれを租税にも適用してはどうかと考えてみた。 納税者の声をベースにして様々な租税や補助金を自動調節して、どこか一箇所...
人気の投稿:
-
ハクキンカイロの発熱原理を調べていて、これを防災用(キャンプ用でも良いのだが)の湯沸しに使えないかと考えた。 普通、キャンプではガスコンロを持っていく。だがあれは裸火を使うから、熱効率は悪い。これに対してハクキンカイロの仕掛けは、白金触媒を適切な場所に配することで、極...
-
科学者、医者等であっても発言が必ずしも科学的とは限らない。無自覚ならまだ可愛いが、むしろ素人を煙に巻く悪意すら感じることもある。 量的議論がそのひとつであることは言うまでもないが、もっと以前の問題として、論理が破綻していることの多さがある。 そのひとつとして、ス...
-
新型コロナウィルスへの対応で、医療機関の防護服やマスクが足りないことが話題だ。ゴーグルは違うが、その他は使い捨てであるところがネックになっている。作っても作っても、消費の方が激しい訳だ。しかし考えてみれば、そもそも何で使い捨てなんだろう。細菌兵器用の防護服は使い捨てではない...
-
ガートナーが出しているハイプサイクルによると、生成AIはまだ幻滅期の手前にいるらしい。つまり今後大きな幻滅を経て実用域に進んでいくことになる。その幻滅とは、人間なら当たり前にできることでまだ生成AIにできないことが多く分かってくることによる。そしてその幻滅期を乗り越えるのは、...
-
時代が進むことで、昔のSFが奇異に思えるようなことはよくある。抑揚のないコンピュータ音声や、わざとぎこちなく歩く人間型ロボットなどは、もはや過去の遺物である。スタートレックシリーズに出てくるトリコーダーもその一つだ。 トリコーダー本体、また医療用プローブを手に持って...
-
生成AIを使って作成されたイラストに対する極端な非難が相次いでいる。そのどれもが、ちょっと行き過ぎに思える。例えば、事前にAIであることを知らせているもの、絵を描いている本人が確認し承諾したものまでも非難されている。なぜこんなに過剰な反応をするのだろう。単にノイジーマイノリティの...
-
卓上カレンダーのようなものを机に置いておいて、必要に応じてテレビ電話やフォトフレーム、緊急通報など、家で必要とされる様々な機能を集約する機械を考えてみる。 これは、従来は電話やFAXのような位置づけだったものだ。これら以外にも一家に一台の情報機器は考えられるので、それを切り替え...
-
コロナ禍ではあまり本ブログを更新しなかったが、この間は陰謀論が跋扈した時期でもあった。コロナは存在しない、ワクチンは危険、アビガン買いだめ、マスクは意味がないなど、実に様々な陰謀論が飛び交った。 この手の人は今だに存在しており、体感としてはむしろ増えている。それも、身の危険を...
-
自分の知る限りでは、VRChatのワールドで青空文庫が読める図書館があったのと、N高の教室メタバースくらいしかマトモな例がないのが、メタバース内で本を読む方法だ。本や書類がメタバース内で苦も無く読めるようになれば、電子書籍も含めて全部メタバース内に落としてしまいたい、とすら思っ...
-
映画と言えば、今でも娯楽のジャンルの一つとして確立したものではあるが、近年では衰退の兆しがある。そのたびに3DやCGなどのテコ入れが入ってきたわけであるが、ここにきて更に新しい提案ができるようになった。それがタイトルにあるインタラクティブ性の導入である。 とは言っても、...
0 件のコメント:
コメントを投稿