2018年4月25日水曜日
AIの三階層アーキテクチャ
シンギュラリティ後のAIは何処に行くのかは興味があるところなのだが、そもそも無目的にAIを作る人間は居ないはずだから、何らかの仕事をしようとするはずだ。そしてそこにはライバルがいるから、AI同士の競争になり、そこで勝つために、AIそのものではなくその指示者である人間を殺そうとする、などというような段階になるのだろう。
これはもちろん防がなければならない。一方で、以前「ご隠居AIとお局AI 」で提案したように、緩いルールも考えられる。例えば、ある新興国では実は賄賂の習慣があって、法は絶対ではない、ということも考えられるからだ。
シンギュラリティ後のAIは、三階層のアーキテクチャが必要になる。第一階層は絶対守るルール。第二階層は緩いルール(パラメータ間の優先度など)。第三階層は、目的量の最大化をする、本来の意味でのAIだ。これはこれからのAIの基本アーキテクチャとして定着するべきと考える。
第一階層、第二階層には、第三階層の結論を評価する仕掛けがあって、それが各々の階層の条件を満たしているかどうかを判定する。第一階層はYes/Noであり、第二階層はアナログ値(0~1)となる。第一階層がYesである条件で、第三階層は多数の提案を行い、それと第二階層とのマトリクスが形成される。
そのマトリクスを見て、必要なら各々をドリルダウンして分析し、経営者がどれを選ぶか判断する、というのが基本的な手順になる。
ただ、概念的にはともかく、実装は難しい。まず第一の階層。ここは言わばチェスのルールなのだが、大きな問題が二つある。第一は、チェスのように明確な指示ができないところだ。「人を殺してはいけない」だけではない、様々なルールを明文化して書かなければならない。それも人間のルールを応用するのではダメで、AI向きに書き直さなければならない。
例えば、人を殺したら死刑または無期懲役または懲役云々、というのは、こうしたらこうなる、というルールである。だから、例えば詐欺をしても罰金より儲かれば可、などという判断をしかねない。法ギリギリの不誠実な方法もダメだろう。
二つ目は、そのルールをAIが認識できたとしても、何をしたらそのルールを破ったことになるのかが明確にならなければならない。例えば「人を殺してはならない」ことが分かったとしても、飛行機のオートパイロットを弄るのと大量の失業者を生み出すこととのどちらが人を殺すことになるのかは明確ではない。それをAIが知覚できなければ、ルールを守ろうにも守りようがない。
「人間が確認した後に実行する」では足りない。そのうち作業が複雑になって人が理解不可能になったり、判断すべきことが膨大になって面倒になって放置する、といったことが起こるのは明白だ。
更には、最終的にはこのルール遵守は法で強制しなければならず、対応できているかどうかは確認可能でなければならない。国の審査対応APIのようなものができて、オンラインで監査できるような仕掛けが必要であり、監査対象のAIは大手企業しか作れない、などとなる。
このアーキテクチャの実現は相当困難なので、初期には法で強制するところは飛ばして、また汎用ではなく特定目的に限って適用されることになる。それは、その時点(技術レベル)において、ルールとその確認手段が明確に判断できるものに限って適用される、という形になる。
こう見ると、AGIの安全装置的なシステムの実現はまだ先が長いと言える。シンギュラリティが安全装置の開発より先に来てしまう可能性は十分にあり、ここの早急な理論構築と開発や義務化が期待される。
登録:
コメントの投稿 (Atom)
注目の投稿:
AIによる社会変化の予測
中島聡氏の著書 2034 - 未来予測 に倣い、私も未来予測をしてみたいと思う。ただ、私はこの本を読んでいない。著書のチャプターのみを題材として、自分なりの予測をしてみる。 Chapter1 AIによる「死生観」のグレート・リセット 既に書いている、 人は死んだらどこへ...
人気の投稿:
-
一日あたり(一食あたりではない!) 530円で済む、超低価格の非常食を考えてみた。 いきなりだが以下がレシピである。 コンポーネント 具体的な製品例 1日の使用量 1日あたりのコスト 役割 主食(糖質) ケンミン 業務用はるさめ 400g 約40...
-
有名な金持ち本「DIE WITH ZERO」における著者の主張について生成AIと議論していたら、いつの間にかそういう結論に達してしまった、というお話。 著者の主張は、必ずしも財産ゼロで死ぬようにしよう、というものではない。多くの人は使い切れずに溜め込んだまま死んでしまう、こ...
-
2026/05/04訂正:この打粉はアルファ化されていない可能性があることがわかりました。アルファ化されていないデンプンをそのまま大量に食べると消化不良を起こす可能性があります。以下のレシピは撤回します。加熱済みの炭水化物として、春雨以外ではパン粉が推奨されます。 以前紹介した ...
-
あいかわらず生成AIをいじめて遊んでいるのだが、その中で出てきた「自説」を披露する。 結論からすると、陰謀論とスピリチュアルは、現代の宗教と同じ役割を持っており、宗教のネガティブな部分を陰謀論が、ポジティブな部分をスピリチュアルが担っている、そして既存の宗教を信じる者が減っ...
-
実業家の河原由次氏が、豚まんを新幹線内で食べたところ注意された、という呟きをしたことに対して論争が起こっているが、それを科学的・定量的な視点で考察する。 まず、原典を以下に提示しておく。 https://x.com/i_am_kawa_chan/status/202903...
-
ウキクサについて前回説明 をしたが、さすがに食べるのに抵抗のあると思う。これは完全にサバイバルを前提とした計算だったが、もし「日常の足しになる+非常時にも何とか持続生産」という仮定であれば、少しは魅力的な生産が可能だ。今回はジャガイモについて計算してみた結果を披露する。 基...
-
日本と世界の右傾化とその理由 の続き。世界的な国粋主義、自国第一主義、覇権主義、暴力肯定、秩序破壊の傾向に関し、その原因について考えてみる。なお、けっこう重い話ではあるのだが、あくまでも『根拠なき自説』であるので、気軽に聞いて頂きたい。 世界的な右傾化の原因は、経済格差や...
-
以前も https://spockshightech.blogspot.com/2025/08/blog-post_05.html のようなことを考えてみたが、また別の視点から労働生産性について考えてみた。 日本の労働生産性はOECDの中でも低位にある。何が労働生産性向上の足を引...
-
非常用トイレの構想 は過去に何回か書いているが、ここで考えるのはもっと現実的なもので、極端な話、明日大震災が起きても使えるものだ。知恵として覚えておいて欲しい。 非常用トイレとして、高分子吸収剤によるものが市販されている。これは赤ちゃんのおむつや生理用品などと同じく、水分を吸収...
-
何もかも失ってしまいもう失うものがない人、という文脈で使われる「無敵の人」という表現だが、別の意味で無敵な人というのを考えてみた。それは、社会からのあらゆるしがらみからいつでも脱却できるために誰にも媚びる必要のない人、というものだ。これを「ポジティブ無敵の人」と命名してみた。...

0 件のコメント:
コメントを投稿