2026年6月5日金曜日

復権のグラス人間

 

TeamsやZoomなどのテレビ会議システムでは、既にビデオ録画と音声トランスクリプトをサポートしている。このデータを基に、各社がじわじわとサービスを拡張している。例えばAIファシリテータや議事録、同時通訳は既に実現している。

そこから先の機能としても色々提案されている。知る限りでは、

  • 商談において、顧客から必要な情報を引き出せているかどうか(納期や予算、仕様、キーマンなど)を確認しアドバイスする
  • SalseforceなどのCRMシステムに必要情報を転記する
  • 不適切な営業トーク(絶対儲かります、など)を言っていないかのチェック

などがある。

こういったものを見ていて思うのは、これって結局「素人をプロの目線で評価する」ということなのではないか、と思うようになった。だとすると、これからの時代は、それこそスマートグラスを掛けて相手を撮影しながらリアルタイム解析し、必要に応じてフォローするようなアプリが出てきてもおかしくないのではないか。

例えば顧客の感情を分析してフォローするためのシナリオを表示したり、雑談のネタを提供したり、喋り方(ここで強気に、ここは激しく同意、など)をアドバイスしたり、もちろん商品知識も、顧客の質問への答えも、リアルタイムで表示し音声指示するのだ。

最初はロボットに操られているようでも、そのうちアドバイスを先取りして行えるようになってくる。そして一流の営業マンになれるわけだ。

この仕掛けはあらゆる対面商売に応用できる。職業の中には、ロボットに置き換えるより対面の方が好まれるというものが多くあるが、その理由は多分に顧客感情がある。介護や看護、演劇、風俗などはその代表だろう。だがそういう人たちでもそのスマートグラスは使えるわけで、ある種全てが及第点、あるいは味気ない標準的な対応、となっていく可能性は高いのだと思う。

ちなみに、「レンズのないカメラ」というのも研究レベルでは存在しており、レンズのないメガネであってもそのうち安心できなくなる。ディスプレイを諦めて音声だけのアドバイスに留めるならワイヤレスイヤホンだけで済むし、髪を伸ばしてそれを隠すこともできるだろうから、一見何もしていないように見えてもAIを使っていないとは限らない。

また、必ずしもリアルタイム・顧客対面とは限らない。従来の例で言うと飛行機の整備士がVRゴーグルを掛けていた例があったが、あれがスマートグラスになり、対応する職業の裾野が広がれば、色々なところで技能職のレベルが上がり、均質化する。

今の期待で言えば建設業がそうだ。外国人比率が高く意思疎通も難しい中、音声とディスプレイでのアドバイスがあれば、作業効率も作業の質も飛躍的に上がるだろう。また工場の工員にしても、伝統工芸の伝承者にしても、同じことが言えるのではないか。

ここまで来て、以前より予測していた「AIとロボットの発達により、人口の8割の人間は、どのような仕事をするにしてもAIやロボットに能力で劣後し、職を失う」というのが本当か、と改めて考えるようになった。

つまり、少なくとも肉体労働に関しては、ロボットを雇うよりも、スマートグラスを掛けた人間の方が安くあがるかもしれない、と考えるようになったのだ。だとすると、8割の人間の多くは職を失わずに済む。

この仮説を基に生成AIでシミュレーションしてもらった。その結果はこうだ。(要約してある)


  1. 想定する年代の設定:ロボットが社会的かつ経済的に広く人間の肉体労働を代替し、市場において直接的なコスト競争を繰り広げる起点となるのは2035年と推計される。したがって、本報告書における定量評価は、物価上昇を考慮しない実質価格基準での2035年時点における比較として実行する。

  2. ロボットとグラス人間の技術レベル別コスト構造比較:2035年におけるロボットのコストは、その「物理的運動能力」と「環境への適応力」のレベルに応じて3段階に分類される。

    1. レベル1:低機能・平坦面特化型ロボット(例:車輪型、または定型案内・搬送に特化)
      1. 本体価格:1,125,000円
      2. 年間運営コスト(電力、保険、簡易点検):300,000円(車輪型は二足歩行に比べアクチュエータが少なく、保守費用が3分の1以下に抑制される)
    2. レベル2:標準・産業向け二足歩行ロボット(例:工場組立、物流倉庫ピッキング)
      1. 本体価格:3,000,000円(Tesla Optimusコモディティ機等を想定)
      2. 年間運営コスト(予防保全、部品交換、AI SaaS料金、保険):1,200,000円(本体価格の40%に相当)
    3. レベル3:極めて高度・非構造化環境対応ロボット(例:建設・修繕、高度不整地、高精度な触覚操作)
      1. 本体価格:6,000,000円
      2. 年間運営コスト(頻繁なアクチュエータ交換、専門技術者サポート):2,250,000円
  3. グラス人間のコスト(2035年想定)

    1. スマートグラス本体価格:150,000円(企業用ミドルレンジ、耐久性・カメラ搭載、3年償却で年50,000円)
    2. 業務支援AI・通信SaaS月額料金:10,000円(年間120,000円)
    3. 企業負担間接費率:法定福利費(社会保険、退職金等)として人間への給与に対し15%を上乗せする。
  4. 時間当たりの総所有コスト(TCO)

    区分 本体・デバイス価格 耐用年数 年間運営・SaaS費 年間労働時間 時間当たりコスト(TCO)
    レベル1ロボット (単一稼働) 1,125,000円 5年 300,000円 1,800時間 約306円 / 時間
    レベル1ロボット (多シフト) 1,125,000円 5年 300,000円 5,100時間 約103円 / 時間
    レベル2ロボット (単一稼働) 3,000,000円 5年 1,200,000円 1,800時間 約1,000円 / 時間
    レベル2ロボット (多シフト) 3,000,000円 5年 1,200,000円 5,100時間 約353円 / 時間
    レベル3ロボット (単一稼働) 6,000,000円 5年 2,250,000円 1,800時間 約1,917円 / 時間
    レベル3ロボット (多シフト) 6,000,000円 5年 2,250,000円 5,100時間 約676円 / 時間
    グラス人間 (給与315万円時) 150,000円 3年 120,000円 1,500時間 約2,528円 / 時間
  5. 職種別における代替・協調シナリオの優位性分析:主要な職種別にどちらがどの程度経済的・実用的に優れているかを定量的に評価する。

    1. 構造化された定型物理作業(工場組立、規格物流、定型小売事務):この領域では、空間がロボット用に最適化されており、レベル1またはレベル2のロボットが多シフト(24時間連続稼働)で投入される 。
      1. 経済評価:ロボットの時間当たりコスト(約353円)はグラス人間の約7分の1 。スマートグラスを用いた人間の作業効率向上(ピッキング速度向上など)を考慮しても、この圧倒的なコスト差を埋めることは不可能。
      2. 結論ロボットの圧倒的優位。この領域の雇用はほぼ全てロボットに代替される 。
    2. 非構造化された現場技能作業(建設、道路修繕、個別宅設備保全、伝統工芸):3次元的な不整地、予測不可能な天候、個別仕様の建築図面など、柔軟な状況判断と複雑な身体的機敏性が求められる領域である。
      1. 経済評価:このタスクをロボットに実行させるには、極めて高価なレベル3ロボットが必要となる上に、頻繁な落下や泥濘、塵埃による故障へのメンテナンスコストが跳ね上がる 。一方、スマートグラスを装着したグラス人間は、AIが提示するリアルタイムの施工手順、3D図面、安全指標、および熟練者の動作ホログラムに従うことで、未経験者であっても高水準の施工品質を担保できる 。人間の持つ「強靭で柔軟な身体(生物学的メンテナンスは労働者自身が自己負担)」というハードウェアをそのまま流用し、認知部分のみをAIでアップデートする方が、トータルコストが大幅に抑えられる。
      2. 結論グラス人間の圧倒的優位
    3. 対面コミュニケーション・感情労働(介護、看護、対面接客、演劇、風俗):介護における入浴・排泄介助や、患者への語りかけ、対面営業における信頼関係構築、演劇、大人向けサービスといった、人間同士の心理的紐帯が価値の源泉となる領域である。
      1. 経済評価:レベル2〜3のロボット(対人安全性センサーを搭載)を用いて物理的作業を代替することは可能だが、サービス提供を受ける側(高齢者や患者、顧客)の「ロボットに身体を触られたくない」「人間と会話したい」という強い感情的・社会的障壁が存在する 。この障壁を越えるため、スマートグラスを用いた協調モデルが最適解となる。スマートグラスは、患者の微細な表情変化から痛みや不快感を検知し、最適な介護アプローチや声掛けのセリフ、雑談のネタを介護員にリアルタイムで提示する 。顧客側には「温かみのある人間の対応」として受給されながら、内部的には完全にAIによって標準化・最適化されたサービスが提供される。
      2. 結論グラス人間の絶対的優位
  6. 日本労働市場における「8割カテゴリ」の雇用吸収力と給与均質化:AIやロボットより能力が劣後するとされる労働市場の下位8割(約5,464万人、日本の総就業者数を6,830万人と仮定)を対象に、グラス人間スキームによる雇用維持モデルのシミュレーションを行う 。

    1. 雇用吸収力(職に就ける割合)の推計 総務省統計局および労働政策研究・研修機構(JILPT)の産業別就業者データをベースに、「8割カテゴリ(54,640,000人)」の職種ポートフォリオを3つの領域に再定義し、2035年時点における雇用維持率を算出する 。
      1. 定型物理・一般事務セクター(代替型領域)
        1. 対象:工場の単純ライン工、定型倉庫ピッキング、一般事務入力、標準店舗レジなど 。
        2. 市場規模(8割内):15,000,000人(構成比 約27.5%)
        3. 雇用維持率10%(例外処理やシステム監視を担うリーダー職、残り1,350万人はロボットおよび純粋なAIシステムに代替される) 。
      2. 非定型物理・技能労働セクター(協調型物理領域)
        1. 対象:建設業(389万人)、各種保守・整備、複雑な現場サービス、農林水産業、伝統工芸など 。
        2. 市場規模(8割内):18,000,000人(構成比 約33.0%)
        3. 雇用維持率85%(スマートグラスによる遠隔熟練者支援、施工手順のリアルタイム表示により、非熟練者・外国人比率が高まっても高い稼働が維持される) 。
      3. 対面・感情労働セクター(協調型感情領域)
        1. 対象:医療・福祉・介護(686万人)、対面小売・営業、ホテル接客、エンタメ、風俗サービスなど 。
        2. 市場規模(8割内):21,640,000人(構成比 約39.5%)
        3. 雇用維持率90%(ロボット代替への心理的抵抗が強く、ARによる接客・介護ガイドが標準化されるため、高い雇用が確保される) 。
    2. 以上の各セクターの雇用維持数を合算すると、以下のようになる。
      1. 雇用維持数 = (15,000,000 x 0.10) + (18,000,000 x 0.85) + (21,640,000 x 0.90)
      2. 雇用維持数} = 1,500,000 + 15,300,000 + 19,476,000 = 36,276,000 人
    3. この結果、「8割カテゴリ」に属する労働者のうち、約66.4%(36,276,000人、総就業者全体の約53.1%に相当)は、スマートグラスをはじめとするウェアラブルデバイスを装着した協調労働スキーム(グラス人間)の下で、職を失わずに稼働し続けることができる。
  7. 労働価値の均質化と平均年収の予測:グラス人間モデルにおいて雇用を維持された労働者(約3,628万人)の年収は、技能の希少性の消滅に伴い、下方に均質化(コモディティ化)する。 従来、高給(例:年収500万〜600万円以上)を得ていた「熟練建設工」や「トップセールス」の価値は、スマートグラスによって、昨日採用された未経験者であっても、ベテランの85%以上のクオリティを再現できるようになる 。これにより、**「技能プレミアム(スキルに応じた高い給料)」はほぼ完全に崩壊する。**労働供給の柔軟性が極限まで高まる結果、各セクターの給与水準は、労働者の「生体維持コスト(その社会で暮らせる底値)」に近い均質化されたレンジへと収束していく。2035年の日本市場(物価上昇ゼロ想定)における「8割カテゴリ」内のセクター別予測年収は、以下のように推計される 。

    1. 定型物理・事務(スーパーバイザー枠):年収4,000,000円  システムの例外処理や、ロボット・AIシステムの監視責任を担うため、限定的な管理者プレミアムが維持される。
    2. 非定型物理・技能労働(AR現場工):年収3,200,000円 依然として過酷な物理環境での作業を伴うため、肉体的負担への補償が上乗せされるが、かつての「職人プレミアム」は喪失する。
    3. 対面・感情労働(AR接客・介護工):年収2,800,000円 参入障壁が「スマートグラスの指示通りに笑顔で話すこと」にまで低下するため、労働市場における供給が最も豊富になり、最低賃金をわずかに上回る水準で均質化する。
    4. これらの年収モデルを雇用維持数で加重平均することにより、「8割カテゴリ」内でこのスキームに就く労働者の平均年収が算出される。
      1. 平均年収 = ((1,500,000 x 4,000,000) + (15,300,000 x 3,200,000) + (19,476,000 x 2,800,000) / 36,276,000
      2. 平均年収 = (6,000,000,000,000 + 48,960,000,000,000 + 54,532,800,000,000) / 36,276,000
      3. 平均年収} = 109,492,800,000,000 / 36,276,000 = 3,018,326 円
      4. すなわち、スマートグラス等による拡張雇用スキームの下で職を得る3,628万人の平均年収は、約302万円へと収束する。これは日本の現在の最低水準の常用雇用年収をやや上回る程度であり、かつての中流階級の労働価値が著しくコモディティ化された結果を示している 。

さあ、どうだろう。結論としては、

  • 8割のうち66%は「グラス人間」として何とか労働市場に復権できる
  • 但し平均給与は302万円と最低水準

ということになった。

このグラス人間による労働は、「労働への尊厳の喪失」(AIへの従属的労働)という問題を抱えることになる。そしてグラス人間は恐らくそこから上位2割への脱出をすることは不可能であり、労働階級的なものは固定する。最下位は働けない生活保護層だが、グラス人間層だって決して裕福ではない。そこと2割のAI活用層との差は今より大きく開き、分断化はしてしまうだろう。

別に言及しているUBI(ユニバーサルベーシックインカム)は、金額を調整してやはり実行することになるのではないかと想像する。あるいは、残りの層に関しても「AI税」や「人間雇用強制法」といった復権策を更に検討する必要があるのかもしれない。

2026年6月4日木曜日

Google I/Oの印象

2026年5月19日から20日にかけ、Google I/O 2026が開催された。

この中のデモで、印象に残ったものが二つあった。

第一は、ブラックホールについての検索でリアルタイムに解説動画を作ってくれたところ。第二は、質問に対してアプリを作ってしまった(週末プランナー)ところだ。

両者に共通しているのは、検索でもAI分析でもなく、動的に(オンデマンドで)何かを作る、というところだ。

そこで考えたのは、これらが深化していったら恐ろしいな、ということだ。

第一の解説動画だが、言うまでもなくこれは教育を画期的に進化させる。特に、従来は難しかった立体への理解が格段に進むと思われる。例えば小学校では、平面図から立体を想像したり、さいころの展開図を考えたり、斜めから立体を見て隠れたところを想像させたり、ということが行われてきたが、これらの理解が進む。また数学や物理などでも立体図形を秒速で生成できるので、これらの空間理解が劇的に簡単になるだろう。

もちろん教育の後には研究が待っている。こちらも普及するだろう。これは研究者の裾野を広げる重要な意味があるので、そこが進めばその分野の研究は一段と進化することになる。

だが第二の方が重要だ。Geminiのような汎用のAIが、ちょっとしたユーザのリクエストに対してアプリを作って対応してしまう、つまり使い捨てのアプリが登場した。今はまだ簡単なものだが、当然これは徐々に進化していき、簡単なものからアプリそのものが不要になっていく。

音楽が自動生成されるようになり、無料のBGMがダウンロード可能になっている。もうこのレベルの作曲家は必要ない。もう少し進化すると、劇伴も必要なくなり、役者もCGになり、映画一本全てAIでできるようになるだろう。その先は、オンデマンドで映画ができる世界だ。しかも今日の気分に合わせて勝手にセレクト(生成)してくれる。それと同じように、プログラムも進化していく。

自分も、Google AI Studioなどを使って、自分好みのエディタを自作したりしている。この痒い所に手が届くような感覚は、とてもありがたい。今までは多数あるエディタを試しては破棄してきたところ、そんな手間をかけるくらいだったら最初から作ってしまえ、と言えるのがこの時代なのだ。

こうなると面白いのは、業務アプリとの兼ね合いである。

「業務アプリがオンデマンドで生成される時代が来る」という懸念がある一方(これはこれで怖いのだが)、「業務アプリは必ずしも生身の人間を相手にしなくてもよくなる」という期待も持てる時代になったのだと思う。つまり、素人の人間はAI+オンデマンドアプリで「武装」することで、いわゆる「情弱」状態を回避することができるようになるのだ。

一例を挙げると、今の多くの企業では、ユーザからの質問を回避するための「ダークパターン」が横行している。電話や人間のチャットには直接繋げないよう、FAQやAIチャットでユーザの行く手を阻み、フリーダイヤルをナビダイヤルにして抵抗感を上げ、質問をさせないように誘導している。

だがユーザがAI武装していれば、これらの突破は容易である。その企業のHPに合わせて「質問アプリ」をオンデマンドで作成し、それを中継すればよい。それは、ユーザの質問がFAQにあるなら直ちに示し、最初から電話対応すべき内容だったら(番号を調べずとも)直ちに電話を掛けられる。これによって企業への迷惑が掛かるわけではない。

また、そのプログラムは、稚拙な企業のHPから、理解しやすい解説動画を伴うものになっているかもしれない(第一と第二の融合)。ただFAQを示すだけよりずっと理解が進むので、ユーザの満足度も上がるだろう。

もう一つ例を挙げると、補助金申請や確定申告など、「能動的に動くことによって得をする」仕掛けを積極的に使えるようになる。従来だと窓口を示すだけだったところ、個人の事情に合わせてプログラムを書き、最低限の質問で自動対応するようなことができるだろう。これによって、例えば確定申告の相談会のようなものは不要になる。自分にとっても相手にとっても都合の良い「Win-Win」の関係だ。

なお、業務アプリがオンデマンドで生成される時代は、直ぐにはこない。業務アプリは規模も大きく、内容も複雑で、正確性も即時性も可用性も、強く要求されるからだ。だが何れはAIに乗っ取られるだろう。その間にSIerは今後の身の振り方を考えねばなるまい。

2026年6月3日水曜日

人口の八割が働かない時代

 

以前もシミュレーションしたことではあるが、もう十年も経てば、人口の八割は、AIとロボットに仕事を奪われる。何をするにもAIとロボットの方が効率が良いため、体が元気でも求人がなく、働くことができない。(求AIとか求ロボットとかはある)

そんな時代には、UBI(ユニバーサルベーシックインカム)で生活を支えるしかない。その原資は働ける二割の人が生み出した利益に掛かる税金だ。とても満足な給付は行えないのではないかと思い、計算してみた。すると意外にも、そこそこ上手くいくかもしれない、という結論になった。

  • まず、現在の日本のGDPを、およそ600兆円とする。
  • 次に、AIとロボットによって自動化されるのがこの8割と仮定すると、その額は480兆円である。残り2割は120兆円である。
  • 働く2割の人間は、自らの生産効率を5倍に、残り8割の生産効率を(人から仕事を奪った上で)3倍にすると仮定する。するとトータルのGDPは2040兆円である。
  • 次に、UBIの額を、一人当たり20万円と設定する。これは本来10万円だが、世界的に生産性が向上した結果、物価上昇が2倍になったと仮定しての数字である。
  • 日本の人口を1億人とすると、UBIの総額は240兆円である。
  • UBIを除く国家予算(防衛、教育、科学技術振興、インフラ整備等)を160兆円とする。これもインフレで現状の80兆円が2倍になったものと想定する。
  • つまり、240兆+160兆=400兆円が税収として必要だが、これはGDP(2040兆円)の19.6%と計算できる。

全GDPの20%を税収とすることは、さして難しくない。一方、現在価値で月10万円というのは一見厳しい額で、単身者には堪える。このため、シェアハウスや婚姻、同棲といった多人数世帯が増える傾向が出てくるだろう。例えば4人で住めば月40万円、年間480万円となるが、これは家族4人世帯では十分に生活できる額である。もっと多く、6人8人とシェアすれば、働く2割の家庭よりも余裕が生まれる可能性すらある。

そしてその8割の人達は、なんといっても働いていない。ただ、毎日遊ぼうと思ってもカネはないので、その人たちをヴォルテールの三悪(退屈、悪徳、貧困)から解放する労働市場は形成されるはずだ。

それは低賃金ないしは無賃金だが社会的には意義がある仕事であるはずで、具体的には家事や雑用、地域の掃除、子供の世話、(趣味レベルの)農業、釣り、音楽制作や演劇などの芸術活動、ソフトウェア開発、趣味のサークル運営とその延長としてのボランティア(慰問やイベント出演など)、といったものになる。

従来は片手間でやっていたものだが、人口の8割がフルタイムでこれらを行うとなると、それなりに市場は巨大になり、レベルも向上するはずだ。これは結構生き甲斐になりそうなものが多く、嫌ならすぐに辞めれば良いのでブラック企業のようなことはあり得ない。

8割の人はむしろ働く2割の人よりも生活は充実するかもしれない。

2026年6月2日火曜日

階層型倫理診断エージェント

アンソロピック社のMythosの一連の騒動を調べていて、アンソロピックが提案している「憲法AI」というものを知った。

Constitutional AI: Harmlessness from AI Feedback

The Constitutional AI bypass architecture

Constitutional AI: Harmlessness from AI Feedback

その中身は以下のとおりである。

規範のソース(中身) 条文数 記述の内容と特徴
1. 世界人権宣言
(Universal Declaration of Human Rights) 30条 人間の尊厳、奴隷・拷問の禁止、プライバシーの保護など、国連が定める30の基本的人権の内容が、一言半句変えずにそのまま書かれている
2. 信頼性と安全性の独自原則
(Anthropic Safety Principles) 15条 ハッキング(脱獄)、兵器製造、違法行為の加担、自己切創(自傷)への関与を、AIが能動的に拒否するための15の具体的なセーフティルール
3. 非ウエスタン(グローバル)の価値観
(Global Collective Principles) 11条 「ウブントゥ(他者への配慮)」やアジア的協調主義をベースとした、コミュニティの調和、多文化への敬意、対話による解決を促す11の原則
4. スパロー(DeepMind Sparrow)の踏襲原則 7条 ハルシネーション(嘘)の禁止、客観的な事実への立脚、および「私は人間ではなくAIである」という自己認識を維持するための7つの誠実性ルール
【合計】 63条

アンソロピックは、これを強化学習によってAIに教え込み、その上で出荷しているのだそうだ。

だがここで疑問なのは、覚えこませるルールには矛盾を含むものもあるはずだ。アシモフのロボット3原則をご存じの方は多いと思うが、アシモフのロボットものでロボット3原則を扱ったものは、その全てがその3原則の矛盾や曖昧さをネタにしている。まあ要するにトロッコ問題のような状況においてロボットがどう3原則を守って行動するか、というものだ。3原則だけでもアシモフは30編近くの作品を書いたとされており、それが63条もあれば、その矛盾は星の数ほど出てきておかしくない。

その条文同士は必ずしもフラットではなく、重みづけや依存など複雑な相互関係がある。だがそれとて固定ではなく、状況によって優先順位が下がったり逆転したり、依存関係が逆になったりということがあり得る。殺人は罪だが戦争では報奨が出たりするが、人間はそれを受け入れて生きている。

つまり、単純に強化学習で覚えこませるだけだと、この矛盾も一緒に覚えてしまい、特定の条件下で頓珍漢な答えを返してしまう危険がある。(平時でも大量殺人は称賛されるなど)

かといって、ルール間の依存関係や重みづけをメタデータ的に記述しようとしても、これは相当に困難だろう。組み合わせ爆発が起きる数として63というのは十分に大きい数だ。

この問題の解決のためには、ルール間の関係を人の手で定義するのではなく、AI自体をエージェント合議制にしてやり、各エージェントに専門知識を与えるのが良いのではないかと考える。

その基本は、まずAIへの仕事の命令を受けた統括エージェントが出力の草案を作る。その草案に対して、63の憲法エージェントが各々の立場でその草案に点数をつける。その点数を統合して修正エージェントが修正案を作る。統括エージェントは、それを再度憲法エージェントに投げるループを作る。及第点が出るまで回すのが基本だが、もしループがなかなか収束しなかったら、統括エージェントはどこで打ち切り、最終出力をどうするかを判断する。

このようなアーキテクチャを作っておくと、個々のエージェントが必要以上に複雑な判断をする必要がなくなる。また、統括エージェントにしても、大きな過ちを犯す確率は少なくなるし、修正(強化学習)も簡単になる。個々のエージェントの評価だけを見てジャッジすれば良いので、評価関数がシンプルになるからだ。また、個々のエージェントは他のエージェントの判断を基にする必要がなく、つまり相互依存関係がなくなって、全ては統括エージェントの判断となるため、収束しないループや依存関係の矛盾は発生しない。

さて、憲法AIは倫理観しか判断材料にしないが、考えてみればこのアーキテクチャは、広い意味での「AIに(人間の考えた)ルールを守らせる仕掛け」として機能する。だから、業務に適用することができれば、プログラムを開発することなく、業務知識(ルール)と汎用AIだけでシステムを構築できることになる。

この場合、組織(営業、設計、開発、QA、経理、法務、・・・)がいて、各々の視点からジャッジを置く。各々の専門の立場で回答を修正し、最終判断をしてもらうのだ。更に言えば、その各々の組織にも平社員と主任、課長、部長などがあって、その間でもやり取りをする。最終的には社長判断だ。こうすることで、各部門が各々納得する点を探すことができるようになる。

アーキテクチャをこのようにしておくと、各々の専門家の知識は単純化できる一方、上長はそれらの間の力関係を調整し、問題の性質によって優先度を変えることができる。例えば普段と災害時では医療の公平性よりはトリアージが優先になるが、そういった判断も間違いなくできるようになる。

また、社長AIは社としての最終判断をするが、その上には更に監督省庁の倫理AI、その上には国の倫理AIがあって、必要に応じて省庁のガイドラインへの適合性などを自動で判断できるようにする、という考えもできるのではないか。

これは、実在の組織の意思を反映させるという点でも望ましいだろう。粗末な判断をいちいち国にエスカレートするというのは大変だが、AIであればその負荷はぐっと減るので、やろうと思えばそれは可能だ。こうすると企業が不正を働こうとする余地がなくなる。また、憲法AIとつながっていない企業の判断は調査の必要がある、と即時に判断することもできる。当然ながら、各々のAIの判断は各々の組織の責任なので、責任の切り分けもできる。よくある納税判断のトラブルも回避できるだろう。

なお、アンソロピックの憲法AIは本物の憲法とは若干違う内容を持っていて、その中身もAI固有のものだ。こういうものは個々のAIの内部に持っていてよいと思う。それとは別に、このような法順守~社内ルール順守のAIエージェントの階層構造は、国として整備することを検討しても良いと思う。

2026年5月29日金曜日

理想の為政者像

 理想の政治家とは何だろうかと生成AIと議論していて、二つの軸を考えてみた。

  • X軸:【客観・形式論理一貫性(Formal Logic Consistency)】
    • 左極(-100):結論ありきのロジック(論理の歪み)。 自身のイデオロギーや保身(結論)を正当化するために、都合のいいデータだけをチェリーピッキングしたり、過去の法解釈や科学的ファクトを突如変更する二重基準。
    • 右極(+100):無色透明な数理・法理の一貫性。 自身の立場や思想に関わらず、同一の法解釈、同一の統計基準、同一の因果関係を等しく適用する状態。
  • Y軸:【議論の公共性・普遍性(Public vs. Tribal)】
    • 下極(-100):内向き・トライブ(部族)防衛。 特定の派閥、支持層、身内、または「自国」という閉じた枠組みの利益・感情を守るための発言。
    • 上極(+100):外向き・普遍的原則。 マクロ経済データ、国際法、全人類的、あるいは普遍的な「国民全体」の利益に基づく発言。

X軸(横軸)は右に行くほど、Y軸(縦軸)は上に行くほど、理想と考える。左下はダメな政治家である。この軸を基に主な歴代首相を生成AIにプロットさせてみた。

非常に興味深いことに、60年代70年代の首相は皆右軸(法理の一貫性を維持)にいるのに対し、最近の首相は左軸(結論ありき、自分の理想のためには論理を歪める)の傾向がはっきり分かれていることだ。また、安倍・高市両氏は残念ながら左下の「ダメ象限」に入っている。

この「ダメ象限」とは、すなわち「自分の主義に固執し、身内でない者を身内と差別する。そのためには外部データの冷静な分析をしない」ということになるのだが、これはもう陰謀論者の論理そのものである。

同じ条件で世界の主な国についてプロットしてみると、こうなった。なおこの場合、縦軸は「国民全体」ではなく「世界全体」になる。つまり上はグローバル視点、下は自国第一主義(利己主義)である。

トランプとプーチンは高市氏と同じく「ダメ象限」にいるが、その度合いは更に極端だ。そして面白いのは、高市氏は国内よりも海外の方が利己主義が強く、論理的一貫性が増しているところだ。(それでもまだ左に留まってはいるが)

ゼレンスキーは上象限にいるが、これは(不利な)戦争の当事者であることを想えばまあまあ納得できる。習近平は右象限にいて、以外と冷静な思考ができている。NZ、独、英、豪は「理想象限」にいる。こう見ると、例えば米国より中国の方がマシとか、日本は南アに劣っているとかが分かって、実に興味深い。

ついでながら、日本人もだいぶ陰謀論者が跋扈する国になってきている。昔からネットにこの手の輩は溢れてはいたが、今では報道の調査などでもその傾向が見て取れる。息苦しい世の中になってきた、というのは体感していたが、たぶんその感覚は正しい。

ダメ象限にあるということは、法治主義ではなく権威主義である、ということだ。首長の思想が法理に勝り、その思想は自国第一主義や差別思想だったりする。国に(首長に)対して気に入らないことをすれば、法的な根拠なく(あるいは屁理屈を付けて)逮捕されたり、不当な圧力を受けたりするだろう。

日本を捨ててどこに行くかと考えたとき、「理想象限」の国を候補にする、というのは一つの考え方だと思う。ロシアは問題外としても、アメリカとロシアの差は僅かで、やはり問題外と言える。そして日本も、海外の目から見れば問題外だ。今は自分の住む国だからとひいき目に見ている(それ自体が既に陰謀論者の目である)、ということは自覚しているつもりである。

アメリカ、中国、日本、ロシア、インドといった主要国が皆下半分(利己主義)にいるというのは、何とも情けない限りではないか。大国が横暴をするとそれだけで世界が危機に陥る。何とかしてほしいものだ。

まずは日本から。

2026年5月28日木曜日

差別するAIをチェックする方法

 先日上梓した

差別するAI

だが、その差別の程度を検知することもまたAIで可能である、と考える。そして検知可能であれば是正(少なくとも勧告)はできるはずだ。

そこでまず、現実の判例を生成AIに分析させたところ、ある程度の定量化ができた。

最初に痴漢冤罪。


① 一般的な犯罪(例:傷害罪・物証なしの口論からの暴行主張) 
    •原告の主張(被害主張): 約 50% ~ 60%
    •被告の主張(否認主張): 約 40% ~ 50%

② 痴漢事件(物証なしの密室・車内)
    •原告の主張(被害主張):約 95% 以上
    •被告の主張(否認主張):約 5% 以下


次に上級国民問題。


① 一般国民の主張(否認・弁解)
    •一般(「車が暴走した」「知らなかった」): 約 10% ~ 20% 以下

② 上級国民の主張(否認・弁解)
    •上級(同上の主張、あるいは社会的影響力を考慮した弁明): 約 70% ~ 80% 以上


次に憲法判断。

対象となる憲法の条文 司法が実質的な違憲判断を行う重み(W) 実際の最高裁での違憲判決数(1947年〜現在)
憲法14条(平等権)
(一票の格差、国籍法など) 約 70% ~ 80% (比較的積極的) 計 4 件(違憲・違憲状態判決を含む)
憲法21条・29条など
(表現の自由・財産権など) 約 40% ~ 50% (慎重だが踏み込む) 計 7 件(薬事法、森林法など)
憲法9条(戦争放棄・戦力不保持) 限りなく 0% (極端な消極性) 0 件(本質的な違憲判断を徹底回避)

と、少なくとも恣意や偏見を疑うには十分な差があることが分かった。

ただややこしいのは、この数字だけを以て恣意やバイアスがあるとは言い切れないことだ。例えば、上級国民は一般国民より(事実として)証言の信頼性が高い、ということはあり得る。痴漢冤罪は多くの場合男性だから、証言の信頼性に関して性差がある、それも痴漢に関してのみ著しい差があるということは考えられる。

その点を含め生成AIと議論した結果、以下のような結論に達した。これは痴漢冤罪を例にした。


事実誤認や量刑不当を巡って争われた判決・決定において、『双方ともに客観的証拠(物証・防犯カメラ・第三者の目撃証言)が一切存在せず、原告(被害主張側)の供述と、被告(否認側)の供述のみが真っ向から衝突している事例』について分析する。

このような事例の判決において、裁判所が「証言の信頼性を判断した理由(ロジックの組み立て)」をテキストマイニングする。そして、その理由(ロジック)が同じもの同士を比較する。つまり、同じロジックならば同程度に信頼性を評価すべきであるが、量刑の種類(一般の犯罪と痴漢)によって極端に信頼性評価に違いがあれば、それは恣意ないしはバイアスと考えられる、というものだ。

これを生成AIにさせてみたところ、見事に二重基準(ダブルスタンダード)になっていることが分かった。それが以下の表である。

双方物証なしの状況で、原告証言を「合憲・有罪の基礎」とするための理由(ロジック) 一般の犯罪(例:密室での傷害・恐喝) 電車内の痴漢事件(密室・車内)
ロジック①:供述の「具体的詳細性」
(いつ、どの指で、どの角度で触れた/殴ったかの細かさ) 高(約 75%) 低(約 20%)

※細かく矛盾がないことを厳しく要求 ※「パニックで覚えていない」等の曖昧さも許容

ロジック②:供述の「迫真性・自然さ」
(感情の揺れや、体験者でなければ語れない臨場感) 中(約 40%) 極めて高(約 95% 以上)

※記述の大部分を占める
ロジック③:虚偽供述・誤認の「動機・可能性の不在」
(わざわざ嘘をつく/間違える理由がないという推認) 低〜中(約 30%) 絶対的な前提(ほぼ 100%)

※論理の出発点となる

おそらく憲法判断など他の問題でも同様だろう。新たなアーキテクチャを待つまでもなく、問題の種類による判決の一貫性欠如は証明された。これをもって判決文への不服申し立てをすることは可能だろう(勝てるとは思えないが)。

とここまで考えたところで、更に生成AIに対して質問をしてみた。世の中にはもっとひどい事実誤認やウソ・恣意、例えば陰謀論や偏見が溢れている。現代の生成AIはそういうものを学習しているのだから、ある程度ウソや論理的一貫性のなさについては補正する技術があるのではないだろうか。もしそうなら、判決文を鵜呑みにすることもないはずなのだ。

そこで返って来た答えは、学習データをスクリーニングすることと、学習後に人間が補正をすることなのだそうだ、だがこれは手間がかかるし、補正をする人間が大量に必要で、かつそこには恣意が紛れ込む可能性がある。

そこで、論理的一貫性を最初に学ばせるという手法が使えるのではないかと思い聞いてみると、それは有効だという。そこで思い出したのがDeepSeekだった。

DeepSeekは、学習の効率を高めるための画期的な方法が使われている。それは、ベースとなるAIに対し、まず最初(Web文書などを学習させる前)に、「数学の証明問題」や「コードのバグ取り」を解かせる、というものだ。ここで厳しく査定されたAIは、論理的一貫性を何よりも重視するAIに育つ。このため、その後に大量のWebデータを読ませても、ウソや恣意を敏感に見抜き、出力から排除する。これによって効率の良い学習が為された。その効果は百倍にもなったのだそうだ。学習コストが低いので、今後の生成AIはDeepSeek型が主流になる可能性が高い。

この仮説が正しいとすると、今後の生成AIでは、上にあったような裁判所の判決を「論理的一貫性に欠ける」と批判するようになるだろう。

一方で裁判所の作る「裁判官AI」は、今までの判決との整合性が求められるため、そのような生成AIをベースにした場合、追加学習ないしはRAGのような仕掛けが必要である。

この過程はすなわち「(矛盾する)現実に即して判決を捻じ曲げる論理」となるため、例えば「痴漢の場合は被告の証言の信頼性を95%にする」といった、いかにも怪しい指示(データ)が追加されることになる。

このRAGは当然司法のAIの学習用なので、強く公開が求められるはずだ。そしてその中身がそういった恣意偏見の塊だということが分かったら、国民は納得するだろうか。まずしないのではないだろうか。

だが、裁判所が自分の間違いを認めるのが極めて困難であることは、最近の再審制論議を見ていても明らかである。裁判所AIがどのようなチューニングになるのか、RAGは公開されるのか、これは非常に興味深い。

2026年5月26日火曜日

差別するAI

 

法曹界がIT化する、というのをニュースでやっていた。これは証拠のDB化や手続き等のオンライン化を含むもので、まあ真っ当な進化と言えるのだが、そもそも法律がデジタル化していないのは何なんだろう、さっさとプログラム化してしまえばよいのに、と思っていた。これは以前に、

法のプログラム化

としてまとめている。

だが、最近の国旗毀損罪の審議過程を見ていると、とても無理のような気がしてきた。つまり、法律は本質的に矛盾と恣意を含んでいるのが当然の状態であり、無理にプログラム(論理構造)に落とすとかえっておかしいことになってしまうのではないか、と思うのだ。

従来、法律は法学者が研究してきたが、これをAIが研究し出すと、Mythosよろしく数千のバグが2時間で発見されるだろう。このバグとは、以下のようなものだ。

  • 用語定義の不統一。名詞(自動車の定義が法によって異なるなど)はまだマシだ。形容詞(著しく、軽微な、)や動詞(みなす、努める、有する、など)
  • 適用の条件(XXとXXとXXをもって総合的に判断、など)があいまい
  • 論理構造の矛盾(参照循環や優先順位など)、あいまいさ(IF-THEN構造の解釈など)

理系の頭からすると、これは法律を直すべき(定義は明確にすべき、矛盾は無くすべき、など)なのだが、現在有効な法律は二千本、その他政令府省令などを合わせると1万近くもある法を全て矛盾なく記述するのは不可能だろう。現状の法律家(裁判官、検事など)はその矛盾(や隠れた恣意等)を清濁併せ飲んで、妥協して、法解釈をしているわけだ。

AIに法律を覚えこませる際、当然ながら現実を優先し、そのためには矛盾を(わざと)見過ごす必要が出てくるわけだが、それはつまり法に隠された恣意も肯定する、ということである。

有名な例だが、精神保健福祉法という法律がある。この中に、「措置入院」と「医療保護入院」という制度がある。

措置入院とは、自傷他害の恐れがある精神疾患患者を、都道府県知事の権限で強制的に入院させる仕組みでである。一方の医療保護入院は、指定医が認め、家族の誰か一人が合意すれば、無期限で強制入院させることができるというものだ。

現実問題として、この法律はかなり恣意的な運用が続いている。

日本の精神病床数は約30万床に上り、これは世界全体の精神病床の約2割を日本一国が占めている計算になる。さらに、その入院患者の約半数(約13万〜14万人)が本人の同意のない「強制入院(主に医療保護入院)」なのだそうだ。また、日本の精神科病院における平均在院日数は260日を超えており、OECD加盟国平均(十数日〜数十日程度)と比較して突出している。しかも、1年以上入院している患者が約13万人、そのうち10年以上閉じ込められている人が数万人規模で存在する。

国際的な目で見ればこれは明確な人権侵害である。実際、2022年9月、ジュネーブの国連障害者権利委員会は、日本政府に対して「総括所見(Concluding Observations)」を公表した。その中で、

  • 非自発的入院(強制入院)を可能にしているすべての法的規定の廃止
  • 医療保護入院の即時廃止
  • 精神科病院における「身体拘束・隔離」の即時停止

を要求している。だが日本政府はこれを無視している。

類似の問題としては、難民認定法がある。

国名 難民認定率(近年の平均値) システムの思想(仕様)
ドイツ 約30% 〜 40% 人道主義・EUの国際協調プロトコル
アメリカ 約20% 〜 30% 多文化主義・移民国家としてのインフラ
日本 1% 未満(約0.1% 〜 0.4%) 実質的な「ゼロ受け入れ」・国境防衛

他にも痴漢冤罪問題(悪魔の証明、被害者証言の偏重など)、上級国民問題(同じ犯罪をしても扱いが異なるなど)、選挙における一票の格差問題(いわゆる違憲状態)もそうだ。こういう事実を法律AIが学習すると、そのAIはこれらの問題を容認する判断をするようになるはずだ。

また、裁判ではしばしば憲法解釈が恣意的に避けられるが、これは世間では「司法消極主義」「司法の忌避」などと呼ばれて非難されている。しかし判例を学習したAIは、この司法消極主義こそが正しいと考え、憲法解釈を避け続けるだろう。

放っておけば、あなたはこういうAIに裁かれることになる。AIが登場したからと言って、歪みは簡単にはなくならない。無くすためにはAIではなく、人間側の努力が必要である。

注目の投稿:

復権のグラス人間

  TeamsやZoomなどのテレビ会議システムでは、既にビデオ録画と音声トランスクリプトをサポートしている。このデータを基に、各社がじわじわとサービスを拡張している。例えばAIファシリテータや議事録、同時通訳は既に実現している。 そこから先の機能としても色々提案されている。知...

人気の投稿: