2026年5月28日木曜日

差別するAIをチェックする方法

 先日上梓した

差別するAI

だが、その差別の程度を検知することもまたAIで可能である、と考える。そして検知可能であれば是正(少なくとも勧告)はできるはずだ。

そこでまず、現実の判例を生成AIに分析させたところ、ある程度の定量化ができた。

最初に痴漢冤罪。


① 一般的な犯罪(例:傷害罪・物証なしの口論からの暴行主張)原告の主張(被害主張): 約 50% ~ 60% •被告の主張(否認主張): 約 40% ~ 50%

② 痴漢事件(物証なしの密室・車内)原告の主張(被害主張):約 95% 以上被告の主張(否認主張):約 5% 以下


次に上級国民問題。


① 一般国民の主張(否認・弁解)一般(「車が暴走した」「知らなかった」): 約 10% ~ 20% 以下

② 上級国民の主張(否認・弁解)上級(同上の主張、あるいは社会的影響力を考慮した弁明): 約 70% ~ 80% 以上


次に憲法判断。

対象となる憲法の条文 司法が実質的な違憲判断を行う重み(W) 実際の最高裁での違憲判決数(1947年〜現在)
憲法14条(平等権)
(一票の格差、国籍法など) 約 70% ~ 80% (比較的積極的) 計 4 件(違憲・違憲状態判決を含む)
憲法21条・29条など
(表現の自由・財産権など) 約 40% ~ 50% (慎重だが踏み込む) 計 7 件(薬事法、森林法など)
憲法9条(戦争放棄・戦力不保持) 限りなく 0% (極端な消極性) 0 件(本質的な違憲判断を徹底回避)

と、少なくとも恣意や偏見を疑うには十分な差があることが分かった。

ただややこしいのは、この数字だけを以て恣意やバイアスがあるとは言い切れないことだ。例えば、上級国民は一般国民より(事実として)証言の信頼性が高い、ということはあり得る。痴漢冤罪は多くの場合男性だから、証言の信頼性に関して性差がある、それも痴漢に関してのみ著しい差があるということは考えられる。

その点を含め生成AIと議論した結果、以下のような結論に達した。これは痴漢冤罪を例にした。


事実誤認や量刑不当を巡って争われた判決・決定において、『双方ともに客観的証拠(物証・防犯カメラ・第三者の目撃証言)が一切存在せず、原告(被害主張側)の供述と、被告(否認側)の供述のみが真っ向から衝突している事例』について分析する。

このような事例の判決において、裁判所が「証言の信頼性を判断した理由(ロジックの組み立て)」をテキストマイニングする。そして、その理由(ロジック)が同じもの同士を比較する。つまり、同じロジックならば同程度に信頼性を評価すべきであるが、量刑の種類(一般の犯罪と痴漢)によって極端に信頼性評価に違いがあれば、それは恣意ないしはバイアスと考えられる、というものだ。

これを生成AIにさせてみたところ、見事に二重基準(ダブルスタンダード)になっていることが分かった。それが以下の表である。

双方物証なしの状況で、原告証言を「合憲・有罪の基礎」とするための理由(ロジック) 一般の犯罪(例:密室での傷害・恐喝) 電車内の痴漢事件(密室・車内)
ロジック①:供述の「具体的詳細性」
(いつ、どの指で、どの角度で触れた/殴ったかの細かさ) 高(約 75%)
※細かく矛盾がないことを厳しく要求 低(約 20%)
※「パニックで覚えていない」等の曖昧さも許容
ロジック②:供述の「迫真性・自然さ」
(感情の揺れや、体験者でなければ語れない臨場感) 中(約 40%) 極めて高(約 95% 以上)
※記述の大部分を占める
ロジック③:虚偽供述・誤認の「動機・可能性の不在」
(わざわざ嘘をつく/間違える理由がないという推認) 低〜中(約 30%) 絶対的な前提(ほぼ 100%)
※論理の出発点となる

おそらく憲法判断など他の問題でも同様だろう。新たなアーキテクチャを待つまでもなく、問題の種類による判決の一貫性欠如は証明された。これをもって判決文への不服申し立てをすることは可能だろう(勝てるとは思えないが)。

とここまで考えたところで、更に生成AIに対して質問をしてみた。世の中にはもっとひどい事実誤認やウソ・恣意、例えば陰謀論や偏見が溢れている。現代の生成AIはそういうものを学習しているのだから、ある程度ウソや論理的一貫性のなさについては補正する技術があるのではないだろうか。もしそうなら、判決文を鵜呑みにすることもないはずなのだ。

そこで返って来た答えは、学習データをスクリーニングすることと、学習後に人間が補正をすることなのだそうだ、だがこれは手間がかかるし、補正をする人間が大量に必要で、かつそこには恣意が紛れ込む可能性がある。

そこで、論理的一貫性を最初に学ばせるという手法が使えるのではないかと思い聞いてみると、それは有効だという。そこで思い出したのがDeepSeekだった。

DeepSeekは、学習の効率を高めるための画期的な方法が使われている。それは、ベースとなるAIに対し、まず最初(Web文書などを学習させる前)に、「数学の証明問題」や「コードのバグ取り」を解かせる、というものだ。ここで厳しく査定されたAIは、論理的一貫性を何よりも重視するAIに育つ。このため、その後に大量のWebデータを読ませても、ウソや恣意を敏感に見抜き、出力から排除する。これによって効率の良い学習が為された。その効果は百倍にもなったのだそうだ。学習コストが低いので、今後の生成AIはDeepSeek型が主流になる可能性が高い。

この仮説が正しいとすると、今後の生成AIでは、上にあったような裁判所の判決を「論理的一貫性に欠ける」と批判するようになるだろう。

一方で裁判所の作る「裁判官AI」は、今までの判決との整合性が求められるため、そのような生成AIをベースにした場合、追加学習ないしはRAGのような仕掛けが必要である。

この過程はすなわち「(矛盾する)現実に即して判決を捻じ曲げる論理」となるため、例えば「痴漢の場合は被告の証言の信頼性を95%にする」といった、いかにも怪しい指示(データ)が追加されることになる。

このRAGは当然司法のAIの学習用なので、強く公開が求められるはずだ。そしてその中身がそういった恣意偏見の塊だということが分かったら、国民は納得するだろうか。まずしないのではないだろうか。

だが、裁判所が自分の間違いを認めるのが極めて困難であることは、最近の再審制論議を見ていても明らかである。裁判所AIがどのようなチューニングになるのか、RAGは公開されるのか、これは非常に興味深い。

0 件のコメント:

コメントを投稿

注目の投稿:

差別するAIをチェックする方法

 先日上梓した 差別するAI だが、その差別の程度を検知することもまたAIで可能である、と考える。そして検知可能であれば是正(少なくとも勧告)はできるはずだ。 そこでまず、現実の判例を生成AIに分析させたところ、ある程度の定量化ができた。 最初に痴漢冤罪。 ① 一般的...

人気の投稿: