sekaiwoyakusu’s blog

世界の"おもしろそう"を日本語に訳します



SEKAIWOYAKUSU

世界の"おもしろそう"を日本語に

再犯を予知するソフトウェアは人種差別的?

スポンサーリンク

f:id:sekaiwoyakusu:20160706111445j:plain

2014年春のとある午後、ブリシャ・ボーデンは教父の娘を学校に迎えに行く途中、ガギがかけられていない子供用の自転車とキックスクーターを見つけた。ボーデンと彼女の友だちは、自転車とキックスクーターを盗み、郊外まで乗って行こうとした。

当時は18歳だった彼女たちは、自分たちには盗んだ自転車とキックスクーターが小さすぎると気づいた。自転車の持ち主である6歳の子供の母親が、自分の子供の自転車が盗まれたことに気づき、叫びながら追いかけてきた。ボーデンと彼女の友だちは、自転車とキックスクーターを乗り捨て立ち去りました。しかし、もう手遅れだった。近所の住人がボーデンたちが盗みを働いた瞬間を目撃しており、すでに警察に通報していた。ボーデンたちは、住居侵入と窃盗の容疑で逮捕された。彼女たちが盗んだ品の価値は80ドルだった。 

ボーデンたちが犯した罪と似たケースを比較してみよう。去年の夏、41歳のヴァーノン・プラーターは、86.35ドル分の日曜大工用品をホームセンターで万引きした罪で逮捕された。 

プラーターは、盗みの常習犯だった。彼は過去に凶器を使った強盗の未遂と2回の凶器を使った強盗の罪で5年間を刑務所で過ごした。ボーデンにもプラーターと同様に前科があったものの、未成年のときの軽犯罪だった。

しかし、ボーデンとプラーターが刑務所に収用される際に奇妙なことが起こった。奇妙なこととは、犯罪者が将来的に再び犯罪をおかす可能性を数値化するコンピューター・プログラムが導き出した結果だ。黒人のボーデンの再犯の可能性は高く、白人であるプラーターの再犯の可能性は低いという結果がでたのだ。

2年後、コンピューターのアルゴリズムが導き出した結果と真逆のことが起こった。再犯の可能性が高いと判断された黒人のボーデンは、新たに犯罪をおかすことはなかった。再犯の可能性が低いと判断された白人のプラーターは倉庫に忍び込み、数千ドルの電子機器を盗んだ付きで懲役8年の実刑判決をうけ、服役している。

このように再犯の可能性を数値化することは、リスク評価の1種であり、全米の法廷で活用されるケースが急速に増えている。アメリカの刑事司法制度のどのステージにおいても、容疑者を保釈すべきかどうかを決断するための判断材料となっており、保釈金の額の設定にも用いられている。ボーデンの事件では、被告人の釈放を決定づけるより根本的な決断のプロセスにも活用された。アリゾナ、コロラド、デラウェア、ケンタッキー、ルイジアナ、オクラホマ、ヴァージニア、ワシントン、ウィスコンシン州では、裁判官が量刑を行う上での判断材料として採用されている。

再犯の可能性は、社会復帰やリハビリテーションの必要性と連動して計算される。司法省の国立矯正機関は、アルゴリズムによる再犯の可能性と社会復帰やリハビリテーションの必要性を組み合わせた計算を刑事司法制度のどのステージにおいても活用されるように奨励している。現在、アメリカ連邦議会で懸案中の財政改革案が可決された場合、こういった再犯リスク評価のシステムを連邦刑務所にて使用することを命じる可能性がある。

2014年、法務長官であったエリック・ホルダー氏は再犯リスク評価のシステムの導入は、法廷にバイアスをかけると警告しており、量刑委員会にシステムのさらなる検証を要求した上で、「システム導入の提案は、善意に基いてされたものだ。しかし、このシステムの導入は私たちの努力によって培われてきた、すべて個人に対する公平な正義の土台を不注意に壊しかねない。また、システムの導入によって、私たちの社会と刑事司法制度において、あまりにも一般化してしまった不当な主張と不均衡をさらに助長しかねない」と主張している。

最終的に量刑委員会はシステムの導入は見送ったものの、システムの検証には乗り出した。毎年1000万ドルの寄付をもとに調査報道をおこなうNPOメディアであるProPublica(プロパブリカ)は、隠蔽されてきたシステムのアルゴリズムがアメリカ社会に及ぼす影響について検証を行った。私たちは、2013〜2014年までにフロリダ州のブロワード郡で逮捕された7,000人を対象に行われた再犯リスク評価の結果(リスク点数)を手に入れた。そこで、逮捕されてから2年以内に再犯をおかした人は何人いるかを検証した。この際に用いられたベンチマークは、再犯リスク評価を行う上で用いられているアルゴリズムを作ったエンジニアによって作成されている。

検証の結果、再犯リスク評価システムは凶悪犯罪の再犯予測に関しては、特に信頼性がないことが分かった。再犯リスクがあると判断された受刑者のうち、実際に再犯を行ったのは全体のうち20%だけだった。軽犯罪を含むすべての犯罪を対象にすると、アルゴリズムが導き出す再犯リスクは、コインを投げて表か裏が出るかを当てる確率よりもいくらか高い程度だ。再犯する確率が高いと判断された受刑者のうち61%は、出所から2年の間に何らかの罪を犯している。

また、私たちはホルダー氏が危惧していた人種による不均衡が起こっていることを発見した。システムのアルゴリズムが導き出した、黒人と白人の再犯リスク評価は似たような数値だったが、実際の結果は全く逆だったのだ。

つまり、

白人はアルゴリズムによって再犯リスクが低いと判断 → 実際の再犯率は高い

黒人はアルゴリズムによって再犯リスクが高いと判断 → 実際の再犯率は低い

という結果となったのだ。

システムは黒人の再犯リスクが高いと認定する確率は、白人の場合よりも2倍も高く、白人は再犯リスクが低いと間違ったレッテルを貼っている。この不均衡が起こっている理由を被告人の前科や逮捕されたに犯した犯罪の種類によって、説明することができるのだろうか?結果から言えば、説明することはできない。私たちは、人種的な影響を分離させた上で犯罪歴と常習性、そして年齢と性別に対して統計的な分析を行った。

それでも、黒人は将来的に凶悪犯罪をおかすリスクは77%、他の犯罪をおかすリスクは45%と高かった。

再犯リスク評価システムのを開発した企業の言い分

フロリダ州において用いられている再犯リスク評価を算出するアルゴリズムは、営利目的の企業であるNorthpinte社によって開発された商品が用いられいる。同社は私たちが行った分析に反論している。

同社からの手紙には、プロパブリカが行った分析の手法に対する批判と自社製品の精度を擁護する内容で次の通りに記載されていた。

「弊社は、貴団体が行った分析結果と分析結果に基づいた主張が正しい、もしくは分析に用いられたサンプルによって正確に導かれた結果であるということに同意しません」

Northpinte社のソフトウェアは、評価ツールとして米国内でもっとも広く使われています。同社は、再犯リスク評価に用いられている計算方法を一般に公開はしていない。よって、公衆も、被告人もどのような要因が、この人種的な不均衡を助長しているのかを調べることはできない。(備考:去る日曜日、Northpinte社はプロパブリカに対して再犯リスク評価に用いられている計算方法の基礎を公表しました。リスク評価には、教育レベルや職業に就いているか否かなどの要素が判断材料として用いられていることが分かったが、これ以上の詳細な情報は公表されなかった。)

Northpinte社の主力商品は、137個の設問に対して被告人を回答させるか、これまでの犯歴に関する資料から回答を導き出し、再犯リスクを評価する。137個の設問には人種に関する質問は1つも含まれていないが、「両親のうちどちらかが、刑務所か留置所に送られたことがありますか?」、「あなたの知り合いや友人の中で違法薬物を摂取した人は何人いますか?」、「学生時代は、どのくらいの頻度で喧嘩をしていましたか?」といった質問は含まれている。また、「空腹状態にある人はモノを盗む権利があるか」、「もし、他者があなたを激怒させた場合、あなたは危険になりますか」といった質問に同意するか、反対するかを回答させる設問も含まれている。

再犯リスク評価システムの導入によってもたらせる恩恵は、明確だ。アメリカは他国と比べ、はるかに多くの人々を収監しており、その中でも黒人が多く、人種間で不均衡が起こっている。過去2世紀以上にわたり、法的プロセスにおける重要な意思決定は、公判前手続き、判決の言い渡しから仮出所まで人間の手に委ねられている。言うまでもないが、人間による意思決定は、自身の直感と個人的な偏見に影響される。

もし、コンピューターがどの犯罪者が再犯するかを正確に予測できるのであれば、刑事司法精度は、より公平で、誰がどのくらいの期間収監されるべきなのかを決定する基準がより厳しくなるだろう。但し、コンピューターが再犯リスクを正確に予測できることが前提だ。もし、コンピューターが間違った決断を下した場合、危険な犯罪者が自由な身になり、社会に放たれる可能性がある。逆を言えば、誰かが不当に厳しい罪刑や仮出所までの期間が長くされてしまう可能性もある

ポール・ジリーは、算出された自身の再犯リスク値を聞いたとき、それが裁判官が下す決断に大きな影響を及ぼしていることに気がついた。ジリーは、芝刈機や大工品を盗んだ罪で2015年2月15日にウィスコンシン州の裁判所で判決が言い渡された。検察官は、懲役1年と出所後は1年の保護観察を適用することを求刑し、この司法取引にジリーの弁護士は同意した。

しかし、Northpointes社製のソフトフェアが算出したジリーの再犯リスク値が高いことと、常習性が認められることを理由に裁判官を務めたジェームス・バブラー氏は、司法取引の合意を破棄し、懲役2年と保護観察3年を確定した。

再犯を予知するためのシステム構築の歴史

長い間にわたり犯罪学者は、どの犯罪者がより危険なのかを、保釈するべきか否かの判断を下す前に予測しようとしてきた。1970年代まで、犯罪者の危険性を予測する上で人種、国籍、肌の色は判断材料として使われていた。しかし、こういった判断材料をもとに犯罪者の危険性を予測することが政治的に容認できない時代がくると、コロンビア大学の法律学教授であるバーナード・ハーコート氏が策定した質問とそれに対する回答を基準に行う、リスク評価方法が用いられることになる。

1980年代は、犯罪の波がアメリカ国民を恐怖に陥れた時代だった。立法者は、裁判官と仮釈放委員会に対して量刑を判断する際の自由裁量の行使を厳しく制限した。連邦政府と州政府は、刑罰を強制し始め、いくつかのケースでは仮釈放の廃止を行い、犯罪者個人を評価することの重要性を軽んじるようになった。

しかし、いくつかの州は増加し続ける入所者と拡大する刑務所に対する予算の確保が難しくなってきたことから、再犯リスクを予測するシステムの活用するケースが再び増えてきている。

アメリカ国内では、多くの再犯リスク評価のシステムが導入されているが、その中にはNorthpointe社のような営利目的の企業よって開発されたものもあれば、非営利目的の団体によって開発されたものもある。ケンタッキー州とアリゾナ州で採用されているのはPublic Safety Assessmentというローラ・アンド・ジョン・アーノルド財団によって開発されたシステムで、同財団はプロパブリカの資金提供者でもある。

こういった犯罪リスク評価に関する研究は少ないが、過去に行われてきた。2013年、研究者であるサラ・デスマレイス氏とジェイ・シン氏は、アメリカ国内で使用されている19の異なるリスク評価を分析した。その結果、正当性の検証に用いられている研究論文は1つか2つだけだった。そして、リスク評価を算出する上での検証は、ソフトウェアを開発した人たちによって実行されている。

2012年に彼らが行ったリサーチでは、リスク評価システムは予測的妥当性は、可もなく不可もなくといった正確性だった。そして、デスマレイス氏は「再犯リスク評価システムは人種的な偏見の影響を受けているか」を検証している確固たる研究結果は、アメリカ国内では見つからなかったため、こういった研究はなされていなかったようだ。

当時から、再犯リスク評価システムに人種的な不均衡が起こっているかを検証する試みは、いくつか行われた。2016年、Northpointe社製のシステムではないが、35,000人の受刑者の執行猶予の期間を決定するために使用されていた他社のシステムの信頼性が検証された。研究者であるカリフォルニア大学のジェニファー・スキーム氏と連邦裁判所のクリストファー・ロウェンキャンプ氏は、黒人の犯罪者の再犯リスク評価の平均が他の人種と比べて高く、これは偏見が起因しているわけではないと結論づけられた。

再犯リスク評価システムの使用が増えることは議論を醸しているおり、昨年はAP通信、Marshall Project、FiveThirtyEightで記事にされ、メディアの注目を集めている。

最新のシステムは、もともと裁判官に被告人を更生させるために、どのようなタイプの処置が必要であるかを提案するようにデザインされたものだ。提案する処置は、薬物中毒に対する治療や心理カウンセリングなどにわたる。

オハイオ州などで用いられている再犯リスク評価システムの作成者である、シンシナティ大学のエドワード・ラテッサ教授は、システムについて次のように発言している。

「裁判官が被告人を保護観察処分にした場合、システムは多くの社会奉仕活動を与える、もしくは保護観察処分という決断は失敗すると助言する」

しかし、特に審問の間にふさわしくない処罰や処置に科すことが提案された場合、必要がないにも関わらず、被告人を投獄する確率が上昇する。また、被告人が自身に下された再犯リスク評価の結果に対して異議申し立てをする機会は限られている。リスク評価の結果は、被告人の弁護士と共有されるが、その結果が導かれるまでに用いられたデータは計算方法が公表されることは少ない。

ヴァンダービルト大学のロースクールで、刑事司法プログラムの責任者を務めるクリストファー・スロボジン氏は、「再犯リスク評価システムは、被告人と検察官の両者が閲覧できないのであれば容認されるべきものである。システムが算出した結果とその課程は完全に公開されるべきだ」と主張している。

再犯リスク評価システムの提案者は、「システムの使用は投獄率を減らすために活用できる」と主張している。2002年、ヴァージニア州は州内で暴力行為以外の重罪を犯した犯罪者の量刑を決定するプロセスにおいて、システムを活用し始めた。ヴァージニア州の量刑委員会が公表しているレポートによると、2014年にヴァージニア州の裁判官は、被告人に対する量刑を行う際にシステムを使用したケースは全体のうち50%に上った。2005年から、州立刑務所の人口増加率は、先の10年間の31%から5%にまで減少している。

例えば、カリフォルニア州のナパ郡などの保護観察所では、再犯リスク評価システムが適切な保護観察期間と更生のための適切な処置や治療のプログラムを裁判官に提案している。ナパ郡の上位裁判所で裁判官を務めるマーク・ボースネカー氏は、「更生のための良質な処置や治療は不足しているため、新しいプログラムを提案してくれる再犯リスク評価システムは役立っている」とシステムを評価している。しかし、同氏はシステムは必ずしも被告人が本当に危険であるのか、刑務所に投獄すべきなのかを明らかにしているわけではないと忠告している。

「1年間毎日、子どもにみだらな行為を行った男は、職に就いているという理由だけで再犯リスクは低いと判断されるかもしれない。それと同時に泥酔して迷惑行為を行った男は、ホームレスだからという理由で再犯リスクは高いと判断される可能性もある。再犯リスクを検証する上で用いられる要因は、被告人が本当に刑務所に投獄されるべき否かを提示しているのでなく、適切であろう保護観察の条件を提示している」

「ときに、再犯リスク評価システムは意味がない」

ジェームス・リベリは、フロリダ州のハリウッドに住む54歳の男性だ。彼は2年前に薬局からホワイトニング剤を7箱分盗んだ罪で逮捕された。彼には加重暴行、復数の窃盗、違法薬物の密売といった前科があったにも関わらず、 Northpointe社のシステムはリベリの再犯リスクは低いと結論づけている。

リベリ自身は記者の取材に対して、再犯リスクが10段階で3と判定されたことについて「自分の再犯リスクがこんなにも低いと判断されたことに驚いている。私はマサチューセッツ州の刑務所に5年間服役しているが、ここの裁判所ではこれが加味されなかったようだ」と述べている。実際はアメリカ国内の前科は、再犯リスク評価を行う上で含まれなければならない要素である。

リベリが出所してから1年も経過しないうちに、彼はホームセンターから総額1,000ドルの工具を盗み、それを不法に販売した罪で再び逮捕されている。彼が再び罪を犯した動機は、違法薬物への依存だったと話している。1989年、Northpointe社は当時コロラド大学で統計学を教えていたティム・ブレナン教授とミシガン州で更生プログラムを運営していたデイブ・ウェルズ氏よって設立された。

ウェルズ氏は、自身が運営していた刑務所において囚人に等級をつける仕組みを作成、導入した。プロパブリカが、同社の再犯リスク評価システムの分析を完了する前に、彼は自身が作成し導入した囚人に等級をつける仕組を「素晴らしい仕事だった」と自画自賛している。ブレナン氏とウェルズ氏は、自身が「定量的な分類」と呼ぶ、知性、外向性、内向性を含む性格上の特徴を測る計測方法を賞賛している。よって、両氏は更生の分野で役立たせるために再犯リスク評価システムを作成することを決断した。

ブレナン氏は、一流の再犯リスク評価システムであったカナダで開発されたLSIやLevel of Service Inventoryを向上させたかった。同氏は「LSIに相当量の脆弱性をみつけた」と述べている。彼は、犯罪を生み出す原因についての多くの理論を組み込んだシステムを開発したかった。

ブレナン氏とウェルズ氏は自身が開発したシステムをCorrectional Offender Management Profiling for Alternative Sanctions(代替制裁プロファイリング矯正犯罪者管理)、略してCOMPASと名付けた。このシステムはリスク評価を行うだけではなく、犯罪性に関連する犯罪心理学、社会的孤立、薬物乱用、生活の安定などの理論を含む二十数個の犯罪を誘発する原因の評価も行う。被告人び再犯リスクは低い、普通、高いという3つのカテゴリーに分類される。

リスク評価システムの実用を開始する前には、各州や郡において実際に活用できるシステムであるかどうかを試験運転を通じて判断する。例えば、2001年にニューヨーク州は、被告人の保護観察処分の決定プロセスに対してシステムの導入を試験的に開始した。その後、システムの導入は201年までにニューヨーク市以外の全ての保護観察所に導入された。ニューヨーク州は、2012年までシステムの総合的な統計的評価を発表しなかった。

16,000人以上の保護観察下に置かれている犯罪者を対象に行った調査では、システムの確実性は71%であることが公表されたが、犯罪者の人種によって確実性に違いがでるのかについてのデータは公表されなかった。

ニューヨーク州の犯罪司法制度部門のスポークスマンは、「公表されたシステムに対する総合的評価では、ニューヨーク州における保護観察下にある人口を調整できるよう正常に効果を発揮するかを試験しただけだったため、犯罪者の人種によって確実性に違いがでるのかについては調査されなかった。ニューヨーク州のほぼ全ての郡の裁判官には、量刑判断を行う際にNorthpointe社のシステムが算出したリスク評価が提供されていた」との声明を出した。

2009年、ブレナン氏と同僚2名は、Northpointe社製のシステムが2328名のサンプルを対象に再犯リスク評価を行った結果、精度は68%だったというレポートを発表した。また、レポートの中では黒人の再犯リスクは白人よりも多少だが精度が低く、黒人に対する再犯リスクの正確性は67%で、白人のは69%だった。しかし、このレポートでは人種の違いによって起こる不均衡に対する調査は、これ以上は行われていない。

ブレナン氏は「貧困、失業、社会的な疎外を含む人種に関連する要素を組み込まなければ、再犯リスク評価を導き出すことは難しく、こういった要素を除外することは再犯リスク評価の正確性を下げる」と主張している。

2001年にブレナン氏とウェルズ氏はNorthpointe社をトロントに拠点をもつ複合企業であるConstellation Software社に売却した。その際の売却額は非公開だった。

ウィスコンシン州は、Northpointe社製の再犯リスク評価システムを量刑判断を行う際に活用するように熱心に推進していた。2012年、同州の矯正委員会は州全体で同社のシステムの使用を開始し、現在では量刑から仮出所までの全てのステップでシステムが活用されている。

2012年に看守であるジャレッド・ホイ氏が行ったプレゼンテーションで、彼は同社のシステムを「巨大な矯正ピンボールマシーン」と形容している。その意味は、看守がすべての意思決定のタイミングでシステムが算出した数値を使えるからだ。ウィスコンシン州は、システムに対して統計的な有効性に関する調査を完了していなく、いつまでに調査結果を発表するかを明言していない。

ウィスコンシン州に属するいくつかの郡では、他のリスク評価システムを使い、被告人を仮保釈すべきか否かを判断している。ホイ氏によると、被告人が同州で重罪を犯した犯歴がある場合、矯正委員会はNorthpointe社製のシステムが導き出したリスク評価が添付された判決前報告書を裁判官に渡しているという。

理論的には、裁判官はシステムが算出したリスク評価が高かったからといって被告人に通常より長い懲役を科してはいけないことになっている。むしろ、裁判官はリスク評価をどの被告人が保護観察や矯正プログラムを受けるにふさわしいかを判断する上での材料にするべきだ。

最高裁判所のシステムに対する評価は?

裁判官はシステムが導き出したリスク評価をもとに量刑判断を行っている。2013年8月、ウィスコンシン州のスコット・ホーン裁判官は、盗難車を運転し警察官から逃亡した罪で起訴されたエリック・ルーミス被告をCOMPASのリスク評価により、同被告は社会にとって危険な人間であると認定し、8年6ヶ月の実刑判決を言い渡した。

ルーミス被告は、自身の正当な法的手続きを受ける権利を阻害されたと主張し、リスク評価の使用に異議を申し立てている。同州は「ホーン裁判官のシステムの活用方法は間違っていない」と擁護したものの、「ホーン裁判官はリスク評価を判断材料のうちの1つであると認識する必要がある」と述べ、リスク評価のみに基づいた量刑判断に対して否定的な姿勢をとった。これにより、同州の最高裁判所がシステムの利用の可否を判断するまでは、判決前報告書にリスク評価の結果を盛り込まない方針を示した。

ウィスコンシン州の司法次官補であるクリスティン・レミントン氏は、ルームス被告の異議申し立てについて「リスク評価のみを判断材料として量刑を決めるべきではない」という判断を下し、裁判官がCOMPASというシステムが被告人のリスク評価の結果に応じて、求刑を決めることに否定的な立場を示した。

 

元記事:Machine Bias

この記事を訳しながら聞いていた曲