macroscope

( はてなダイアリーから移動しました)

2種類の「はずれ」をどちらもなるべく小さくしたいのだ

統計学や意志決定論の教科書で「第1種のまちがい」「第2種のまちがい」という表現をしていることがあるが、わたしはどちらがどちらだったか覚えられない。ともかく、2種類のまちがいがあることを忘れてはいけないということだ。

一般的に、一見よく似たものがならんでいるうちで「異常」なものを検出したいという状況を考える。「異常」がよいことか悪いことかはたなあげにしておく。個別の対象が「異常」であるか「正常」であるかの正確な情報を得ることはできず、間接的情報から推定するしかないという状況を考える。

このとき、次の場合がありうる。(ただし、現実がどうなっているかは、けっしてわからないか、あとになってわかるものとする。) 「第1種」「第2種」よりも有効と思われる名まえのつけかたを2とおりあげてみた。

  • 異常な現実を異常と推定。「陽性」で正解。「あたり」
  • 異常な現実を正常と推定。「偽陰性 (false negative)」「見のがし
  • 正常な現実を異常と推定。「偽陽性 (false positive)」「からぶり
  • 正常な現実を正常と推定。「陰性」で正解。「あたりまえ」

偽陰性」「偽陽性」という言いかたは、ここでいう「正常」を「陰性」、「異常」を「陽性」と表現することを前提としている。この場合、「陽性」(positive)には、よいという意味も、積極的だという意味もない。

【ただし、これに似た用語が違った意味をもつかもしれない。1960年代に小学生だったわたしは、ツベルクリン反応という検査を受けた際に「ギヨウセイ」と言われたことを覚えている。これは、検査結果が陽性か陰性かの判断がむずかしい範囲にあるという意味だった。(陽性とは結核という病気に関する免疫ができているという意味だった、と記憶している。) したがって漢字ではたぶん「疑陽性」だと思うのだが、確認していない。】

「見のがし」「からぶり」という表現は、(わたしが苦手な)野球というスポーツの打者の立場から見たものらしい。話を簡単にするために、投球がストライクゾーン内に来て打者がそれを打てば必ずヒットにできるが、ゾーンの外にきた投球を打者が打とうとしてもバットに当たらないとする。すると結果は次のようになる。

  • ゾーン内の球を打とうとする。ヒット。
  • ゾーン内の球を打たない。「見のがし」のストライク。
  • ゾーン外の球を打とうとする。「からぶり」のストライク。
  • ゾーン外の球を打たない。ボール。

野球のルールを極端に簡単に要約すると、ヒットの場合とボールが続く場合は塁に進めるので打者の側の得だが、ストライクが続くとアウトになるので打者の側の損だ。

なお、上のリストに含めた「あたりまえ」という表現は野球のたとえには対応せず、日常生活にここに出てきた他のキーワードを使う文脈で思いあたったものだ。

【さらに細かいことだが、「から」を「空」と書くのを避けている。わたしは「空」という字から「そら」、「空気」、「空間」、仏教の「空(くう)」、文字列中の「空白」を連想するけれども、「から」という訓読みはなかなか出てこないのだ。やまとことばの「から」は「たまごのから」の場合と同じことばだろう。だからと言って「殻振り」と書いても意味を伝えることはむずかしい。】

すべての場合に異常と予想すれば「見のがし」はありえないし、すべての場合に正常と予想すれば「からぶり」はありえない。しかし、多少とも予測の参考になる情報があるならば、このどちらの判断も情報を活用していない愚かなものだと言えるだろう。毎度「オオカミが来る」と叫ぶ人も、常に「オオカミは来ない」と言い張る人も、信頼にあたいしない。

偽陰性偽陽性の両方の発生回数を小さくすることが望ましい。しかし一方を小さくしようとすれば他方が大きくなりがちだ。どのあたりでバランスをとるかは、文脈によって違う。

現代の刑事裁判では、現実に罪を犯していない人に罰を科すことをできるかぎり避けるという原則がある。犯罪を異常とすれば、偽陽性を避けることになる。しかし、同じ事件に関してでさえ、民事裁判の判断は必ずしもそうではない。

科学(工学や医学のうちの基礎研究も含む)では、異常が確かなものであれば新発見として大きく扱われることが多い。反面、正常を異常とみなして報告することは同業者からきびしく批判されるので、研究者本人も慎重になり、偽陽性を避けることを優先した判断をすることが多い。科学者が、政治にかかわる意味ではなく「保守的」(conservative)に考えると言うときの意味はこれだ(この用語の選択はあまりうまくないと思うが、すぐに代案を思いつかない)。

他方、食品や環境中に健康に害のある物質が含まれる可能性がある場合や、災害や事故の可能性がある場合には、異常を検出しそこなうこと、つまり偽陰性を避けることを優先するのがよいとされることが多い。「事前警戒的」(precautionary)と言われるのはこのような考えかただと思う(日本語圏で実際によく使われる「予防的」という表現はまぎらわしいので避けておく)。

【「安全寄りに考える」という表現の意味は、文脈によって、ここでいう「事前警戒的」であったり、「保守的」であったりする。】

ともかく、どちらの極端も実践的意味がない。なんらかのバランスが必要なのだ。それぞれの状況にとってどんなバランスが適切かは、社会としてのその状況に関する価値判断と、その状況で利用可能な情報と、科学を含む人類の知恵が現在提供できる判断支援手法とによって、違ってくる。

ここまで、判断支援手法の中身に立ち入らなかった。推定する対象が数量で表現可能なものであれば、統計学的方法が使われるのがふつうだが、その内にも頻度確率論的な仮説検定と、ベイズ流の推定とがある。正直なところわたしはそのような議論をするための勉強ができていない。しかし統計学の議論に取りかかる前にここに述べたようなことを考えておくことが大事だろうと思っている。