嘘発見器という嘘

ポリグラフ（嘘発見器）は嘘を検出しない。測定しているのは発汗、血圧、呼吸、心拍──つまり自律神経系の覚醒であり、欺瞞そのものではない。米国心理学会（APA）は「ほとんどの心理学者は、ポリグラフ検査が嘘を正確に検出できるというエビデンスはほとんどないことに同意している」と公式に表明している。英国心理学会（BPS）は「欺瞞に特有の生理的嘘反応は実証されたことがなく、存在する可能性も低い」と断じている。にもかかわらず、米国の情報機関は年間約70,000件のポリグラフ検査を実施し続けている。

ワンダーウーマンの生みの親

ポリグラフの歴史は、科学史上きわめて異色の人物から始まる。ハーバード大学で心理学の博士号を取得したウィリアム・マーストンは、1915年に欺瞞と収縮期血圧の相関を実験的に検証した。妻エリザベスの「興奮すると血圧が上がる」という観察がきっかけだった。
1921年、カリフォルニア州バークレー警察のジョン・ラーソンが心拍数、血圧、呼吸を同時に連続記録する最初のポリグラフを組み立てた。レオナード・キーラーが皮膚電気反応（GSR：皮膚の発汗による電気伝導度の変化）を追加して商業化し、「近代ポリグラフの父」となった。しかしラーソンは晩年、自分の発明を「フランケンシュタインの怪物」と呼んで後悔した。
1923年、Frye v. United States裁判で、ウィリアム・マーストンは自身の検査結果を証拠として提出したが却下された。その同じマーストンが、1941年にDCコミックスのワンダーウーマンを創作した。ワンダーウーマンの「真実の投げ縄」はポリグラフに着想を得ている──フィクションでしか実現できない嘘発見器である。

ポリグラフは何を測っているのか

ポリグラフは4つの生理指標を同時記録する──皮膚電気反応（発汗）、血圧、呼吸パターン、心拍数。最も広く使用される比較質問法（CQT：Comparison Question Technique）では、事件に関する「関連質問」と、被検者が嘘をつく可能性が高い広範な「比較質問」への反応差を判定する。無実の人は比較質問に、有罪の人は関連質問により強く反応すると仮定するが、Iacono（2018）はこの仮定の理論的根拠が科学的に弱いことを指摘し、CQTには「標準化された科学的手法として必要な基盤がない」と結論づけている。

根本的な問題は単純である──欺瞞に特有の生理反応パターンは存在しない。不安、恐怖、怒り、興奮、無実であるのに疑われる恐怖──すべてが同じ生理反応を引き起こす。Vrij, Hartwig & Granhag（2019）はAnnual Review of Psychologyにおいて、「非言語的手がかりと欺瞞の関係は微弱で信頼性が低い」とする広範なレビューを発表している。嘘をつく行為が特定の行動的・生理的パターンを必然的に生むわけではないのである。

1,598人の無実の人が「不合格」──ベースレート問題

全米科学アカデミー（NAS）の2003年報告書は、18名の専門家委員会が57件の研究を包括的にレビューした結果、衝撃的な具体例を提示した。

10,000人の政府職員中10人のスパイがいるとする。検出率80%に設定すると、スパイ8人を正しく検出する。しかし同時に、忠実な職員1,598人も「不合格」となる。「不合格」者の中でスパイである確率はわずか0.5%──99.5%が無実の人である。偽陽性を40人に抑えると、スパイの多くが見逃される。

NASの結論は明確だった──「ポリグラフの精度は、連邦機関の職員セキュリティスクリーニングへの依存を正当化するには不十分である」。CQTの精度については、Honts, Thurber & Handler（2021）による138データセットのメタ解析でも検討されているが、実験室条件と実地条件の乖離が大きく、Patrick & Iacono（1991）は偽陽性率の高さがCQTの根本的欠陥であることを実証している。

スパイはポリグラフを通過する

ポリグラフの最大の失敗は、まさにそれが最も機能すべき場面で起きた。

CIAの防諜分析官アルドリッチ・エイムズは1985年から1994年にかけてソ連/ロシアのためにスパイ活動を行った。1986年と1991年のポリグラフ検査に合格している。対策技術の特別な訓練は受けていなかった。「特別な魔法はない。自信がカギだ。自信と、検査官との友好的な関係。微笑んで、検査官に自分が好かれていると思わせること」と彼は語った。複数のCIA職員がエイムズの通報により処刑された。

DIA（国防情報局）のアナ・モンテスは約20年間キューバのためにスパイ活動を行いながら、複数のポリグラフ検査に合格した。FBIのロバート・ハンセンは22年間ソ連/ロシアのスパイとして活動し、ポリグラフ検査を一度も受けなかった。

対策技術は容易に学習可能である。Honts, Raskin & Kircher（1994）の実験室研究では、対策訓練を受けた被験者が比較質問の回答時に舌を噛む、足の指に力を入れるなどの身体的・精神的対策を用いた結果、偽陰性率が78%まで上昇した。最も危険な脅威こそ、ポリグラフを突破する動機と能力を持つのである。

人種差別の道具

ポリグラフには深刻な人種的バイアスの問題が指摘されている。NAS報告書（2003）は、1,100名以上の被検者を対象とした研究を引用し、無実の黒人被検者の正しい非欺瞞判定率は23.5%、白人は36.9%だったと報告している。NASは少数民族に対する体系的な不利益の可能性を認識し、文化的背景による反応差がポリグラフの精度に影響しうると指摘した。高コンテクスト文化出身の移民やトラウマ生存者が不利になりうるとの報告もある。

偽パイプライン──真の「効果」

ポリグラフの真の「有用性」は欺瞞の検出ではなく、心理的圧力による自白の引き出しにある。心理学で「偽パイプライン効果」（bogus pipeline effect）と呼ばれる現象である──嘘を検出できる装置に接続されていると信じた人は、より多くの情報を開示する。ポリグラフが「機能する」のは、被検者がそれを信じるからであり、科学的妥当性とは無関係である。

NAS報告書もこの点を認めている──「ポリグラフ方針がセキュリティ脅威を抑止し、自白を引き出す可能性はスクリーニングでの使用を正当化するかもしれないが、この根拠は心理生理的欺瞞検出の妥当性に基づくものではない」。

しかしこの「効果」には暗い側面がある。偽のポリグラフ不合格通知が虚偽自白の原因となった事例が複数確認されている。ナイーブな被疑者ほど、機械の判定を有罪の絶対的証拠と認識してしまうのである。

法廷では100年前に決着がついている

1923年のFrye v. United States裁判で、コロンビア特別区巡回控訴裁判所はポリグラフを「関連する科学コミュニティで十分な一般的受容を得ていない」として却下した。1993年のDaubert基準でも一般的に排除される。世界の大多数の法廷でポリグラフは証拠として認められていない。

にもかかわらず、米国の連邦機関（FBI、CIA、NSA）は1988年の民間使用禁止法（EPPA：Employee Polygraph Protection Act）の適用除外として検査を継続している。冷戦期の1953年にNSAが応募者のポリグラフスクリーニングを義務化して以来、科学的根拠なく制度が存続しているのである。

Saxe, Dougherty & Cross（1985）はAmerican Psychologistに掲載されたOTA依頼のレビューで、ポリグラフの科学的妥当性が不十分であると結論づけた。米議会技術評価局（OTA）も1983年の報告書で同様の結論に達している。これらの批判は40年以上前のものだが、根本的な問題は何一つ解決されていない。

日本の例外──隠匿情報検査（CIT）

興味深い例外は日本である。日本は世界で唯一、隠匿情報検査（CIT：Concealed Information Test）を犯罪捜査に広く適用している国である。CITは「嘘」ではなく「犯罪の詳細に関する記憶の有無」を検出するもので、CQTとは根本的に異なる。

Osugi（2019）のレビューによると、約100名の検査官が年間約5,000件のCITを実施している。検査官は科学警察研究所附属の法科学研修所で3か月の訓練を受ける。各事件で通常4〜7問のCITが実施され、犯罪に関連する1項目と4〜6個の非関連項目が提示される。

CITの科学的基盤はCQTよりはるかに強い。Meijer, klein Selle, Elber & Ben-Shakhar（2014）のメタ解析によると、皮膚電気反応の効果量はd=1.55、呼吸はd=1.11、心拍数はd=0.89、P300（事象関連電位の一成分）はd=1.89である。ROC曲線下面積は0.92に達し、偽陽性率は4.1%と低い。

1968年に最高裁が証拠能力を認定しており、「正しく実施された場合、比較的高い証拠価値を持つ」とされている。CITは、犯罪者だけが知りうる情報に対する生理反応を測定するため、無実の人が誤って「有罪」と判定されるリスクがCQTよりはるかに低い。MacLaren（2001）のJournal of Applied Psychologyに掲載された定量的レビューでも、GKT（CITの旧称）の偽陽性率の低さが確認されている。

代替手段も未完成

fMRI（機能的磁気共鳴画像法）による嘘発見は、Farah, Hutchinson, Phelps & Wagner（2014）がNature Reviews Neuroscienceで指摘したように、20件未満の研究しかなく、いずれも実世界での有効性を証明していない。Yu, Tao & Zhang（2019）のメタ解析では、fMRIが欺瞞と偽記憶を区別することの困難さが示されている。

ERP（事象関連電位）/P300脳波法はRosenfeld（2020）のレビューによると効果量が大きく、隠匿情報検出において有望な技術である。しかしRosenfeld, Soskins, Bosh & Ryan（2004）が示したように、単純な対策技術によって容易に精度が低下する。また、実地運用の実績が限られ、標準化されたプロトコルも確立されていない。

供述妥当性分析（SVA）はオランダやドイツで法廷使用されているが、カットオフスコアの標準化がない。Vrij, Granhag & Porter（2010）はPsychological Science in the Public Interestで、非言語的・言語的嘘発見の落とし穴と可能性を包括的にレビューし、認知的負荷を利用した新たなアプローチの可能性を示唆している。Meijer, Verschuere, Gamer, Merckelbach & Ben-Shakhar（2016）も、行動的・自律神経的・神経学的手法のいずれにおいても、概念的・方法論的な課題が残されていると論じている。

根本的な問題として、欺瞞に特有の生理的・神経的・行動的マーカーは現時点で発見されていない。嘘をつく行為は単一の現象ではなく、Meijer et al.（2016）が論じるように、現在の知見は「慎重さ」を要求している。信頼できる嘘発見法は確立されていないのが現状である。

ポリグラフは100年にわたって「科学の衣を被った信仰」として機能してきた。嘘を検出する機械は存在しない。存在するのは、不安を測定し、その不安を「嘘の証拠」として権威的に解釈する装置と、それを信じる人々だけである。

参考文献

The Polygraph and Lie Detection
– 出典: National Research Council / National Academies Press (2003)
– エビデンスレベル: 強（18名の専門家委員会による包括的レビュー、57件の研究分析）
– DOI: 10.17226/10420

A comprehensive meta-analysis of the comparison question polygraph test
– 出典: Applied Cognitive Psychology, 35(4) (2021)
– 著者: Honts CR, Thurber S, Handler M
– エビデンスレベル: 強（138データセットのメタ解析）
– DOI: 10.1002/acp.3835

Memory detection with the Concealed Information Test: a meta analysis of skin conductance, respiration, heart rate, and P300 data
– 出典: Psychophysiology, 51(9), 879-904 (2014)
– 著者: Meijer EH, klein Selle N, Elber L, Ben-Shakhar G
– エビデンスレベル: 強（4つの生理指標にわたるCITメタ解析）
– DOI: 10.1111/psyp.12239

Reading Lies: Nonverbal Communication and Deception
– 出典: Annual Review of Psychology, 70, 295-317 (2019)
– 著者: Vrij A, Hartwig M, Granhag PA
– エビデンスレベル: 強（Annual Review of Psychologyの包括的レビュー）
– DOI: 10.1146/annurev-psych-010418-103135

Current status of forensic lie detection with the comparison question technique
– 出典: Law and Human Behavior, 42(4), 295-303 (2018)
– 著者: Iacono WG
– エビデンスレベル: 強（ポリグラフの第一人者による最新レビュー）
– DOI: 10.1037/lhb0000307

The Truth About Lie Detectors (aka Polygraph Tests)
– 出典: American Psychological Association (2004)
– エビデンスレベル: 強（主要学術団体の公式見解）
– URL: APA Polygraph

Pitfalls and Opportunities in Nonverbal and Verbal Lie Detection
– 出典: Psychological Science in the Public Interest, 11(3), 89-121 (2010)
– 著者: Vrij A, Granhag PA, Porter S
– エビデンスレベル: 強（欺瞞検出分野のトップ研究者による包括的レビュー）
– DOI: 10.1177/1529100610390861

The validity of polygraph testing: Scientific analysis and public controversy
– 出典: American Psychologist, 40(3), 355-366 (1985)
– 著者: Saxe L, Dougherty D, Cross T
– エビデンスレベル: 強（OTA依頼のレビュー）
– DOI: 10.1037/0003-066X.40.3.355

Scientific Validity of Polygraph Testing: A Research Review and Evaluation
– 出典: Office of Technology Assessment, U.S. Congress (1983)
– エビデンスレベル: 強（議会依頼の包括的レビュー）

Functional MRI-based lie detection: scientific and societal challenges
– 出典: Nature Reviews Neuroscience, 15(2), 123-131 (2014)
– 著者: Farah MJ, Hutchinson JB, Phelps EA, Wagner AD
– エビデンスレベル: 中（Nature Reviews Neuroscienceの権威あるレビュー、fMRI研究数が限定的）
– DOI: 10.1038/nrn3665

Can fMRI discriminate between deception and false memory? A meta-analytic comparison
– 出典: Neuroscience and Biobehavioral Reviews, 104, 43-55 (2019)
– 著者: Yu J, Tao Q, Zhang R, Chan CCH, Lee TMC
– エビデンスレベル: 中（fMRIベースの欺瞞検出と偽記憶の比較メタ解析）
– DOI: 10.1016/j.neubiorev.2019.06.027

Deception detection with behavioral, autonomic, and neural measures: Conceptual and methodological considerations
– 出典: Psychophysiology, 53(2), 162-175 (2016)
– 著者: Meijer EH, Verschuere B, Gamer M, Merckelbach H, Ben-Shakhar G
– エビデンスレベル: 中（分野の主要研究者5名による方法論レビュー）
– DOI: 10.1111/psyp.12609

P300 in detecting concealed information and deception: A review
– 出典: Psychophysiology, 57(7), e13362 (2020)
– 著者: Rosenfeld JP
– エビデンスレベル: 中（P300ベースCITの包括的レビュー）
– DOI: 10.1111/psyp.13362

Simple, effective countermeasures to P300-based tests of detection of concealed information
– 出典: Psychophysiology, 41(2), 205-219 (2004)
– 著者: Rosenfeld JP, Soskins M, Bosh G, Ryan A
– エビデンスレベル: 中（実験的検証）
– DOI: 10.1111/j.1469-8986.2004.00158.x

Mental and physical countermeasures reduce the accuracy of polygraph tests
– 出典: Journal of Applied Psychology, 79(2), 252-259 (1994)
– 著者: Honts CR, Raskin DC, Kircher JC
– エビデンスレベル: 中（対策技術の効果を実験で検証）
– DOI: 10.1037/0021-9010.79.2.252

Broadening the Use of the Concealed Information Test in the Field
– 出典: Frontiers in Psychiatry, 10, 24 (2019)
– 著者: Osugi A
– エビデンスレベル: 中（日本のCIT運用に関する唯一の英語包括レビュー）
– DOI: 10.3389/fpsyt.2019.00024

A quantitative review of the Guilty Knowledge Test
– 出典: Journal of Applied Psychology, 86(4), 674-683 (2001)
– 著者: MacLaren VV
– エビデンスレベル: 強（GKT/CITの定量的レビュー）
– DOI: 10.1037/0021-9010.86.4.674

Meta-analysis of mock crime studies of the control question polygraph technique
– 出典: Law and Human Behavior, 12(1), 79-90 (1988)
– 著者: Kircher JC, Horowitz SW, Raskin DC
– エビデンスレベル: 強（初期の主要メタ解析）
– DOI: 10.1007/bf01064275

A comparison of field and laboratory polygraphs in the detection of deception
– 出典: Psychophysiology, 28(6), 632-638 (1991)
– 著者: Patrick CJ, Iacono WG
– エビデンスレベル: 中（実験室と実地条件の比較研究）
– DOI: 10.1111/j.1469-8986.1991.tb03416.x

Frye v. United States
– 出典: 293 F. 1013 (D.C. Cir. 1923)
– エビデンスレベル: 該当なし（法的判例、ポリグラフ証拠の却下基準を確立）

Employee Polygraph Protection Act of 1988
– 出典: 29 U.S.C. §§ 2001-2009
– エビデンスレベル: 該当なし（民間でのポリグラフ使用を禁止する連邦法）