「チェリーピッキング」という言葉をご存知でしょうか。
チェリーピッキングは、主に弁論や機械学習などの研究分野で用いられる言葉です。
字面だけ見ると、このページのアイキャッチ画像のようなものを想像してしまいますよね。
この記事では、チェリーピッキングの意味とその例について解説します!
チェリーピッキング
「自分に有利な例だけを取り上げる」こと
チェリーピッキングとは、自分の主張に有利な事例だけを取り上げるといった詭弁(きべん)術です。
読んで字のごとく、さくらんぼの成った木から特に熟れた実だけを選び収穫する所から、このような意味として使われるようになりました。
具体的にどのようなものがチェリーピッキングに当たるのか、話術における例と、研究における例を見てみましょう。
話術として
例えば「1組には優秀な生徒が多い」という主張をしたいとします。
この時、1組のなかで特に優秀なAさんとBさん、Cさんの名前だけを挙げて、「1組のAやB、Cは優秀だから、1組の生徒は優秀だ」と主張することがチェリーピッキングと呼ばれるものです。
この主張を聞くと、確かに1組は優秀な生徒が存在しているので全体的に優秀のようだ、と思うかもしれません。
しかし、1組の三人以外の生徒について全くの情報が示されていないので、1組全体が優秀だという結論はここから導くことはできません。
正しい議論をするうえでは、1組の全員の成績と、ほかの組の成績の平均などを用いて量的に評価する必要があります。
しかし、必ずしも正確な数値が求められていないような状況では、チェリーピッキングによる話術を活用することで有利に話を進めることができます。
例えば、エレベータートークなどの短い時間で自分の主張をより誇張したいときには、上で述べたようなチェリーピッキングに基づくトークが効果的でしょう。
短い時間でわざわざネガティブ面について触れる必要はありませんから、自ずと内容はチェリーピッキング的になるかもしれません。
研究において
チェリーピッキングという言葉は、研究においてもたびたび用いられます。
機械学習、特に分類問題を解くモデルについての議論を例にあげます。
収穫された果物が規格外であるかどうかを、分類するモデルについて考えます。
あるモデルAは、90%の性能でリンゴを分類できるとします。
このモデルAは、ミカンに対しても性能80%で分類することができます。
ここで、簡単のためにモデルAの性能は二つの数値の平均として85%であるとします。
このモデルAに対抗するべく、ある学者は同様にリンゴとミカンの平均分類精度が85%である果物分類モデルBを開発しました。
ただし、モデルBはリンゴの分類精度が80%、ミカンの分類精度が90%であるとします。
ここで、二つのモデルの関係は以下の表のようになっています。
リンゴ | ミカン | 平均 | |
モデルA | 90% | 80% | 85% |
モデルB | 80% | 90% | 85% |
この学者はモデルBの優位性を主張するために、論文に「ミカンの分類テストにおいて、モデルAよりも精度が高いことが確認された」とだけ書きました。
これが、研究におけるチェリーピッキングです。
実際には二つのモデルの果物を分類する性能はほとんど変わりませんが、学者はミカンの分類性能だけを取り上げて旧来のモデルAよりも有効であるという主張を行いました。
こうした主張の仕方は見栄えこそ良いものの、正しいモデルの評価ができていないという点で不信感をもたらします。
特に、あるタスクへの精度によってモデルを評価している分野では、チェリーピッキングによる不公平な評価によってモデルの主張が行われることがあるため、注意深く主張を検証する必要があります。
まとめ
チェリーピッキングは自分の主張の見栄えを良くしてくれますが、正確な数値や検証を必要とする場面において相応しい話術とは言えません。
特に、チェリーピッキングであることが後からバレてしまった場合に自分が被る信頼の低下は予想以上のものであるかもしれません。
もちろん、意図せずチェリーピッキングになってしまっているという場合もあるため、一度や二度の失敗で大きく責められることはないでしょう。
しかし、正確な検証が求められる場面において、何度も誤った分析を提出してしまうというのは、やはりマイナスイメージを与えてしまうでしょう。
場面や求められていることをしっかり踏まえて、正しくデータを評価し、自身の主張を裏付けていくことが重要です。