自信過剰な人間


全員のことです。

内容は、ファスト&スローからです。

先日の記事で少し引用しましたが、相変わらずちょこちょこ読んでいて、最近上巻を読み終えたので、上巻の後半に出てくる自信過剰の話を紹介します。

そこでは、我々人間かいかに自信過剰かが書いてあり、私はこれを読んで、最近報道が加熱気味のAIについて、まったく興味を示さない人達の心理が分かったような気がしています。

AIがすさまじい勢いで進歩していると聞いても、彼らは皆、そうはいっても人間の仕事がコンピュータにそう簡単に取って代わられることはないと思っています。

まさか、知的労働の多くが置き換わられるとは思っていないのです。

根底にあるのは、AIの進歩に対する理解不足ではないと思います。そうではなくて、あるのは専門家なる人達への過剰な信頼で、つまり、人間の判断について自信過剰なのだと思います。

本の中では、著者がまだ若く、イスラエル軍で心理部隊なる部隊の将校として働いていたころの経験にさかのぼります。

そこでの任務の一つとして、幹部候補生の選抜というものがありました。

ありがちですが、各部隊から優秀な若手を集め、それをグループ分けして、結構難易度の高い課題にチームとして取り組ませます。

そうすると、各チームの中で、自然にリーダーシップを発揮する者、仕切ろうと意気込むも周りから認められない者等が現れてきます。

しかし、課題が困難なため、課題の途中に一人の失敗で全体がやり直しになったりするのですが、その時に、失敗をなじりふてくされてリーダーから陥落する者、他方で、そういう状況になってからチーム全体を鼓舞し、徐々にリーダーとして認められていく者等、いろいろ出てきます。

著者らは、そういった過程を観察して、一人一人の性格を詳細に分析して、最終的に、幹部候補としての素質を評価し、選りすぐりの若者を幹部養成学校に送り出すのです。

しかし、後に非常に重要なことが分かります。

それは、どうやらそれらテストの結果が、後の幹部養成学校での訓練や実戦時での行動予測に全く役に立たないということです。

しかし、テストの観察者としては、テストを通じていろいろなことが分かると確信し、自信満々で候補者の分析・評価をします。

にもかかわらず、全く役に立たないとのこと。

これは考えてみれば当然で、人工的な訓練場でのちょっとした共同訓練をしただけで、本当に生死の関わる実戦のような、大きく環境の異なる状況での行動予測などできるはずもないのです。

ただそれでも、新しい候補生が到着すると、また同じテストをして、その経過を観察していくと、同じように、テスト生についていろいろわかってくるような気がして、詳細な評価を加え、自信をもって優秀な隊員を選抜します。

著者は目の錯覚で同じ長さに見える二本の線(ミュラー・リヤー錯視)を例に挙げていて、長さが違うと知っていながら、何度見ても同じ長さにしか見えないように、生死のかかった実戦の場での行動など、人工訓練場のちょっとした訓練でわかるはずもないのに、訓練するたびにゆるぎない自信をもって、候補生の素質を評価し、選抜していたそうです。

mladjusts
http://www.psy.ritsumei.ac.jp/~akitaoka/catalog.htmlから引用

続いて、ポール・ミールという20世紀を代表する心理学者の研究が紹介されます。

専門のカウンセラーに大学の新入生を面談してもらい、一人一人の1年修了時の成績を予測してもらいます。面談は45分かけて行われ、高校時代の成績、複数の適正テストの結果、4ページにわたる自己申告書もチェックしてもらいます。

その一方で、高校時代の成績と適正テスト1種類の結果の2つの点数だけから成績を予測するアルゴリズムを組みます。

なんとなくお分かりかと思いますが、結論としては、専門カウンセラー14名のうち、11名の予測は、アルゴリズムを下回ったというものです。そして、同様のことが、仮釈放規定の違反、犯罪者の再犯等の予測でも観察されます。

こういった研究はこの論文を機に活発になり、既に200件以上の研究があるらしいですが、そのうち60%は単純アルゴリズムの勝ちで、残りの40%は引き分けだそうです。

中には、ワインの専門家を集めて、新しいワインを飲ませてそのワインが熟成後にどのくらいの価格をつけるかを予測させ、夏の平均気温・収穫期の降雨量・前年冬の降雨量の3つだけから予測するアルゴリズムとぶつけてその結果を比較する研究も登場します(これはアルゴリズムの圧倒的勝利に終わる)。

このように、大量の研究があるのですが、いずれも、専門家なる人達が様々な情報を収集分析して出した結果より、単純なアルゴリズムの方が将来予測の精度が良くなるわけです。

スポンサーリンク

もちろん、ほとんど役に立たないレベルから、多少は参考になる程度への改善であり、将来予測というのは基本的に不可能である点を忘れてはいけません。

しかし、ポイントは、専門家と呼ばれている人達の将来予測があてずっぽう以下のレベルであることです。

その理由は何故でしょうか、

まず一つ目の理由として、専門家が自分の専門分野にこだわり、どうでもよい特殊情報をなにか重要な情報であるかのように組み合わせて間違った結論を導くことがあげられるそうです。また、注目されるとなにか独創的な予測を披露しようとして、全く重要でない情報に意味を見出して精度を下げる傾向もあるそうです。

二つ目として、そもそも人間に複雑な情報処理ができないことが挙げられています。病理学者、心理学者、監査人等に複雑な情報を与えて二回以上評価させると、同じ情報にもかかわらず、機会が違うと異なる判断を下すことが頻繁に起きるそうです。これは、専門家じゃなくても多くの人がうすうす気づいているはずです。

こういったことを受けて、著者は、アメリカのメディカルスクールでは、受験生と教授陣の面接があるが、面接官は自分の直感に過剰な信頼を抱いてその他の情報を不当に軽視して間違った判断を下すことになるから、その面接は選抜の制度を下げていると指摘します。

また、ワインの実験で専門家が予測を間違えた原因はワインの試飲にあり、その結果得た印象のせいで、情報の重要性の軽重をコントロールできなくなり、本来重要な天候等の要素を軽視してしまって、おかしな予測をしてしまうとのことです。

こういった研究がまだ未発達の数十年前にもかかわらず、上記ポール・ミールの初期研究に触れて触発されていた著者は自分の任務にこの知見を活かします。

建国7年目で人材がおらず心理学者がいないので、当時21歳の著者に、イスラエル軍における所属部隊を決める新兵面接システムの構築が指示されるのですが、従来のやり方を抜本的に変えます。

いわゆる人事面接のやり方、面接官といろいろなことを話題にするというやり方を廃止します。

責任感、誇り、社交性等のたった6項目に点数をつけるだけの評価方式として、評価方法としては事前に決められた質問を決められた順番でしていき、しかも各数字をコンピュータに入れて、最終判断は機械が下すというやり方に変えます。

著者と同様、知性とコミュニケーションスキルを認められて抜擢された若い面接官たちは、ロボットのような役目を押し付けられて暴動寸前になるのですが、面接官の役目は個々の項目の採点に徹することとして、将来性の判断は全てコンピューターが出すことを貫きます。

するとその結果、従来の面接方式よりもはるかに兵士の適正予測の精度が高くなったそうです。

45年後に著者がノーベル賞を受賞してイスラエルを訪れます。すると、古い友人が懐かしの基地に案内して、今も存在する心理部隊の隊長に紹介します。

隊長は現在行われている面接方式を紹介するのですが、実はそれは45年前のものとほとんど変わっておらず、その後何度も調査がされたのだがこの方法が一番有効であると確かめられたことを説明します。

心理部隊の隊長は、新兵の適性検査面接に当たり、面接官に対して「目を閉じて面接してください」と言うとのこと。

専門家はいろいろな知識や経験を持っていますが、元来人間が持っている「自分の見たものが全て」という傾向に加え、その専門家としての知識や経験、さらには自分は専門家であるというプライドが余計なバイアスを与え、単純な判断よりも却って精度の低い判断を導いているわけです。

こう言った話は怖いですね。

もちろん、人間の知的労働のすべてがAIに置き換えられるはずもなく、置き換えられるものとそうでないものの区分は出てくるのでしょうが、置き換えられるものに関しては、AIの進歩の他に、これまで専門家と称する人たちがそれっぽいことを言ってただけで、てんであてにならないものだったなんて話になるかもしれません。

そういえば、先日どこかの教授が何かのシンポジウムで、このままAIが進歩すると、銀行業務のうち不要になるのは、窓口業務ではなく融資業務だと言っていたような気がします。

その点私は安心です。

お客さんごとに筋トレの目的やニーズ等丁寧にカウンセリングしますが、全員同じメニューをやってもらうと決めています。