『アマゾノミクス データ・サイエンティストはこう考える』を読んで

スポンサーリンク


著者は、アマゾンの元チーフデータサイエンティストで、CEOジェフベゾス氏の右腕として活躍した方とのこと。

先日スキーに行きがてら読んだのですが、面白かったので紹介します。

この本読むと、アマゾンという会社への見方が変わるというか、その凄さがハッキリしてきます。

私はこのブログでも、ちょいちょい楽天頑張れ的な記事を書いていますが、やっぱりアマゾンはちょっとモノが違うなと認識させてくれる本です。

著者は、アマゾンの元チーフデータサイエンティストとしてデータ分析業務に従事していた方ですが、この本、ちょっと注意が必要です。

元アマゾン幹部がアマゾンの試行錯誤や手の内を明かしながらその成長の軌跡や秘密をたどっていくような本では全くないのでそこはご注意を。

アマゾンのエピソードはそんなに登場しません。

データサイエンティストとしてアマゾンでどのような分析をして、それをどう成長に生かしてきたのかというエピソードも登場しないわけではないですが、この本は、データ社会の現在・未来と、私たちがそれに対してどう向き合っていくべきかを業界の第一人者が熱く語る本です。

とはいえ出だしはアマゾンから。

今では巨大なアマゾンも、当然ベンチャーだった時代はあるわけで、2000年代初頭のころは、いろいろ試行錯誤をしていたようです。

もっとも、アプローチは今ともあまり変わっておらず、徹底的にデータ分析。

アマゾンがまだ本屋だったころは、本の購入者を、最寄りの書店との距離別に分析したり、昼に本買う人と夜に本買う人で、本以外の購入の傾向に差があるかなど、あれこれ調べていたそうです。

そんなアマゾンのマーケティング戦略に大きな変化が起きるきっかけがユーザーレビュー。

昔は、アマゾンも専門の編集者を多数採用して、あれこれ商品説明の拡充や特集ページを作っていたそうです。

しかし、専門の編集者が作ったキュレーション情報(まとめ情報)とユーザーレビュー、どちらが消費者の購買行動に影響を与えるかを調べたら、圧倒的にユーザーレビューが影響を与えることが分かって、専門の編集部門を結局なくしたそうです。

そして、いいレビューも悪いレビューもそのまま表示して、今のアマゾンの画面のように、個々のユーザーレビューに対して、他のユーザーが役に立ったかどうかを投票できるようにして、一番役に立ったと評価されているレビューが商品説明の見やすいところに表示されるようにしたとのこと。

なお、レビューアーを匿名にするか実名にするかの調査も散々やったらしいのですが、大事なのはレビューアーが実際のアマゾンでその商品を買っているのかどうかを表示することで、それさえ表示すれば匿名か実名かは関係ないこともわかったそうです(確かにレビュー読むときこの情報必ず確認しますよね)。

また、同じく専門の編集者たちがあれこれテーマ別にまとめた記事よりも、その商品を購入している人がほかのどんな商品を買っているかといった情報が購買行動に影響を与えることがわかり、今のアマゾンのような、この商品を買った人はこれも買ってます的な情報を載せることにしたとのこと。

ある商品を買っている人が同時に買っている別商品というのは、たまたま同時に買っただけの物もあるのである程度データ精製は必要ですが、ある意味、同じ悩みを持っている人がより良い解決策を持っている可能性を示唆していて、その商品に関するとても重要な商品情報とも言えます。

結局、商品のユーザーレビューと同時購買商品情報という、他のユーザーが提供する情報の方が、アマゾンサイドが提供する情報より、有用なことがわかったわけです。

ここで、アマゾンはあれこれデータ分析して、一番消費者にとって役に立つ情報を提供している、なんてまとめてしまうと、本質を見誤ります。

アマゾンが小売業界で一番成長しているのは、消費者にとって一番便利だからだ、なんていうのは分析のようで分析にあらず。

大事なことは、アマゾンが、上記のプロセスを経て、もう個人対組織の時代は終わったと、新データ社会の到来にいち早く気付いたことです。

個人に対して、強大な情報収集力を持つ組織が、保有する情報を駆使して、マーケティング戦略を練る時代は終わると気付いたわけです。

セグメンテーション、カテゴリー化、ターゲット分析といった、マーケティング戦略は通用しなくなると。

そうではなくて、無数の消費者の行動をデータ化し、その集合たるソーシャルデータを精製して、個々の個人に適した情報を提供するデータ企業にアマゾンはならなくてはいけないと気づきます。

消費者が本当に望んでいるのは、企業からの一方的な情報提供ではなく、消費者同士の情報交換による意思決定の充実であり、消費者同士の交流を提供する場こそ、消費者が購買行動に満足する場なわけです。

企業がいくら宣伝しても無駄な時代が来つつあり、そうではなく、消費者同士の交流を促すとともに、そこから生まれるソーシャルデータを収集して、個人ごとにカスタマイズして提供しなくてはいけないと。

ネット通販の売り上げが伸びているのは、買い物のために外出するのが面倒だからではありません。

同じものを買った人や、同じ悩みを持った人の意見をネットで調べたいからで、しかもそこで納得いく情報が得られれば、現物を確認する必要も店員に質問する必要もないからです。

私たちは、病気になると医者に行きます。これは避けられません。

しかし、もし、同じ病気で悩む人たちが交流する真摯なSNSがあったときに、たまたま出会った一人のお医者さんの意見を100%信用して、そのSNS内での意見を参考にしないなんて言う選択肢はあるでしょうか。

受験生同士が知識を持ち寄って教え合う勉強交流サイトと、たまたま地元にある塾と、どちらが信用できるでしょうか。

また、株などの投資をやる人で、証券会社に対して、自称プロの社員のアドバイスなんて要らないから、投資成績の良い人の投資行動を教えろと思ったことがある人も多いと思います。

プロからの一方通行の情報よりも、私たち自身が作り出す情報の方が、私たちには役に立つ可能性が高いわけです。

しかし、私たちが作り出す情報は膨大で、個人がどうにかすることはできません。

そこで、膨大な情報を収集・整理・カスタマイズして提供するデータ企業が求められるわけです。

これは、既存の小売業の延長にはありません。

こういった時代の流れを読み切って、アマゾンでは、顧客一人ずつの分析どころか、私がアマゾンのサイトを見ているときに、夜見ているのか昼みているのか、スマホから見ているのかパソコンから見ているのか等で分けて、顧客0.1人単位のマーケティングをしているようです。

こういった背景を踏まえて、この本では、これからのデータ社会について、コメントしていきます。

特に、プライバシーの権利について熱く語っていて、そこがちょっと硬くて読みづらいのですが、要約すると下記になります。

従来のプライバシーの権利の議論は根本から改める必要がある。

知る権利とか、自己情報をコントロールする権利とか、それらはデータ量が少なかった時代の話で、現代のデータ社会で自分に関するデータなんて到底コントロール不能であり、全部把握すること自体不可能。

その一方で、アマゾンでの買い物のように、私たち自身の行動を集約したソーシャルデータは適切に収集・精製・提供される限り私たちの意思決定を豊かにするもの。

そして、アマゾンには自分が何が欲しいのか伝えないと商品の検索が出来ず、グーグルにも自分が何を調べたいのかを教えないと役に立つ情報が得られないように、ある程度は個人が情報を提供しないと、ソーシャルデータからの便益は受けられない。

結局、大事なことは従来の議論そのままに、プライバシーを神聖化して、なんでもかんでも隠そうとするのではなく、データ会社によるある程度の収集は認めつつも、そのデータを何に使っているのか、また、データの提供に見合う便益を提供しているのかを監視可能にする透明性の確保と、私たち自身が、そのデータにリテラシーを持ってアクセスできるようにする主体性の確保を実現し、ソーシャルデータから私たち自身が最大限に便益を受けられるようにしないといけないというものです。

スポンサーリンク

Gメールのユーザーは数億人いて、メール内容が全部グーグルのロボットに読まれていることに皆同意しています。

そして、スマホでネットを見ていたりすると、メールの文面やサイトの閲覧履歴とかからその人向けの広告が表示されるわけですが、一番多い苦情は、個人の嗜好が詳細に把握されていることに対してではなく、関係ない広告が表示された場合の、もっと自分に合った広告を表示しろというものらしいです。

私はこんなものに興味を持ってない!、私は婚活なんかしてない!、私はホラーマンガなんてて読まない!、などといったもの。

確かに、一億総監視社会とかいろいろ言われていますが、現代データ社会でソーシャルデータから受けられる私たちの便益を最大化する方法を考えたときに、どう考えても、既存のプライバシーの考えは、時代遅れの遺物として足枷でしかない気がします。

Gメールの中身をグーグルのロボットに読まれるのが嫌だからアカウントを作らないという人もいるかもしれませんが、その人たちの意見が「正しい」ということになったら、すでに便益を与えている多くのサービスが廃止に追い込まれて、多くの人にとってはそっちの方が困ります。

先日行われた若者中心のなんかのデモでは、参加者がフェイスブックやツイッターでリアルタイムにデモの状況を発信し、広く参加者を募りながら、デモ隊の先頭には、支援する人権弁護士グループがいて、撮影しようとする警察に対して、肖像権の侵害だと戦ったらしいですが、さっぱり意味が分かりません。

選挙における投票が匿名になったのはそんな昔の話ではなく、市民革命直後などは、投票は市民の義務でしたから、匿名での投票などは卑怯者や臆病者の所業で、記名が当然でした。

その時代に戻れと言ってるわけではないですが、匿名と責任の所在とは切っても切れない関係にあります。

自分にはプライバシーを要求し、他人には責任ある行動を要求するのが私たちですが、いい加減根本的な議論をしないといけない時期に来ているような気がします。

そんな中、この本では、第一級のデータサイエンティストが、これからの時代にあるべきデータ管理の在り方に、非常に詳細な提案をしていて、硬くて眠くなるのと、いきなりそんなに考え方変えられないよー、と思いますが、確かにどうにかしないといけないなと考えさせてくれます。

とはいえ、そういった新しい考え方をしていくためにも、我々自身の情報リテラシーを高めなくてはいけません。

ここが、この本の第二の内容で、最先端のデータ企業達がどんなデータを集めてどのような利用をしているかを、あれこれ事例紹介が続きます。

この業界の第一人者だけあって、非常にたくさんの事例が紹介されていますが、面白いなと思ったものを下記でいくつか紹介します。

まず、2015年にフェイスブックが取得した特許の話。

フェイスブックは、金融機関に対し、照会のあった個人のSNS上の人間関係を調べ、対象者の周りにどれだけ信用できない連中がいるかを指標にして売ろうとしているようです。

まあ、昔から、住所で個人の信用度を図ったりすることはあって、今では当然差別として許されることではないですが、物理的な隣人ではなく、人間関係的なリアルな隣人を指標にその人の信用度を図ろうとする試みで、かなり正確性は高そうですが、果たしてこれも差別なのかどうか。

次に婚活サイト。

婚活サイトほど、偽装が多いサイトもなくて、登録者の年齢分布をみると、突出して29歳の人が多いらしいですが、登録者が知りたいのは、他の登録者の自己申告ではなくリアルな姿。

そこで、各登録者のコンタクトをもらってからの返信までの平均的な時間や一定期間に同時に何人にコンタクトをとったのか等を開示しようとしたりいろいろやっているそうです。

なかでも、自己プロフィールの更新頻度からその人の正直度のようなものを算出したいらしいのですが、必要な更新も多いので、なかなか難しいようです。

また、有用なソーシャルデータとしては、その人がどんな人のプロフィールを見ているかといった、クリック履歴情報も公開してはどうかなどと、アマゾンの元チーフサイエンティストらしい血も涙もないクールな提案もしています。

もっとも、黒人女性を片っ端からブロックている人がいたので人種差別主義者かと思ったら、黒人女性でかつグラマーな女性を徹底的に探している人で、無駄な連絡がこないようにお目にかなわなかった女性を一人ずつブロックするまめな人であることが分かったりして、扱う情報が繊細で複雑ですから、データ分析も一筋縄ではいかず、腕利きのデータサイエンティストたちが結集して知恵を絞っているそうです。

続いてネットフリックス。

ユーザーの閲覧履歴やその人が投稿したユーザーレビューに基づいておすすめ作品を紹介するアルゴリズムがあるらしいのですが、『市民ケーン』のような評論家受けの良い作品には高評価が付きやすい一方で、コメディ的な作品には低評価がつきやすいらしく、ユーザーレービューが本音かどうかは怪しいので、視聴開始から中断するまでの時間(最後まで見たかどうか)をしっかりと反映しておすすめ作品一覧を作ってくれているとのこと。

最後に、個人特定情報。

スマホをタップするときの力の強さ、左右や上下にスワイプするときの指を置く位置と動かす幅、スマホを持つときの手の微妙な震え(振動)から、個人は特定できるそうです。

といった感じで、上記は一部の一部というくらい、データ社会の現実が具体例とともに紹介されています。

以上、まとめると、この本は、データ社会の実像を解説しながら読者の情報リテラシーを高めつつも、既存のプライバシー権の概念のままでは、来るべきデータ社会の恩恵を受けられないので、一般市民の高いデータリテラシーを前提とした、データやプライバシーとの新しい向き合い方を提案している本です。

そういう点では、アマゾンという会社について知りたい人が読むとちょっと期待外れに感じるかもしれませんが、実はよく読むと、アマゾンという会社が他とは次元の違うところにいることを理解するために必要な視点を提供してくれる本でもあります。

あの会社が目指しているのは小売業の覇者などではないというのがよくわかります。

世界のビッグ4企業として、グーグル、アップル、アマゾン、フェイスブックが挙げられたとき、なぜフェイスブックが混ざっているのかがぴんと来ないという人にもおすすめです。

データ社会の現在と未来、興味ある人は是非。


スポンサーリンク