WELQ問題に関するその1です。
目次
はじめに
最近、DeNAの運営するWELQという健康医療系の情報サイトが炎上した挙句に閉鎖に追い込まれました。
この問題、一部のネット民の中の話題だけで終わってしまうかもしれませんが、非常に面白いので早速ブログのネタしようと思ったのですが、中々まとまらないので、フェードアウト上等で、連作にしてみたいと思います。
その1は基礎編です。
まず、一体何が起こっているのかよく知らないという人のために、WELQ問題について簡単にまとめてみます。
なお、非常に面白い記事がたくさんありますのですが、火付け役のBuzzFeedの記事と、クールに見てる山本一郎さんの記事を貼っておきます。
https://www.buzzfeed.com/keigoisashi/welq-03?utm_term=.glqwYPJ92#.nv6K0L8rN
http://bylines.news.yahoo.co.jp/yamamotoichiro/20161128-00064909/
キュレーションサイトとは
まず、WELQは医療や健康情報を扱うサイトなのですが、その最大の特徴はキュレーションサイトであることです。
キュレーションとは、「キュレーター(博物館の学芸員)」からの派生語で、「特定の視点からまとめた展示」といった意味です。
そして、キュレーションサイトというのは、よく言えばまとめサイト、悪く言えばコピペサイトで、インターネット上の様々な情報を整理統合して見やすくしたサイト、もしくはそういう建前のサイトのことを言います。
要するに、自分が記事を書くのではなく、ネット上の情報を寄せ集めて、情報ポータルサイトにしようという試みです。
まあ、ネット上では各自が勝手なことを書いており、今一つ辞書のようなサイトはないので、詳しい人が様々な情報を集めて有用な情報集約サイトをつくろうという、この思想自体は悪くはないです。
そして、DeNAという資金力のある上場企業が、「このサイトはキュレーションサイトなので、私は記事の中身については責任は負いませんよ(広告料は私がもらうけど)」という建前の下、情報錯綜する健康医療情報に関して作った巨大キュレーションサイトがWELQです。
もっとも、オリジナルの記事がある以上、検索に対して、オリジナル記事が表示されるのではないか、パクリ記事がオリジナルより上に来ることはないだろう、という疑問を持った人がいるかもしれませんが、そこで登場するのがリライトというやり方です。
リライトとは
リライトというのは、Re-Writeのことで、再び書く、つまり書き直すということです。
ネット上にある記事をそのままコピペするのではなく、ちょっと語尾やら、段落やらを変え、さらには複数の記事を合作して、一つの新しい(かのような)記事にすることを言います。
これは、著作権上の問題がありそうなのですが、ビタミンの効用、風邪の対処法等、オリジナル自体が事実の記述であって、小説等の創作ではありませんから、白と言わざるを得ないグレーなわけです。
これを黒といったら、高熱が出たら病院に行きましょうなんていう健康情報などがすべて著作権侵害になってしまいます。
リライトというのは足のないお化けのようなもので、リライトという名の技術は間違いなくあって普通に使われているのですが、リライトした記事の作成者は、これはネットを参考にして書いたオリジナルの記事だと主張するわけです。
また、Googleは既に認識している記事をデータベース化しているので、記事の盗用やコピペはすぐに見抜き、そういうサイトは検索結果に表示されないのですが、所詮それらも機械が機械的に判断しているので、リライト記事は見抜けません。
さすがに、これを判断するアルゴリズムは不可能で、もしそれを作ってしまうと、判明している事実を羅列する殺人事件のニュース記事なんかは、第一報以外はすべてパクリ記事認定されてしまいます。
つまり、キュレーションサイトをうたうことで、自分はネットから集めた情報を転載しているだけで内容に責任は負いませんとリスクは取らないくせに、リライトすることで、Googleにはオリジナルの記事であるかのように認識させてSEO上有利にして、広告収入を稼ごうという魂胆です。
SEOとは
SEOとはSearch Engine Optimizationの略で、検索エンジン最適化、つまり、検索結果で上位に表示されるように工夫して、なるべく多くの人に見てもらえるようにする試みを言います。
ある特定の検索ワードに対して数あるサイトがどういう順位で表示されるかについては、Googleの企業秘密であり正確にはわかりません。
厳密な仕組みはさておき、有料広告を除いて、ある検索ワードで検索した人にとって、役に立つ順にサイトを表示するという仕組みになっているとは言えます。
では、何をもって役に立つと言えるのか。
これは、私は専門家ではないのですが、自分なりにブログでやっているので知っている限りで説明すると以下のようになります。
まず、ユーザーフレンドリーさ。
これは、Google自体がこのスコアを測定するサイトを公開しており、アドレスを入れるとスコアを教えてくれます。
https://developers.google.com/speed/pagespeed/insights/?hl=ja
要素はいろいろありますが、ページが表示される速度が速いか(画像を圧縮して軽くしているか等)やレスポンシブデザインかどうか(スマホで見てもタブレットで見てもPCで見てもきれいに見えるか)等に基づいて計測されています。
他には、ページ滞在時間。
Google先生は、ネット上のあらゆるページついて、毎日何人が見たか、さらには、一人当たり何分見たか、もっとさらには、検索ワードごとに、たどり着いた人が何分見たかを記録しています。
つまり、単純に言えば、ユーザーの滞在時間が長いサイトが、それだけたどり着いた人がじっくり読んでいるということですから、ある検索ワードに対して、役に立つサイトであると言えます。
もっとも、文字の短い記事よりは長い記事の方が評価が高いらしい等、他にも様々な指標があるらしく、しかもその全容及び軽重は不明で、さらに常に改善されています。
詳細はさておき、そういった複数の指標の組み合わせで検索順位は決まります。
なお、他人の記事をコピペすると、パクリ記事として検索結果から表示されなくなるので、他人の記事を引用すると場合には、引用タグ(マークのこと)をつけなければいけないのですが、それをつけるとGoogleはその部分について記事の中身として認識しませんから、引用だらけの記事というのは、オリジナルコンテンツが乏しいということで、パクリ認定はされませんがSEO上非常に低評価を受けます。
そこで、リライトという技術が出てくるわけです。パクリなのにオリジナル記事として認識させるわけです。
さらに、以上は一つの記事の話でしたが、実はSEOにおいては、記事の集合としてのサイト自体の評価という視点があります。
物量作戦
Googleが表示順位を決める要素のうちに、その記事のあるサイト自体の評価というものがあります。
つまり、同じような有用な記事が二つあったとした場合、優良サイトにある記事の方が上位に来やすいということです。
そして、優良サイトというのは、当然優良記事がたくさんあるサイトであり、記事一つ一つのクオリティも重要ですが、記事がたくさんあることも重要なわけです。
そこで、DeNAという会社が物量作戦に出たわけです。
まず、フリーランスの外部ライターを使い、2000文字当たり1000円位(?)で記事を外注します。破格のようですが、そもそもリライト記事であることを忘れてはいけません。
検索数の多いキーワードをリストアップし、各キーワード毎に1記事と、大量の記事を書かせ、約8000字の記事を毎日100個以上アップするというすさまじい物量作戦に出ます。
毎日記事100個以上更新です。
ネットで見た情報によると、「身長、理想体重」といった検索に対応するために、身長1cm刻みで記事を用意していたらしいです。
そして、見やすくデザインを工夫したり、きれいな写真を載せたりして、滞在時間が長くなるように工夫をします。
ある意味DeNAなんて日本トップのSEO対策会社みたいなもんですから、文章さえあれば装飾等のSEO対策はばっちりです。
この物量作戦+トップレベルのSEO対策は功を奏して、このWELQというサイトは瞬く間に医療健康情報サイトとしては超優良サイト(扱い)に成長します。
その結果、医療健康系の情報を検索すると、ことごとく上位にWELQの記事が登場するという事態になりました。
ただ、記事の量産体制に問題がありました。
医療健康情報サイトにもかかわらず、ライターはネットで集めたどこぞの馬の骨です。キュレーションサイトですからもちろん記事は匿名です。
外注ライター一人一人に、検索ワードを指定するとともに、リライトする時に参考にするサイトや記事のリストまで渡して、内容に問題が生じないように権威ある医療機関の記事をパクるように徹底していたのですが、所詮はリライト記事の大量生産。
チェックする方もチェックしきれませんし、ましてや中身なんて、書く側もチェックする側もチェックする意思も能力もありません。
だんだんリライトではなくそのままコピペしただけの記事が量産され、さらには、複数の記事を合作した結果中身が矛盾しちゃった記事とか、語尾変えたら結論も変わっちゃったとか、指定以外の怪しいサイトからパクって来てとんでもない記事が出来たりとなってきました。
しかし、中身は医療健康系。
肩こりの原因は幽霊かもしれないなんて言うのは笑えますが、妊婦の健康、がん、うつ病等に関して怪しい情報を垂れ流したわけです。
もちろん、何でそういう巨大ポータルサイトを作りたいかと言えば、最終的には収益化、特に広告収入です。
正直感心してしまうのですが、「死にたい」というキーワードで1位を取る記事まで書いていて、「死にたい」なんていうキーワードできっちり1位を取りに行く能力は感心しますが、その記事には、やれ自己承認欲求やら、責任感やら、あれこれ書いてあって、最後には自己分析しようということになって、転職サイトへのリンクが張ってあるわけです。
遂に炎上
こうして、WELQは炎上しました。
まず、怪しい匿名の医療情報の垂れ流し。
しかも、何で調べても検索結果の1位にこのサイトの記事が登場する。
そして、かなり繊細なキーワードも含めて、もともとは収益目的じゃなかった、病院等が提供する医療情報まで、リライトで自分の記事扱いして収益化しようという方針。
ここら辺が主にやり玉にあげられます。
さらには、IT会社が資金力に物を言わせて、Googleを乗っ取ったかのような行為に出たことに対する怒りです。
最終的に閉鎖に追い込まれましたが、ぱっと見ただけでもいろいろな問題を含んでいます。
いろいろと面白いので、次回以降いろいろ考えていきたいと思います。
どこまで続くかはわかりませんが。