タグ ‘ ケネス・クキエ

『ビッグデータの正体 情報の産業革命が世界のすべてを変える』/ビクター・マイヤー=ショーンベルガー、ケネス・クキエ(その3)

『ビッグデータの正体 情報の産業革命が世界のすべてを変える』/ビクター・マイヤー=ショーンベルガー、ケネス・クキエ

データを2次利用することができるビッグデータの時代には、リスクの性質がこれまでとはまるで異なるものになってしまう、ということは前回のノートで見た通りだ。

となると、リスク管理の方法としても、現在行われているような、「告知に基づく同意」――収集者は、こういう目的でこの情報を集めますよ、と告知し、ユーザはそれに同意する――方式だけではまったく不十分だということになる。なにしろ、告知の時点で存在していない2次利用のアイデアについては、ユーザは同意のしようがないからだ。(まあ、最初の「告知に基づく同意」の際に、将来のありとあらゆるデータ利用に同意してもらう、という方法もあるのだろうけれど、現実的なアイデアだとは言えないだろう。そんなことをしたら、同意の手続き自体がほとんど無意味なものになってしまう。)

データセットから氏名や住所、クレジットカードの番号、誕生日など、個人を特定することのできる要素を削除する、「匿名化」という方法もある。だが、これについても、ビッグデータの世界においては、匿名化されたはずの情報であっても、別のデータセットとの組み合わせから身元が特定できてしまうケースというのがあるため、あまり有効とは言えないはずだ、と著者は述べている。

…というわけで、ビッグデータ時代には、上記のような従来のプライバシー保護のための対策が有効でなくなってしまう、ということになる。個人を特定するためには、その人物の周辺情報――交友関係、オンライン上のやりとり、コンテンツとの関係性etc.――を収集しさえすればいいのだ。

 *

では、そんなビッグデータの濫用を食い止め、ガバナンスを徹底するためには、どういった法整備が必要になってくるのか。著者は、こんな風に主張する。

ビッグデータ時代には、これまでと大きく異なるプライバシー保護の枠組みが必要だ。それには、データ収集時に個別に同意を求める形よりも、データ利用者に責任を負わせる形が望ましい。そのような仕組みになれば、企業は、個人が処理される際、個人にどのような影響が及ぶのか慎重に検討したうえで、データ再利用を正式に評価することになる。(p.258)

収集したデータ利用に関する責任を、一般大衆からデータ利用者の側に移す、ということだ。なかなか大胆な提案のようにも感じられるけれど、たしかに理に適っている。データの用途についていちばん詳しいのはデータの利用者であるわけだし、利用者が自らリスク評価を行えば、機密情報が外部に漏れる恐れもない、というわけだ。

また、「予測される行為によって人間を判断すること」への対策としては、やはり個人はその実際の「行い」にのみ責任を持つ、という条件を担保しなくてはならない、と著者は強調している。アルゴリズムによって、人を「犯罪者予備軍」認定することは、個人の自由意志や行動の自由を否定し、尊厳を破壊する行為、言ってみればデータの独裁であるからだ。そして、その上で、ビッグデータによる予測を利用して判断を下す場合にも、透明性、認定制度、予測に対して反証するための方法を明らかにするなど、一定の安全措置を用意しておくべきだ、という。これは犯罪予防に限った話ではなく、たとえば、企業による従業員の採用/解雇、ローンの審査などといった場面においてビッグデータを活用する際にも求められるものだ。

こうした法整備に加えて、誤ったビッグデータの利用を回避するためには、ビッグデータのアルゴリズムの専門家、「アルゴリズミスト」が必要となってくるだろう、とも著者は語っている。これは、公平と機密保持の原則に則った上で、ビッグデータによる分析・予測の評価を行う職業だ。ビッグデータがもたらす社会の変化とそのリスクに対応するためには、各個人の意識の変化や法的な対応に加えて、新たな技術を管理するための専門家も当然必要となってくるだろう、というわけだ。


『ビッグデータの正体 情報の産業革命が世界のすべてを変える』/ビクター・マイヤー=ショーンベルガー、ケネス・クキエ(その2)

『ビッグデータの正体 情報の産業革命が世界のすべてを変える』/ビクター・マイヤー=ショーンベルガー、ケネス・クキエ

前回のノートでは、ビッグデータとはいかなるもので、それによってどのような変化がもたらされようとしているのか、そして、そこから利益を引き出そうとする際にはどんなことに留意すべきか、といったことをまとめてみた。では、ビッグデータの革命によって新たにもたらされるリスクがあるとすれば、それはいったいどのようなものなのだろうか?

 *

ビッグデータが引き起こすかもしれない新たな危険について、著者はこのように述べている。

重要なのは、ビッグデータによってプライバシーのリスクが高まるかどうか(高まることは確かだろう)よりも、リスクの性格が変わってしまうかどうかだ。単にこれまでよりも脅威が大きくなるだけなら、ビッグデータ時代もプライバシーが守られるように法令を整備すればいい。これまでのプライバシー保護の取り組みを一段と強化するだけの話だ。しかし、問題自体が変わってしまうのなら、解決策も改めなければならない。(p.229)

もちろん、リスクの性格はこれまでとは変わってくるはずだ。ビッグデータから抽出可能な利益というのは、スモールデータから得ることのできるそれと質的に異なるものであるのだから、当然のことだ。

データの収集・蓄積・分析が低コストで行えるようになったビッグデータ時代、ありとあらゆるものごとから収集されてきた大量のデータは、取得時点での目的に対して使用するだけには留まらず、将来的に、まったく別の用途のために2次利用することが可能になってくる。

アマゾンは客が購入した書籍だけでなく、単に眺めただけのウェブページまで記録している。こういうデータがあれば、1人ひとりの客に応じた「おすすめ商品」を提示できるからだ。同様にフェイスブックでは、ユーザーの「近況アップデート」と「いいね!」の情報を基に、最適な広告を画面上に表示することで収入を得ている。
食べ物もキャンドルも消費すればなくなるが、データの価値は使っても消えないし、何度でも繰り返し加工できる。(p.156,157)

このような2次利用が可能となったデータがもたらすリスクとは、どういったものであるのか。本書によれば、それは「予測だけで人間を判断する行為」だという。大量の個人情報を用いて行うビッグデータ予測は、個人を、その実際の行為ではなく、傾向や習性によって罰する道具にもなり得るというのだ。

あらゆることがデータ化され、その相関関係が明らかになってしまえば、私たちは何ごとにつけてもデータの託宣を、アルゴリズムの預言をもとに判断を行うことになるかもしれない。そのとき、データによって示される「確率」は人間の生や尊厳に対して大きな影響を持たずにはいられないはずで、たとえば、データから予測される「確率」から、人を罰する「理由」が見出されるようになることさえあり得るかもしれない…ということだ。

 **

予防テクノロジーというやつは、リスクとなるファクターを特定することで、好ましくない事態の発生をあらかじめ封じ込めようとするものだけれど、ビッグデータを予防テクノロジーとして使えば、個々人を直接的に監視しなくとも、収集されたデータを分析にかけるという形で、間接的に監視を行うことができるということになる。となると、これはもはや「プライバシーの侵害」などといったレベルの問題ではなくなってくる。なにしろ、ビッグデータ予測によって犯罪や違法行為が未然に防止される、という『マイノリティ・リポート』的な世界が実現できてしまうというわけなのだ。

これまでのようにプロファイリングを実施するにせよ、差別的な側面をなくし、もっと高度に、個人単位で実行できるようになる。それがビッグデータに期待できるメリットだ。そう言われると、あくまでも良からぬ行為の防止が狙いなら、受け入れてもよさそうな気がする。しかし、まだ起こってもいない行為の責任を取らせたり、制裁を加えたりする道具にビッグデータ予測が使われるとすれば、やはり危険きわまりない。(p.241)

これは単なる治安維持の問題と片づけるわけにはいかない。社会のあらゆる分野に危険が及ぶからだ。人間が物事を判断するあらゆる場面で、未来の行為の責任を問うかどうかがビッグデータ予測で決まってしまうからだ。経営者が従業員を解雇するかどうか、医師が患者の手術をやめるかどうか、夫婦が離婚に踏み切るかどうかなど、何でも関わってくる。(p.243)

こういった事態は、ビッグデータの使い方を誤ったがために発生する。ビッグデータとは相関関係を前提としたものであるのに、それを用いて因果関係を判定しようとするから、おかしなことになってしまうのだ。まあ、あたりまえと言えばあたりまえのことなのだけれど、なにしろ人間というやつはこの世界を因果関係でもって把握しようとする癖があるわけで、データの分析結果を過大評価して、そこから導かれた「答え」を真実の根拠だとおもい込んでしまう…というケースは、これからいくらでも発生し得るだろう。

ビッグデータの時代には、データというものの性質や価値がこれまでとは大きく変化してくることになるだけに、その活用には注意深くあらねばならない、ちょっと油断すれば、データ至上主義の世界、自由意志や個人の主体性といった人間の尊厳さえもが解体し否定される、『マイノリティ・リポート』や『ガタカ』のディストピア世界に一直線だ、と著者は警告しているわけだ。


『ビッグデータの正体 情報の産業革命が世界のすべてを変える』/ビクター・マイヤー=ショーンベルガー、ケネス・クキエ(その1)

『ビッグデータの正体 情報の産業革命が世界のすべてを変える』/ビクター・マイヤー=ショーンベルガー、ケネス・クキエ

タイトル通り、「ビッグデータ」とはいったいいかなるもので、それがこの世界に引き起こす影響とはどのようなものであるのか、について書かれた一冊。「そもそもビッグデータとは何なのか」、「ビッグデータの時代におけるデータの価値と、それを利用したビジネスのモデルについて」、「ビッグデータ社会におけるリスクと、求められる新しいルールについて」といった内容がまとめられている。ビッグデータを活用した商業的なアイデアや実例がたくさん挙げられているところ、ビッグデータ社会のリスクについて多くのページが割かれているところが特徴的だろうか。何回かに分けて、簡単にノートを取っておこうとおもう。

 *

まずは、「そもそもビッグデータとは何なのか」ということについて。

現在のところ、「ビッグデータ」という用語に厳密な定義はなされていないという。が、まあ、一般的な解釈としては、「IT技術の発展とインターネットの普及によって生み出された、従来型のデータベースでは処理し切れないような巨大で複雑、多種多様で非定型、更新頻度の早いデータの集合及びそれを扱うシステムのこと」、といったところになるはずだ。ただ、近年の情報爆発によるデータの蓄積は、もはや単なる量的な変化に留まらず、質的な変化をも引き起こしつつある、と著者は語っている。この、質的な変化というのが、本書における「ビッグデータ」というコンセプトを理解するための鍵だと言っていいだろう。

現時点でビッグデータの捉え方(と同時に、本書の方針)は、次のようにまとめることができる。「小規模ではなしえないことを大きな規模で実行し、新たな知の抽出や価値の創出によって、市場、組織、さらには市民と政府の関係などを変えること」。(p.18)

ビッグデータは、従来のデータ処理(スモールデータ)の大規模版というだけのものではない。圧倒的に大きな規模のデータの管理と分析が可能になったことで、いままで見過ごされてきたデータやその組み合わせから、従来ではかんがえられなかったような価値を生み出すことができるようになっている、ということだ。

 **

そんなビッグデータの扱いにおいては、大きく3つの鉄則がある、という。

ひとつは、「あるテーマに関して、一部のデータや統計的なサンプルで済まさず、できる限りすべてのデータを分析する」こと。ありとあらゆるものがデータ化されるようになり、そして、大量のデータの保存や処理にかかるコストがじゅうぶんに低下したビッグデータの時代には、いわゆる標本抽出ではなく、とにかく手に入るすべてのデータを対象として分析を行うべきだ、ということだ。

ふたつめは、「正確さに拘泥せず、現実の乱雑なデータをそのまま受け入れる」こと。現象の全体を包括するようなデータが手元にあるのであれば、その数字からは「精度」ではなく、全体的な「傾向」や「確率」を読み取るようなアプローチを取るべきであって、個々の測定値の正確さにこだわり過ぎる必要はない、という意味だ。

そしてみっつめは、「予測にあたっては、因果関係を追求するのではなく、相関関係を積極的に信頼する」こと。スモールデータの時代には、まず、現象の仕組みについて専門家が仮説を立て→その上でデータを収集して→仮説が正しいか分析する、という流れで検証を行っていたけれど、ビッグデータの時代においては、まず、大量に集められたデータのなかから相関関係を見出し、そこを起点に理解を深めていけばよい、ということだ。「結論」がわかりさえすれば、その「理由」がわからなくても問題ないケースっていうのは、結構あるはずだよね、というわけだ。

この、因果関係の時代から相関関係の時代へ、という話は本書のメインテーマのひとつであり、説明のために多くの例が挙げられている。たとえば、中古車ディーラーから提供されたデータをもとに、相関分析のアルゴリズムによって問題のありそうな車を抽出してみたところ、「オレンジ色に塗装されたクルマは欠陥が大幅に少ない」ことがわかった、という話。「オレンジ色の塗装」と「中古車の状態の良さ」のあいだにあるかもしれない因果関係、いかにもそれらしい理屈というやつを見つけるのはなかなか困難だけれど、こういった場合には、因果関係を気にせず、明らかになった相関関係だけに注目した方が有意義な結果を残すことができるのではないか、というのが著者の主張だということになる。

 ***

本書の裏表紙には、「DATA IS NEW OIL.」と記されている。情報の大量供給・大量消費によってもたらされるビッグデータ時代とそれによって創出される新たな価値は、石油のようにパラダイムシフトを引き起こし、ビジネス面のみならず、人間の生活や思考にまでも影響を与えてくることになる――たとえば上記のように、物事の決定に際して因果関係というものの重要性が低下する、とか――ということなのだろう。では、そのようなビッグデータの時代においては、どのようなリスクが発生し、私たちはどのようにそれに対処すべきなのか?次回はその辺りについてノートを取ってみようかとおもう。


Calendar

2015年10月
« 7月    
 1234
567891011
12131415161718
19202122232425
262728293031  

Archive