暫定龍吟録

反便利、反インターネット的 This blog has not been updated since 2017

2014年12月の記事

個人情報の問題とは別にある「ビッグデータの問題」

 今年2014年にニュースになった出来事の中で印象に残っているものに、オムロンのJR乗降客映像無断流用問題がある。
 この件はその時期にはそれなりに話題になったと思うが、ほぼ同時期にニュースになったベネッセによる大規模な個人情報流出問題の影にすっかり隠れてしまった。

 このオムロンの問題を振り返りながら、そこから見えてくる「ビッグデータの問題」について考えてみたい。

電子機器大手オムロン(京都市下京区)が、JR東日本の4駅で撮影した乗降客の映像を、JR東に無断で別の研究に流用していたことが朝日新聞社の調べでわかった。不審行動を割り出すセンサー技術の研究に使い、総務省の外郭団体から約2億5千万円を受け取っていた。

オムロン、ひそかに撮影13カ所 実験目的告げずオムロン「チェック働かなかった」 駅映像の無断流用
 映像が流用されていたのは、熱海(静岡県熱海市)、板橋(東京都板橋区)、国分寺(同国分寺市)、桜木町(横浜市中区)の4駅で、撮影時間は少なくとも計120時間に及ぶ。

 オムロンは2008~09年、4駅の改札付近の乗降客の流れを調べる流動調査のために各駅に10台ほどのカメラを設置。JR東側からDVDで映像の提供を受け、契約に基づき分析結果をJR東側に報告した。オムロンはJR東側とデータを一定期間後に破棄することや、委託した目的以外では使わないことを約束していた。一方で、総務省所管の独立行政法人「情報通信研究機構」(東京都小金井市、NICT)の事業公募に、不審行動を割り出す映像センサー技術の開発を目指すとして応募し、10年度までの5年連続で採用されていた。オムロンはこの研究で、改札の不正通過や混雑、放置物、滞留、けんか、うろつき・徘徊(はいかい)、しゃがみ込み、ごみ箱あさりの8種類の行動を「不審行動」と位置づけ、4駅のDVDの映像を無断で用いて、不審行動をとった人を追跡するシステムを開発した。この研究には総務省が約2億5千万円を支出していた。

朝日新聞 2014年7月12日 「JR乗降客映像を無断流用 オムロンが「不審行動」解析」




個人情報の問題とは別のビッグデータの問題

 個人情報の問題とビッグデータの問題の区別がついてない人が多い。それどころか、個人情報の問題「のみ」があって、ビッグデータの問題なんてものは無いと思ってる人も多い。

 同時期にあったベネッセの個人情報漏洩問題がいつまでも話題になっているのに比べても、オムロンの問題が話題になっていないのが、象徴的である。

 昨年の日立の件や今年のオムロンの件のように、ビッグデータに関する問題がニュースになった時も、世間の人々の多くはまだこれを個人情報の問題と捉えている。

 オムロン社長の謝罪の言葉がそれを如実に表している。
 「このたびは皆様にご心配とご迷惑をおかけし…」

 なぜ、このような謝罪の言葉になるか。
 それは、世間の人々が「私の個人情報」を心配しているからだ。そしてオムロンの件も個人情報漏洩問題のように捉えている。

 「私、いつもあの駅使ってるんだよねー。私のプライベートな画像データはちゃんと適切に処理されたのかなあ?ネットに出回ったりしなかったかなあ?」

 人々が心配しているのはそういうことだ。だからオムロンが「画像データは適切に廃棄いたしました。漏洩等は一切ございません」と言えば、「ああ、よかった。ホッと一安心」となる。

 このオムロンの件を批判する記事をほとんど見かけなかったのも、個人情報の管理さえきちんと行っていれば特に問題はない、と考える人々が多いことを示している。

 この件でも、オムロンはなぜきちんと契約を交わしておかなかったのか、と批判する声は一部で聞いた。しかし、それは表面上のことだ。オムロンはきちんと契約をしていなかった、書類の手続きを怠っていた、それが問題だ、と言う声はあるがそれは表面的な問題である。

 根幹には、人間の「欲」がある。「知りたい」という欲だ。そこから問題を見ていかなければ、オムロンの件、ビッグデータの問題は分からないだろう。


ビッグデータは副産物が多い宝の山

 ビッグデータは初期の目的とは違った二次的三次的な副産物が出てきやすい。
 「当初はこういう目的で調査を始めたのですが、調べを進めていくと初めは予想もしていなかった意外な事実が明らかになってきたのです!」ということがある。

 そしてそういうことは「ついで」に調べられることが多い。ちょっとした「ついで」を付け足すことで当初の目的の何倍も価値のあることを調べあげることができることに気付く。


動きの鈍いJR

 今年のオムロンの件と言い、昨年の日立の件と言い、JRの動きはどうも鈍いように感じられる。
 JRの社員が基本的には鉄道マニアの集まりだからだろうか。電車には関心があるがデータには関心がない。しかしデータを持っているのはJRだ。

 では、そのデータを欲しがるのは誰なのか。
 それが、今回登場した総務省やNICTの人間や昨年登場の日立などだ。こういうところには統計分析が大好きな人、「知りたがり」の人がたくさん集まっている。

 彼らはビッグデータの価値を誰よりもよく分かっている。そして知りたがっている。だがデータは持っていない。だから「あとちょっとこういうのを付け加えるだけで物凄く価値のあるデータが集まるのに」と考える。

 技術屋のオムロンがその期待に応える。

 ビッグデータをよく分かっていないJRは、のこのこと自分の敷地内へのカメラの設置を許可してしまう。


知りたい「ついで」

 この件は、技術的にデータ分析を進めていたオムロンがついでにこれも付け足せば、「更なること」が判るはず!、と考えたところから起こった事件だろう。

 オムロンが、もはや自分のところの「庭」と化しているJRの構内で、ほんのちょっと設備を加えればもっとすごいことが解析できる!と思うであろうことは十分想像できる。
 オムロンは技術屋だが、総務省やNICTに勤めるような人間と共に「知る」喜びとそこから搾り取れる果汁の旨味を覚え始めている。

 それと対比的に動きが鈍いのがJRで、去年の日立の件は報道で明るみになっていなければ、日立は小判の価値のわからない猫から破格の安値で宝の山を買えていた。
 JRは日立の件にしろ、オムロンの件にしろ、自分の敷地に設置された設備の目的について把握できていないように見える。

 「こんなデータの羅列のどこがいいの?」

 「いや、これはすごいんですよ。宝の山なんですよ。このデータ欲しいなあ、欲しいなあ」

 世の中には、データの羅列に意味を見出さない人もいれば、大きな意味を見出だして関心を示す人もいる。

 ビッグデータの周辺には、そういう「知りたがり」の人間がいっぱいいる。統計の専門家とかアナリスト、データサイエンティスト、等々。

 ところが肝腎のデータはそういう「知りたがり」たちの手元にない。ビッグデータの持ち主はあの「猫」なのだ。


ビッグデータの問題を惹き起こす二つの要素

 「ビッグデータの問題」がある。
 それは個人情報の問題とはまた分けて考えるべきものである。
 ビッグデータの問題を惹き起こす主な二つの要素がある。

 一つは「知りたい」という欲。

 少し古い話だが、以前、mixiで「足あと機能」が問題になったことがあった。
 mixiはユーザーたちからの苦情をたくさん受けたが、その苦情の中身をまとめると、「自分が他の人のページを見に行ったことを知られるのは嫌だけど、他の人が自分のページを見に来たことは知りたい」という矛盾したものだったのだから滑稽である。

 もう一つは、知りたい人とデータの保有者が異なっている、という現状の社会構造。

 この“ずれ”は時代を追って徐々に縮まっていくかもしれない。だがビッグデータにかぎらないが、初めの時期には大きな懸隔がある。冒頭に紹介した新聞記事に書かれている「年」に注意してほしい。ニュースになったのは2014年だが、オムロンがカメラを設置していたとされているのは2008年〜2009年頃のかなり昔の話なのだ。
 なぜこんな昔の話を掘り返さなければならないかというと、こうした、物事の「初期」「黎明期」にこそ、大きな懸隔が潜んでいるからである。

 そしてこの懸隔が大きな問題を惹き起こす。


悪意がなくても…

 ちょっと余談だが、小学五年生か六年生のころのある日、クラスメートから「おまえのこと好きって言ってる女子がいるんだけど誰だか知りたい?」と言われて「いや、いい」と答えたことがあった。

 もし教えてくれるつもりなのなら「○○さんがおまえのこと好きだって」と、ストレートに教えてくれればいいことである。
 それをこういう言い方をするのは、私の「知りたい」という欲を利用している。
 私みたいにモテない人間は、自分のことを好きと言ってくれる女子がいるなら、当然それが誰なのか知りたいに決まっている。

 もっともその彼には別段、深い意図はなかったかもしれない。ただ単に些細な話を長くしたかっただけかもしれない。

 ただ、「知りたい」という欲に従って手を伸ばすのは注意しなければならない。

 そして手を伸ばされる側も、またそのことに注意深くなければならない。

 オムロンも、あるいはその研究に関わっている総務省にしろNICTにしろ、別段悪意はないかもしれない。「私たちは別にそんな腹黒いことを考えてデータを蒐集したわけじゃありません」と言うかもしれない。
 おそらくそうだろう。あの時のクラスメートの彼と同じように別に深い意図はなく、気軽に記録してみているだけなのだろう。

 私は、悪意や腹黒い意図があるから問題だというのではなく、むしろそういう深い意図がなくやってしまうところが問題なのだと感じている。


ビッグデータに関わる三つの注意点

 一つは、自分がそういう「知りたがり」であることを自覚すること。
 なぜ、この自覚が重要かと言うと、知りたいという欲が働いてうっかり余計なところにまで手を伸ばしてしまいがちだからだ。
 ボーッとしていると、「おまえのこと好きって言ってる女子がいるんだけど」と言われたら「えっ!誰?」と即返してしまいかねない。
 それは本来、自分が知る必要があった情報かどうかを省察する必要がある。

 二つ目は、ビッグデータは初期に想定していなかったような副次的な産物を生み出しやすいものだと認識すること。
 つまり、初期の目的からいつの間にか曲がって、別の目的を追いかけてしまっていた、ということが起こりやすい。
 これは、データを「捉えられている」側の人から、「そういう目的でのデータの提供に同意したわけではない」という批判が来る。

 そして三つ目には、ビッグデータを欲しがっている人と所有者が今のところは異なっている、という点をよくよく認識すること。なぜ、この認識が大事なのかというと、この「差異」が巨きな利益を生み出すからである。


ビッグデータの活用段階と蒐集段階を両方考えよう

 ビッグデータの問題というのは個人情報の問題ではない。
 「個人情報の管理さえしっかりしていれば私たち市民は何も文句は言わない」というのでは甘い。

 頭のいい人たちは、窃に猫の体内にICチップや小型カメラを忍ばせる。無邪気な「一般市民」たちは今日も猫を撫でて可愛がる。猫から捉えられていることも知らずに。

 同意した覚えのない情報を蒐集され、その情報を蒐集した側の人間は、場合によってはそこから巨利を得ることができる。
 それが問題なのだ。
 それは、個人情報の漏洩によって個人の身が危険に晒される、プライバシーが筒抜けになる、という問題とはまた別の、ビッグデータに附随する「ビッグデータの問題」なのだ。

 以前、「Suicaの本質は“誰何” -JRスイカ売りの何が問題か-」の記事でも述べたが、人はもっとビッグデータの活用段階ばかりでなく蒐集段階についても考えるべきである。

 「個人情報の問題」とは別に「ビッグデータの問題」がある、ということを一人でも多くの人に知ってほしくてこの記事を書いた。