News Scan

ツイッター,鳥かご開く〜日経サイエンス2014年8月号より

データの宝庫を利用した研究には倫理的な配慮も必要に

 

 ツイッター上には世界で毎日5億件のツイートが投稿されている。個人生活に関する細かな情報が豊富に含まれているため,このソーシャルメディアは人間の行動パターンを発見しようとする科学者たちにとってデータの宝庫だ。健康リスク因子の探索や,感染症の拡大状況の追跡にも役立つ。例えばマイクロソフトの研究者たちは,妊婦のツイートに見られる感情的な手がかりを解析することで産後うつ病の危険がある人を予測するアルゴリズムを開発した。また,米国地質調査所は揺れに関するツイートを利用して地震発生の場所を追跡している。

 

 これまでは関心の高い科学者が限られた数のツイートを対象に解析してきた。大多数のツイートは公開されているものの,科学者がその目的にかなったものを自由に検索するにはツイッターのアプリケーション・プログラミング・インターフェースを使うことになり,現在これで検索できるのは保存データの1%にすぎない。

 

 その状況が変わろうとしている。ツイッター社は2月,2006年以降の全ツイートを研究者が自由に参照できるようにする方針を発表した。データ入手が楽になるので,研究手段としてのツイッター利用は急増するだろう。解析対象となるデータ数が増えるため,より複雑で具体的な問題を扱える。

 

ビッグデータで責任もビッグに

 今回の発表は心躍るものだが,同時に悩ましい問題も生じる。ツイッターのデータから生まれた科学的発見に関して,ツイッター社は何らかの法的権利を持つのか? ユーザーが研究への貢献を意図していない場合,ツイッターを研究手段として利用することに倫理上の問題はないのか?

 

 こうした問題に対処するため,バージニア工科大学の計算疫学者リバーズ(Caitlin Rivers)とルイス(Bryan Lewis)は2月,ツイッターデータの倫理的利用に関する指針を発表した。科学者に対し,ハンドルネームを決して明かさないことや,研究目的を公開することなどを求めている。例えばパブリックスペース(ツイッターもパブリックスペースのひとつ)からの情報収集は倫理的に問題ないものの,本人の同意なしに個別のユーザーを特定できるような詳細情報を共有することは倫理に反する可能性がある。

 

 ツイッターに基づく研究が増えていくなか,科学者がユーザーのプライバシーに配慮し,それを保護することは不可欠だとリバーズとルイスはいう。データが大きくなれば,付随する責任も大きくなる。■

 

ほかにも話題満載!  現在発売中の8月号誌面でどうぞ。

 

サイト内の関連記事を読む