ハッシュタグは「#インフルエンザ」〜日経サイエンス2018年6月号より
ソーシャルメディア上の会話からインフルエンザ流行を予測する試み
インフルエンザの大流行を事前に予測できれば,保健当局が早期の対策を講じて関連死者数を減らすのに役立つだろう。インフルエンザ関連の死者数は毎年世界で29万~65万人に達している。最近,ソーシャルメディア上の会話内容を解析するだけで,インフルエンザの流行を最大2週間前に正確に予測したとする研究が報告された。理論的には,こうした予測によって,流行防止を最も必要としている地域に資源を振り向けることができるだろう。
ワシントン州にある米国立パシフィックノースウェスト研究所のチームが,天気やコーヒーといったインフルエンザとは一見何の関係もない話題に関するツイッター上の会話から,言語的な手がかりを集めた。この情報をもとに,次のインフルエンザ流行がいつどこで発生しそうかを見極めた。
処理にあたって研究チームはディープラーニング(深層学習)というコンピューターモデルを利用した。人間の脳のニューロンの階層と記憶能力をまねたもので,研究チームのアルゴリズムはツイッター上の言葉遣いや意見,対話行動が特定の期間中にどう変化したかを調べ,そうした変化がその後に報告されたインフルエンザの流行とどう関連しているかを解析した。
特定の単語に絞るよりも好成績
「このディープラーニングモデルのよいところは,感情や言語の手がかりの時間的な変化を考慮して将来を予測する点にある」と研究を率いたコンピューター科学者ヴォルコヴァ(Svitlana Volkova)はいう。研究結果は昨年12月のPLOS ONE誌に発表。
インターネットを通じてインフルエンザの流行を予測する試みとしては,ツイッターやウィキペディアの記録を用いた研究や「グーグル・インフル・トレンド」というプロジェクトなどがあるが,いずれもインフルエンザに関連する単語に絞って調べていた。これと対照的にヴォルコヴァの研究は一般的なツイート1億7100万件を調べ,単語検索や間近に迫った流行を示唆する臨床データだけに基づく他のモデルを上回る成績を上げた。
「特定の局所集団についてインフルエンザの流行を予測できるというのは,私たちがこれまでソーシャルメディアを用いてできると考えていた事柄の限界を押し広げ,新たな可能性を開くものだ」と,ジョンズ・ホプキンズ大学のコンピューター科学者ドレッゼ(Mark Dredze)は評価する。(続く)
続きは現在発売中の2018年6月号誌面でどうぞ。