
「木を見て森を見ず」ということわざの存在は,物事の全体像を捉えるのがとかく難しいことを表している。ビッグデータの解析は,ちょうど巨大な森を一望しようと試みるようなものだ。近年のデータサイエンスでは,ビッグデータの全体的な構造をうまく捉える「トポロジカルデータ解析」という手法が注目されている。今世紀に入ってから急速に発展したこの手法は,材料科学や生命科学から企業の技術戦略に至るまで,幅広い分野で威力を発揮しつつある。
トポロジカルデータ解析とは,その名の通りトポロジー(位相幾何学)を使ったデータ解析手法だ。トポロジーで最も有名なのは,「穴の開いたドーナツと持ち手の付いたコーヒーカップ」の例だろう。トポロジーの観点で見ればこの2つは同じ形だ。どちらも立体の中に穴が1個貫通しており,穴を残したまま残りの部分を粘土のようにぐにゃぐにゃと変形させれば,両者の形の間を自在に行き来できる。
中学校の数学では,様々な形の三角形を扱う道具として合同や相似といった概念を学ぶ。回転や移動によって2つの三角形が重なる時,それらの三角形は「合同」の関係にある。サイズを変えることで重なる時は「相似」の関係だ。トポロジーもこれと同じで,無数の種類がある多次元の図形どうしを関係づけ,分類するための幾何学の道具に位置づけられる。
そんな抽象的な概念であるトポロジーが,具体的な大量の数値を扱うビッグデータ解析とどのように結びつくのだろう。日本のトポロジカルデータ解析の第一人者である京都大学高等研究院の平岡裕章教授に尋ねてみた。
関連動画
協力:平岡裕章(ひらおか・やすあき)
京都大学高等研究院教授。2005年大阪大学基礎工学研究科博士課程修了。ペンシルベニア大学数学科客員研究員や東北大学材料科学高等研究所教授などを経て2018年より現職。トポロジカルデータ解析(TDA)の多分野への応用と,基礎的なTDAの数学理論の双方を手掛ける。2012年にTDA研究の功績で藤原洋数理科学賞奨励賞を受賞。