
ノルウェー科学技術大学のデータ科学者ベンジャミン・A・ダンが1枚の画像を見せてくれた。点が均一ではなく,なんとなくストーンヘンジの岩のように分布している画像だ。その全体的なパターンは少なくとも人間には明らかだ。「私たちが見ればこれは間違いなく円だ」とダンは言う。しかし,コンピューターはこのシンプルな形を認識するのに苦労するだろう。「コンピューターは全体像をつかめないことが多い」。
多くの科学プロセスにはループ,つまり繰り返しが含まれている。コンピューターがこうした関係性を捉えられないことは,極めて多数のデータ点に潜む円形パターンを明らかにしたい科学者にとって問題だ。データは多くの場合,夜空の星のように,空間に浮かぶ点として視覚化される。例えば,公海上での船の位置を示す緯度と経度の2個の数字は,物理的位置として1つの点でプロットされる。同様に,遺伝子は多くの次元を持つ数学的空間中にプロットでき,同じようなDNA配列を持つ2つの遺伝子は互いに近い点で表示される。データ中の円形パターンが持つ意味は文脈によって異なる。船の位置に円形パターンが見られれば,その船が針路を見失っていることを表すが,遺伝子データの場合は進化上の関係性を示している。
このようなデータ点が作る“星空”は,しばしば複雑で次元も高いため,肉眼では調べられない。円形を検出するには,コンピューターが理解できるような一連の細かい指示が必要になる。だが,標準的なデータ解析手法の多くは直線や平面を扱う線形代数に基づいている。一方で,ループを探し出すために研究者が頼る手法がトポロジー(位相幾何学)を応用した「トポロジカルデータ解析(TDA)」だ。
夜空の星の配置を星座として捉えるように,TDAは散在するデータ点が作っている形を数学的に明らかにするのに役立つ。まず,データ点を仮想的な足場を構成するノードとして,複雑な構造を構築する。この構造は数百次元になることもある。得られた図形は元データの本質の多くをより把握しやすい形で含んでおり,数学者はそれらの構造をトポロジーの視点で検討する。つまり,足場が伸ばされたり曲げられたりしても保存される特徴を探すのだ。
著者
Kelsey Houston-Edwards
数学者でジャーナリスト。公共放送サービス(PBS)のネット配信番組PBS Infinite Seriesを制作したことがある。
関連記事
「大規模なつながりは突然に ネットワークの相転移を語る数理」,K. ヒューストン=エドワーズ,日経サイエンス2021年12月号。
原題名
Squishy Math(SCIENTIFIC AMERICAN October 2022)
サイト内の関連記事を読む
キーワードをGoogleで検索する
トポロジカルデータ解析/トポロジー/パーシステントホモロジー