News Scan

生涯学習するAI〜日経サイエンス2019年1月号より

適応を続ける人工知能の試み

 

卒業後に学ぶのをやめてしまったら? 「ボーっと生きてんじゃねえよ!」と叱られるに違いないが,ほとんどの機械学習システムの学習はそうなっている。それらのAI(人工知能)はあるタスクを習得したところで実用に供され,それっきり変わらない。だが一部のコンピューター科学者は,人間の脳のように学習と適応を続けるAIの開発に取り組んでいる。

 

機械学習アルゴリズムはニューラルネットワークの形を取ることが多い。単純な計算素子であるニューロンが多数つながったネットワークで,相互接続の強さ(「重み」)が異なるニューロンどうしが情報を交換している。画像認識用に設計されたニューラルネットを例に取ると,学習訓練中に画像の分類を間違えると,接続の重みが調整される。間違いが一定の閾値を下回ったところで,重みが固定される。

 

これに対し新手法では,それぞれの重みを2つの値に分割し,それらの組み合わせによって,1つのニューロンが別のニューロンをどれほど活性化するかを変える。第1の値は従来システムと同様,学習訓練の後に固定される。だが第2の値は,ネットワーク内の周囲のニューロンの活動に応じて引き続き調整される。重要なことに,このアルゴリズムはそうした重みをどれほど調整可能にするかについても学習する。このため,自身の挙動を学習するのに加え,新たな状況に応じてその振る舞いの各部分をどれだけ変えるかについても学ぶ。この技法は7月にスウェーデンのストックホルムで開かれた会議で発表された。

 

課題と状況に素早く適応

研究チームはこの技法を使い,画像を数回見た後に,その画像の半分を消したものから元の完全な画像を再構築するネットワークを作った。在来のニューラルネットが同様の再構築をするには対照的に,はるかに多くの画像を見て学習しておく必要がある。研究チームはまた,手書きのアルファベット文字(活字と違って一様ではない)の識別法を,1つの例を見ただけで学習するネットワークも作った。

 

また別の課題として,簡単な迷路のなかでキャラクターを動かして宝探しをさせる制御をニューラルネットに実行させた。100万回の試行学習の後,重みづけを半ば調整可能な新ネットワークは固定重みづけのネットワークに比べ,宝物を発見する確率(試行1回あたり)が3倍になった。新ネットワークの場合,重みづけの固定部分は迷路の構造を学習し,可変部分は新たな宝物の位置に適応する仕方を学習したと考えられる。(続く)

 

続きは現在発売中の2019年1月号誌面でどうぞ。

 

サイト内の関連記事を読む