日経サイエンス  2023年5月号

AI に人間らしさをもたらした 大規模言語モデル

吉川和輝(日本経済新聞) 協力:今泉允聡(東京大学)

2022年から2023年にかけては,人工知能(AI)に対する人々の見方が大きく変わったエポックとして後世に語り継がれるかもしれない。人間と自然な言葉づかいで「対話」をしたり,「こんな絵を描いて」と言葉で指示するとプロ顔負けのイラストを描いたりするAIが登場。これらに触れた人々が異口同音に驚きの声を上げ始めた。

中でも米新興企業オープンAIが2022年11月末に公開したAIチャットボット,ChatGPTの際立ったパフォーマンスが話題を呼んでいる。一般公開から2カ月後の2023年1月に月間アクティブユーザー数が1億人を突破。交流サイトのTikTokやインスタグラムをしのぐ史上最速の成長を遂げたサービスとなった。

オープンAIに出資する米マイクロソフトは今後数年間で数十億ドルを追加投資すると1月に発表。自社の検索エンジンBingにオープンAIの対話型AI技術を組み込んだ。一連の動きを自社の検索ビジネスへの脅威とみた米グーグルでは,トップが社内に非常事態を宣言したと伝えられた。同社はすぐさま対話型AIサービスのBardを発表,ChatGPTを迎え撃つ体制を整えようとしている。

ChatGPTの登場で隅に押しやられたが,少し前までは画像生成AIの話題が花盛りだった。「アボカドの形をした肘掛け椅子」と入力すると,まさにそんな感じの椅子の絵を描くAI,DALL-EをオープンAIが2021年にリリースし,2022年にはこの分野で多数のサービスがブレークした。4月にDALL-E後継のDALL-E 2を,5月にグーグルがImagenを発表し,その後も米新興企業のMidjourney,英新興企業スタビリティーAIのStable Diffusionと,毎月のように画像生成AIの新顔が登場した。

このうちStable Diffusionは,AIの学習済みモデルを公開するなどオープンソース化に踏み切った。用意されたAPI(ソフトウエア同士やソフトウエアとOSを接続する仕組み)を使って日本でも,画像生成が楽しめるアプリやウェブサービスが提供されている。MidjourneyやDALL-E 2もデザイナーやアーティストが普通に仕事に使い始めている。

画像生成AIや,ChatGPTのように言葉を生み出すAIのことを「生成系AI」と呼ぶ。突然登場したように見えるかもしれないが,2010年代に入ってから急速に進展してきた深層学習(ディープラーニング)の延長上にある。AI技術の系譜を振り返ってみよう。

再録:別冊日経サイエンス263『生成AIの科学 「人間らしさ」の正体に迫る』

著者

吉川和輝(よしかわ・かずき) / 今泉允聡(いまいずみ・まさあき)

日本経済新聞社編集委員。1982年入社,産業部,ソウル支局などを経て科学技術部記者に。米マサチューセッツ工科大学で科学ジャーナリズムを学んだ。2012~2015年に日経サイエンスの発行人を務めた。現在はエマージングテクノロジー,物理学などのテーマで執筆している。

東京大学総合文化研究科先進科学研究機構准教授。統計数理研究所統計的機械学習研究センター客員准教授,理化学研究所革新知能統合研究センター客員研究員を兼任。専門は数理統計学および統計的学習理論で,複雑データの解析手法や深層学習の理論解析を手掛けている。

サイト内の関連記事を読む

キーワードをGoogleで検索する

生成AI大規模言語モデル基盤モデル深層学習トランスフォーマー注意機構Attention is All You NeedRNNLSTMCharGPTStable DiffusionMidjourneyホップフィールド・ネットワークGenSLM