中高生が学ぶ サイエンス講義

日立システムズが特別講義 〜豊島岡女子学園高校生、データ分析を学ぶ

データ分析に基づく企業の科学的な思考と行動がますます重要になっている。日立システムズは2022年12月、豊島岡女子学園中学校・高等学校で「データサイエンス実践入門−統計的データ分析の実践に向けて−」と題した特別講義を高校生向けに行った。

登壇したのは同社チーフ・データサイエンス・エキスパートの板井光輝氏。「データサイエンティストとは、数学に基づくデータ分析・技術活用により業務課題を解決する職業。重要なのは『数学に基づく』というところ」と話し始めた。

データサイエンティストのポジションは解決困難な顧客課題の本質的な解決を担うものであり、現状では実力のあるデータサイエンティストが不足し、争奪戦になっていると指摘する。必要とされるのは数学の知識だけではなく、人文社会的な知識も幅広くないといけない。いわば「データサイエンスは学問の総合格闘技」と板井氏は語る。

データの理解・整形が成否を分ける
データサイエンティストの仕事は主に4つある。「分析課題の設定」「データの理解・分析、数理モデルの構築」「AI(人工知能)システムの開発」「AIシステムの運用・保守」で、AIシステムの構築については機械学習プログラミング技術を駆使したユーザー指向のものが求められるという。そしてデータ分析の標準プロセスについて、「課題検討」「データ理解とデータ整形」「数理分析」「結果検証」「成否判断」の5つからなると説明する。課題検討を軽んじると後工程のすべてがブレることになるほか、「データ分析の成否要因はデータの理解・整形にあり、全工数の7〜8割を費やすこともある」と板井氏は語る。

講義は続いて、「データ理解」の鍵となるヒストグラム(度数分布図)と基本統計量の扱い方へと移る。生徒は4人1組となり、表計算ソフト「エクセル」のデータを使って演習の基礎を学んだ。ヒストグラムは横軸の間隔の取り方で情報の価値が決まることを知り、基本統計量についても標本平均や標準偏差に関する理解を深めた。

「理論の前提を満たすように外れ値処理、分布の歪み補正などのデータ整形を…」と解説する板井氏の難しい言葉を聞き漏らさないようにと生徒たちは耳を傾ける。その眼差しは真剣そのもので、思わず「1割理解できたらいいです。あとでネット検索などして勉強してみてください」と助け舟を出すように話しかける場面もあった。

レジャー企業Y社の演習問題
講義の後半では「レジャー施設運営企業Y社の課題解決」という演習に取り組んだ。課題は「Y社顧客データを分析し、顧客満足率の向上につながると考えられる有効情報の抽出とその統計的根拠を挙げること」など。レジャー施設が抱える課題を解決する方策について、エクセルを用いたデータ分析に基づき検討・提案するという内容だ。

あるグループは「常設メニューに子ども向けメニューを増やすことで長期的な売り上げ増が見込める」など複数の詳細な内容を提案。板井氏から「よく短時間で資料を読み込みました。働きやすいようにするなどの提案も含まれ、すばらしい」と高く評価された。
 同グループの生徒は「どういう理由でどの条件に絞ったか、文章化してチーム内で食い違いが起きないようにした」と話し、言語化することでメンバー間の情報共有を実践したという。■

 

※所属・肩書きは掲載当時
サイエンス講義についてのお問い合わせは,[email protected] までどうぞ。

協力:日経サイエンス 日本経済新聞社