データサイエンス百景

未来の解像度を上げるデータサイエンス系大学進学情報サイト

【明星大学】複数の“変数”を用いて目の前の現象を「見える化」する 【明星大学】複数の“変数”を用いて目の前の現象を「見える化」する

【明星大学】複数の“変数”を用いて目の前の現象を「見える化」する

明星大学データサイエンス学環

中川 智之 准教授
中川 智之 准教授
NAKAGAWA Tomoyuki
明星大学
データサイエンス学環
専門:数理統計学

話題のデータサイエンス系学部では、どのような学びが展開されている? 今回は、明星大学データサイエンス学環をクローズアップ! 「数理統計学」を専門とする中川智之准教授は、複数の要素で相関を見る多変量統計解析の手法を用いて、「コンビニと犯罪件数の関係」、「クジラとオキアミの関係」など、さまざまな現象の「見える化」に挑んでいる。中川准教授が目指す文理融合のデータサイエンスとは?

データの「偽相関」に騙されてはいけない!

コンビニの数が増えると犯罪件数が増える——。これは、都道府県別における実際のデータを基にした推論である。言われてみるとそんな傾向もありそうだが、これを鵜呑みにしてはいけない。

「これは偽相関の典型的な例ですね。確かに、コンビニの数と犯罪件数は都道府県のデータにおいて『正』の相関を表します。しかし、ここには『人口』という別の変数も介在するのです。つまり、3変数で現象を理解する必要があるのです。こうした複数の変数を同時に観察し、分析する統計手法が、私の専門である多変量統計解析になります」

2変数のままの散布図(青)
「人口10万人あたり」に調整した散布図(赤)

2022年のコンビニの数と犯罪件数を解析したデータ。2変数のままの散布図(青)では「正」の相関を示すが、「人口10万人あたり」に調整した散布図(赤)では結果がバラついてくるのがわかる

そう語るのは、明星大学データサイエンス学環の中川智之准教授だ。専門は数理統計学。特に、多変量統計解析で用いる新たな手法を研究している。多変量統計解析とは、複数の変数間の関係性をモデル化する学問だ。例えば、英語、国語、数学、理科、社会の5教科における点数の関係性を可視化するときなどに用いる。

多変量統計解析で用いる新たな手法を研究

「ポイントは目の前の現象を抽象化して、さらにそれを具体化することです。5教科の例でいうと各科目のスコアから見えるその学生の資質が目の前の現象で、これを多変量統計解析でモデル化(見える化)するのが『抽象化』のプロセスになります。5教科の点数をその数式に入力すれば、各教科の関係性や得意科目のパターンが見える化されるわけです。そして、ここで得た数値などを図表など見やすい形に出力するのが『具体化』の作業になります。データサイエンスでは、この抽象化と具体化を往き来するスキルが求められます」

多変量統計解析でクジラとオキアミの観測データをより使いやすくする

中川准教授が、最近、多変量統計解析を用いて取り組んでいるのが、海におけるクジラとオキアミの関係の分析だ。オキアミはクジラのエサとなる小型のエビ。オキアミの大群がいる場所にクジラも出現する確率が高い。クジラの生息地を単純に観測して、データ化すると「オキアミが大量発生する場所にクジラが生息している」という推論が導き出される。しかし、そこには、「海面温度」や「水深」といった変数も関係してくる。そこで、中川准教授は、提供された観測データをもとに、「クジラの数」「オキアミの数」「海面温度」「水深」という4つの変数で多変量統計解析を用いて、クジラの生息地を予測するための推論の精度を高めた。

多変量統計解析とは?

「多変量統計解析は、さまざまな場所で活用されています。例えば、AI(人工知能)画像認識LLM(大規模言語モデル)などの基盤技術にも多変量統計解析の考え方が使われています。私の感覚では、データサイエンスは統計学と計算機科学の融合で、何百万、何千万という変数を(統計的に)適切に扱う計算手法が進化したものだと考えています」

大学の授業でも「多変量解析」を担当

中川准教授は現在、所属する明星大学データサイエンス学環で「多変量解析」の授業を担当している。ここでは多変量データの正しい解析方法を習得し、得られた結果を適切に解釈できることを目指している。授業では、判別分析や主成分分析、クラスター分析、数量化分析など、データ分析を行う上で欠かせない分析手法を学ぶことができる。

「この授業の大きな特徴は、統計学の理論だけでなく、実際のデータを使った実践的な多変量解析手法を学べることです。R言語(プログラミング言語の一種)を用いたデータ解析を行い、手を動かしながら、多変量解析手法を理解していきます。難しく考えずに、まずはやってみることを推奨しています」

数学の問題を論理的に考える時間が好きだった

中学時代から数学が好きだったという中川准教授は、とにかく数学の問題を論理的に考える時間が好きだった。解答が出ると多くの人はうれしい気持ちになるが、中川准教授は違った。「楽しい時間が終わる……」と悲しい気持ちになったという。
それほど数学が好きだっただけに、大学は国立大学の理学部数学科に進学。ここで現在の専門である数理統計学と出合い、大学院の博士課程まで進み、研究者の道を歩むことになる。

「大学院時代は、『判別分析』の研究をしていました。これは、与えられたデータの観測値がどのグループに属するかを判別するための統計的手法です。線形判別分析などのさまざまな手法があり、現在の機械学習でデータを自動判別する際の手法としても応用されています」

中川准教授にとって、データサイエンスとは統計学を用いてさまざまな事象を「見える化」する手法のこと。目の前の曖昧模糊とした事象を数式でモデル化し、その妥当性を確認できたときは、大きなやりがいを感じるという。また、データサイエンスの意義は、現象をモデル化し、データを用いて検証した成果をエビデンスとして、客観的に他者を説得できる点にある。将来企業や行政機関に勤めれば、上司や取引先などの意思決定者の判断を得るためにデータサイエンスの手法は不可欠だ。このように社会のあらゆる分野の意思決定で役立つ点もデータサイエンスの面白さだといえる。

図版:データサイエンスとは?

生成AIを使いこなすヒントが数理統計学にある

中川准教授の研究者としての目標は、数理統計学における計算手法の妥当性を高める研究をさらに進めること。さらに、大学で後進の指導にもますます力を入れていくつもりだという。目の前の課題は、統計学の手法を専門家以外の人にわかりやすく伝えること。中川准教授の視点では、データサイエンスは、文系の学生がもっともっと目指すべき分野だという。

「イメージとして大きな間違いなのは、統計学が数学の一分野だと思われていることです。統計学は本来、経済学部や社会学部でも学ぶもので、文系・理系問わず、どのような学問でも使うツールなのです。例えば、高校の地理の教科書には輸出入量のグラフなどが載っていますよね? あれも統計、つまりデータサイエンスなんです。データサイエンスは、マーケティングや心理学、スポーツ解析など幅広い分野で活用されています。今後は誰もが必須で学ぶものになるのではないでしょうか」

データサイエンスは、文系の学生がもっともっと目指すべき分野

生成AIが登場し、データサイエンスは、身近なものになりつつある。複雑なプログラミング言語を覚えなくても自然言語で、AIに命令ができる時代が到来している。そんな現代において、複雑な数理統計学を学ぶ必要はあるのだろうか。最後に中川准教授にそんな質問をぶつけてみた。

「数理統計学を学ぶことで、生成AIの中で何が行われているかを理解することができます。この点において、数理統計学を学ぶ意義はかなり大きいと思います。よく言われることですが、使われるのではなく、生成AIを使いこなす人間になるべきです。そのヒントを提示してくれる入口になるのが、数理統計学だと思っています」

【プロフィール】

中川智之
明星大学データサイエンス学環 准教授

2013年 広島大学理学部数学科卒業。2015年 同大学院理学研究科数学専攻博士課程前期修了。2018年 同博士課程後期修了。博士(理学)。東京理科大学 理工学部情報科学科 講師を経て、2023年より現職。2024年より国立研究開発法人理化学研究所 脳神経科学研究センター 統合計算脳科学連携部門統計数理連携ユニット 客員研究員を兼任。専門は数理統計学、多変量統計解析。
詳細はこちら
中川 智之 准教授

明星大学 中川智之研究室

Text by 丸茂健一(minimal)/Illustration by 竹田匡志

UNIVERSITY INFO

明星大学データサイエンス学環
MEISEI UNIVERSITY
School of Data Science (Interfaculty Program)
情報学、理工学、経済学を環状につなぐ新たなデータサイエンス!
明星大学データサイエンス学環
情報学、理工学、経済学を環状につなぐ新たなデータサイエンス!

データサイエンスをより実践的に学べる環境を!

「データサイエンス学環」では、情報学部、理工学部、経済学部の学びを環状につなぐことにより、データサイエンスについてより深く、より実践的に学ぶことができる。データサイエンス力、データエンジニアリング力、ビジネス力の基本的な能力を磨き、社会の諸問題における課題発見から課題解決に至る過程でのデータ活用を実践することができる。

カテゴリ

私立大学

学部・学科

【データサイエンスを学べる学部】
■データサイエンス学環
【その他の学部】
■情報学部 ■理工学部 ■経済学部 ■建築学部 ■人文学部
■教育学部 ■経営学部 ■心理学部 ■デザイン学部

所在地・アクセス

<日野キャンパス>
〒191-8506 東京都日野市程久保2-1-1
多摩モノレール「中央大学・明星大学駅」直結
京王線「多摩動物公園駅」から徒歩8分

問い合わせ先

TEL:042-591-5793(アドミッションセンター)

詳しくはこちら

こちらの記事もチェック

TOP