横浜国立大学大学院 先進実践学環

永井圭二 先生編(専門:統計学/研究テーマ群:社会データサイエンス)

今回のインタビューは統計学がご専門の永井圭二先生にお伺いします。

Q. 永井圭二先生のご専門は、統計学とのことですが、統計学とはどのような研究分野でしょうか。

永井 世の中に様々な種類のイベントが生じて、そこからデータが得られます。そのデータはすべてインターネットなどを通して様々な人に利用されますが、データに隠されている出来事の真実は何なのかを探る学問、それが統計学です。
 今、ビッグデータの時代と言われていますが、日々膨大なデータが更新されていく状況で、それをすぐさまできるかぎり早く分析し、次の意思決定に結びつける、そんなことに今は興味を持っています。

Q. 統計学との出合いは何ですか。

永井 もともと大学ではファイナンスを学び、卒業後、証券会社に入りました。そんな最中、1987年のブラックマンデー(:NY株式市場における史上最大の株価大暴落)を経験して、最初はファイナンスの研究を続けるつもりで大学院に戻ったのですが、ファイナンスをやっていてあまりハッピーな感じはしなかったんですね。新しい数理的手法が使われるようになり、オプションやワラント債といった派生証券の価格理論を研究していたのですが、それが本当に世の中の人の役に立っているのかと疑問を持つようになりました。同じような数学を使用した統計学のほうが、むしろ世の中のためになるのではないかと感じて、大学院の途中で統計学に専攻を変えました。

Q. 統計学のどこに面白さを感じたのでしょうか。

永井 統計学はある意味奥の深い分野で、統計学で一般的に使用されている手法がなぜ役に立っているのかというのは、実は証明しづらいんです。理論上も表面的には分かるし、みんなが使用している。にもかかわらず、深く突っ込んで、他の優れた方法がないのかと探っていくと、実は今やっている方法がある種の意味で最もよいということが示せたりするわけです。
さらに統計学が難しいのは、理論が非常に多岐にわたっていて、物理や化学などのサイエンスと比べると、軸がたくさんありすぎるんですね。ただ、世の中には様々なデータが存在していて、様々な応用の仕方があり、実際に世の中の役立っているのは事実で、統計学がデータサイエンスの中心的役割を果たしていますから、この分野はやりがいがあると感じています。

Q. 今、データサイエンスは世の中で必須の分野になっていますね。

永井 ただ、かつて統計学は、実は数学の分野の中でランクが一番下だったんですね。なぜかというと、言ってみれば“ごった煮”で、それぞれおいしいんだけど、ごちゃごちゃしていて分かりづらい、すっきりしない理論が多いんです。
もちろん、最初に統計学の手法を思いついた人は大変偉いです。ただ、その後それを様々な人が現実に合うように、細かく、面倒な作業をしてよりモデルを精密化させていくのですが、数学的には美しくないと捉えられていました。統計学は現実と結びついているので、数学者の本質からは離れるんですね。数学者は物事を抽象化し、一人孤独に考えるのが好きなんですが、統計学者は逆で、常に世の中の現象に合わせて細かい作業を行っていきます。その部分が数学としてのレベルは少し低いと見なされていたのではないかと思います。
 ただ、統計学にも数学的な核の部分はあり、その部分を発展させるのはとても大変です。私はその分野に自分の身を置きたいと思っているので、統計学を数学的によりみんなに使いやすくするような形で手法を一般化したいと考えています。

Q. 最新のご研究、「Sequential test for a unit root in monitoring a p-th order autoregressive process」についてご紹介いただけますか

永井 金融データを想定しています。金融データにおいて最も重要なのは、安定した定常過程であるのか、それともバブルのような爆発的な、急激な変化が生じている不安定な確率過程になっているのかを知ることです。
日々、株式市場の日経平均やTOPIXのデータが時系列で入ってきます。データはたいてい、過去の自分のデータに依存しています。p次の自己回帰過程というのは、過去のp期間にわたって依存関係のあるようなデータがあって、そこに不安定さがあるのかないのかを調べるためのモデルです。何か大きいショックがあった場合、過去のデータはもう性質が変わってしまって使えませんよね。新しく始まったデータがまだ不安定な状況なのか、それとも安定した状況に入っているのかを調べなければ、変化後に対応できません。
 重要な点は、意思決定をできるかぎり早く行いたいということです。要するにデータがオンラインで入ってくるときに、時刻を、人間ではなくデータに決めさせるんですね。AIを使って、逐次的に入ってくるデータが「もう十分情報がそろった」と教えてくれて、その時点で意思決定をするという手法がオンラインデータに対しての逐次的統計解析の手法です。

Q. あらゆる分野に応用できますね。

永井 社会的ニーズは非常に高い状況です。例えばCOVID-19に関していえば、感染拡大から3年経った2023年1月、中国がゼロコロナ政策を突然緩和させました。そうすると、人々の生活行動はまったく変わり、コロナの拡散・収束状況も大きく変わります。一次感染者が二次感染者を生み出す数の平均を基本再生産数といいますが、このような中国での状況下にあっても基本再生産数がどのような状態あるのかチェックする手法も、まさにこのオンラインデータに対しての逐次的統計解析の手法です。
緊急地震速報なども同様ですね。たまに誤報が出るときもありますが、間違いが生じるかどうかは精度の問題です。精度を十分確保しつつ、一定の精度を満たした段階ですぐさま意思決定を行う。これがまさにデータサイエンスです。

Q. 先生の研究室に所属している学生は、どのような内容を研究していますか

永井 学部は1学年10名ほど、修士課程が10名、博士課程は今年2名で、博士の学生のうち1人は金融時系列、もう1人は感染症に関しての研究をしています。

最近、新たにご自身の研究と結び付けて考えたら面白そうだなと思った分野は何ですか?

永井 毎日何かと結びつけて考えているので(笑)。情報は常にインプットはしていて、その場ではインプットの波の中で完全な検証をしないまま無意識に埋もれているのですが、ふとした瞬間に研究に結びつくことは頻繁に起こります。
統計学も含めて、科学者の多くは他の人の追随なんですね。それが手っ取り早いですから。新しい、誰も考えたことがない手法を発見するには相当な時間をかけなければなりません。世の中のヒット商品も、日々何かを発想し続ける中で生まれています。私も、研究の分野でそうした新たな発見に挑戦していくべきだと考えています。

趣味は何でしょうか?

永井 学生時代は本を読むことが好きで、小説家になりたいと思っていた時期もあります。ただ、本を読むこともだいぶ前にやめてしまいました。今は研究のほうが面白いからですね。
 趣味はマリンスポーツで、今、本学のヨット部とウィンドサーフィン部の顧問も務めています。もともとウィンドサーフィンを趣味でやっていたのですが、今はウィングフォイルにはまっています。海の上をウイング(翼)で飛び回るんですね。風の力で海上1メートルぐらい浮き上がるので、水の抵抗を受けることなく、本当に飛んでいる気分になります。

マリンスポーツとデータサイエンスの世界を結びつけることは可能でしょうか?

永井 スキーや山登りもそうですが、自然を相手とするスポーツは道具が重要ですよね。データサイエンスもAIやコンピュータという道具を使います。道具さえうまく使えればさほど苦労や消耗することもなく、道具と人間が一体化して従来では得られなかったような経験ができます。また、データの世界でビッグデータがどんどん押し寄せて状況が目まぐるしく変化するのと同様に、自然と対峙するマリンスポーツでも、風や潮目は時々刻々と変わっていきます。
ただ、不思議なもので、人の体はその変化に自然と反応するようになるんですね。マリンスポーツでも、最初は海に落ちたり、道具を扱えなくて無駄な体力を使ったりしてばかりなのですが、そのうち慣れてきて体が自然の状態に反応して無意識に対応できるようになる。人の脳には、意図的にやろうとする部分と、無意識のうちに反応する部分とがあって、道具を通じて操作していくうちに、人が道具と一体化して自然の様々な情報を処理できるようになるんです。データの世界とはすこし異なる点かもしれませんが、AIが身の回りにあって、人間の意思決定はそれと一体化して物事をてきぱきと対処してゆくようになるのではないかと思います。

では、シンギュラリティ(AIが人類の知能を超える時点)はやってくるでしょうか。

永井 おそらく来ないでしょう。残念ながらAIの得意なことはルールが決まっていることに限られます。ルールの決まっているチェスや囲碁の世界では、とっくに人間はコンピュータに負けていますが、ルールが確定していないことに対しては、やはり人間が入り込まなければならないと思います。
人間の活動は複雑すぎ、ルールそのものも無限にあります。統計学や数学の様々な定理を全部理解したとしても、新しい画期的な発見をAIができるとは思いません。だからこそ人間がデータサイエンスの世界を研究することに大きな意義があるとも言えるでしょう。

学環では、「Society5.0」を支える人材の創出を目指しています。

永井 統計学やデータサイエンスは、Sociery5.0のまさに根幹となる分野であり、先進実践学環ではこの分野での教育において成果をあげなければなりません。政府も2026年までに230万人のデジタル人材の育成を目標に掲げていますので、本学もその一部を担い、責任を果たさなければなりません。
私の担当している「数理統計学」では統計学の基礎を学び、「数理統計学特論」では、統計学のより上級の理論を学び、先ほどご紹介した研究の内容にも少し触れています。データサイエンスの教員も増えましたので、みんなで協力して学生の育成にあたっています。

文理融合の意義はどこにあるでしょうか?

永井 文系、社会科学系の修士号、博士号は、現状、理系分野に比べて社会における評価がやや低い傾向があります。先進実践学環は文理融合型教育をおこなっています。特にデータサイエンスの分野を重点的に身につけますから、理系の要素も持っているということで、価値を認めてもらいやすくなると思います。
本学の国際社会科学府の経済学、経営学、国際法学の各専攻でもデータサイエンティストの育成に向けて取り組みを進めていますが、例えば経済学専攻であれば経済学のためのデータサイエンスで、政府の政策や税制、財政、金融といった経済の分野に特化した研究になりがちですが、先進実践学環であれば、あらゆる分野の研究に活用できます。実際に学環の学生の研究分野は、非常に多岐にわたっています。

学環の学生は、どのような分野を研究していますか?

永井 学環の社会データサイエンスにおける研究は、経済や経営や法律といった社会科学系から、医療、疫学、公衆衛生、人口、教育、心理学など、ありとあらゆる分野を含んでいます。人間の行動によって状況が変化することを想定する分野において、使用するデータサイエンスの分析手法は共通の部分が多いと思います。社会データサイエンスは物理学や化学のような自然を対象とするサイエンスではありません。自分が興味のある社会的現象や社会で経験してきたこととうまく融合させて研究することが可能です。

学環ではどのような学生を期待しますか?

永井  幅広く学べるのが学環の優れている点ですが、だからこそ進んでいくレールがありすぎる状態とも言えます。関わっていく方向を自分自身でしっかり意識して決めなければ、結局やったことが将来の役に立たないということになりかねません。研ぎ澄まされた感性で、「次の一歩としてこれをやるんだ」ということを常に考え、主体的意思決定できる、そうした心構えのある人を期待しますね。
 ただ、重要なのはやはり基礎なんですね。100本の論文を読むよりも、1~2冊の基礎的な理論書を読むほうが重要です。時代の流行と、サイエンスの基礎として根づいたものをきちんと区別し、主体性をもって取り組み続けられる学生を期待します。

永井 圭二

横浜国立大学大学院国際社会科学研究院 国際社会科学部門 教授。統計学の研究に従事。先進実践学環での担当科目:数理統計学および数理統計学特論。