【第1回】 AIで「感性」は数値化できるか?オノマトペ研究の第一人者、坂本真樹教授が外語大から理系転身、感性AIの道を選んだ理由

坂本真樹

1969年生まれ。東京大学大学院にて博士号を取得。2000年より電気通信大学に着任し、現在は同大学副学長・大学院情報理工学研究科教授を務める。

言語学・認知科学・情報科学を横断し、オノマトペをはじめとする人間の感性をAIで扱う研究を行っている。

活動は学術分野にとどまらず、メディア出演や著書の執筆、研究成果を社会実装するため感性AI株式会社を創業し取締役COOを務めるほか、ソフトバンク株式会社の社外取締役として経営にも携わっている。

人はなぜ話すのか?その答えを求めて東京外語大へ

ーー東京外語大学での学部生時代はどんな分野に興味がありましたか?

そもそも外語大に入ったのは、人間が言語を話す能力がすごく不思議だと思ったからです。高校の頃は医者を目指していて、数学が得意だったこともあり理系に進むつもりでした。

しかし、人が言語を獲得する仕組みに強く惹かれ、脳神経の分野も考えましたが、論文を読んでみると到達するまでに相当な道のりがあると感じました。

そんな折に教員から「言語に興味があるなら言語学が合うのでは」と勧められたのがきっかけです。
英語が好きで海外にも行きたかったこと、さらにドイツ車が好きだったこともあり、ドイツ語学科を選びました。

東大大学院で出会った人工生命と言葉の境界線

在学中は時間があればドイツに留学していました。ただ、根本的には「人間はどうして言語を話せるのか」を知りたかったので、単にドイツ語を学ぶだけではそこに近づけない感覚がありました。

大学3年の頃、就職活動で外資系企業から内定をもらったものの、東京大学に新設された「言語情報科学」専攻の説明会で自分の関心がぴったり合うと知り、進学を決めました。

その専攻は自然言語処理など情報系の教員もおり、駒場という環境の中で理系と文系が混ざる刺激的な場でした。

物理の複雑系のゼミに参加して、人工生命の考え方や、コンピュータ上で記号同士がやり取りする中で文法が生まれることを考えるのが面白かったんです。

人間は上下の概念があるから「気持ちが上がる/落ち込む」みたいな言葉があるけれど、上下がなかったらどうなるんだろう、みたいな発想ですね。

その後、東大で助手を務め、任期終了後に電気通信大学の職に着任しました。

「おはよう」すら言えなかった私がドイツで得た自分

ーー学部時代の留学経験について詳しく教えて下さい。

留学先は基本的に南ドイツに行っていました。

ドイツ政府奨学金を得て、ゲーテ・インスティテュートで学んだりして、そのときの価値観や周りの人との関わりが、その後の人生観にすごく影響しました。

日本にいたころの私は引っ込み思案で、人前で「おはよう」と言うのもためらうほどでした。しかし海外では「人にどう思われるか」ではなく「自分がどう思うか」を言うことが大事だと分かり、それが非常に楽で居心地が良かったです。

現地でそのまま働くことも考えましたが、条件面で日本での就職を選び帰国しました。それでも、海外で得た「自由に発言していい」という感覚は大きな転換点でした。

さまざまな国の人々と交流して、私自身の潔癖気質や人目を気にする性格もかなり変わりました。海外での暮らしでは、以前は気にしていた汚れや不便にも慣れ、どこでも生きていけるたくましさが身についたと思います。

転勤族と引っ込み思案

ーー元々引っ込み思案だったということですが、何かキッカケはありましたか?

私は小さい頃に転校することが多く、幼稚園2園、小学校3校、中学校2校と移り変わりました。父が裁判官で3年ごとに転勤していたためです。

特に地方ではいじめられることが多く、東京の原宿から北海道に行ったときはギャップも大きく、特に強くいじめられました。

東京→地方→東京→地方のように動いていたので、基本は標準語だったのですが、山形県酒田市や北海道室蘭市では方言になかなか馴染めず、うまく溶け込めませんでした。

「あんた訛ってるね」などと言われても、本当は「いや、訛ってるのはそっちでしょ」と言いたくても言えなくて、言葉も出てこなくて、自信が持てない感じでした。

違和感ある人こそ海外へ出ていい

だからこそ、学生さんにも留学をすすめたいと思うんです。日本で居心地が悪いと感じている人ほど、海外に出てみるといいと思います。

「マスクを外せない」「人の目が気になる」と感じる人ほど海外は合うかもしれません。日本とは価値観がだいぶ違いますから。

もちろん合わない人は戻ってくれば良いだけで、自分にとって居心地のいい場所を選べば良い、という考えです。

2012年、ディープラーニングの衝撃

ーー人工知能研究が黎明期の90年代やゼロ年代は、先生にとってどんな時代でしたか?

当時、AIについて特段の関心があったわけではありませんでした。

「言語研究に必要な道具」として使っていただけで、当時のAIは「知識を入れれば入れるほど賢くなる」という程度の段階でした。AIの限界についても認識しており、過度な期待は抱いていませんでした。

ただ、1996年頃からWeb検索が広まり、インターネット上のデータを活用する流れが生じて以降は、さらなるブレークスルーがきっと来るという期待感はありました。

知識の詰め込みから自ら学ぶAIへ

決定的だったのは2012年のディープラーニングです。それ以前は猫と犬すら区別できず、特徴量も人間が手動で設定していました。

その状態から一変し、大量のデータからAI自身が特徴を学べるようになり、人間の学習プロセスに近づいたと感じました。

人間はたくさんのオノマトペを聞いて育つため、未知のオノマトペであったとしても意味を推測できます。AIもデータさえあれば同様の学習を行うことができる時代になったのです。

現在では大規模言語モデル(LLM)をベースに、用途に応じてファインチューニングするのが主流です。

ゼロからLLMを作るのではなく、既存モデルを活用する形が一般的になっています。そうした時代の流れの中で、現代の研究スタイルがあります。

人間を知るためのツールが社会に求められる技術へ

ーー人工知能に注目されたきっかけは何ですか?

実は、私は「人工知能をやりたい」と思って研究を始めたわけではありませんでした。興味の中心はあくまで“人間の言語”で、その仕組みを分析するツールとしてコンピュータを使っていました。

当初は、実験したデータを統計的に処理する程度だったのですが、統計処理によって全てが数値化されると、企業から依頼されたソフトウェア開発にも応用できるようになりました。

それが企業にも大学にも非常に喜ばれて、目に見える“かたち”になったことで反響が大きかったんです。

気づいたら特許20件以上のAI研究者に

扱っていたのは、オノマトペのような曖昧で文系的な対象に、情報系の手法を組み合わせる研究です。文理の技術が交差することで新しい方法論が生まれ、それを評価していただき特許出願もするようになりました。

気づけば特許は20件以上になっています。特許になると大学内でも重宝されますし、システムを作れば企業でも実際に使ってもらえます。

そういった研究を続けるうちに、「言語をコンピュータで扱う」「オノマトペを理解する」「生成する」といった、今で言う生成AIに近いことを自然とやるようになりました。

そして、人工知能学会に論文を投稿するようになり、2014年には人工知能学会論文賞を受賞しました。それでようやく「私はAI研究者なんだ」と自覚しました。

「ふわふわ」と「もふもふ」の違いを数値化するシステム

ーー受賞された論文の内容を教えてください。

オノマトペを数値化する研究で、正式には「オノマトペの微細な意味を数値化するシステム」です。

学生と一緒に取り組んだもので、オノマトペの印象を特徴量として分解し、回帰モデルで予測できるようにしました。一般の人も使えるようにしたのが特徴で、これも特許を取得しています。

「ふわふわ」「モフモフ」だけでなく、「ガシガシ」「ギュルギュル」「くしゃくしゃ」など変わった表現でも数値化でき、人間の印象と高い相関が得られました。人間は初めて聞く言葉でも意味を推測できますが、その感覚をモデル化したものです。

オノマトペ生成の研究も人工知能学会論文誌に掲載されていて、研究室のHPに論文リストがありますので関心があればぜひ読んでみてください!

>>>オノマトペから感じる印象の客観的数値化方法の提案

>>>坂本真樹研究室のホームページ

[ 取材:相木大空 / 編集:吉中智哉]

投稿者プロフィール

探究ゼミ編集部
探究ゼミ編集部
探究ゼミでは、これから社会に出る人、出て間もない人向けにキャリアに関する情報を発信しております。仕事を通して人や社会と関わることを応援するメディアです。

一緒に活動するメンバー、取材を受けていただける方も随時募集しております。お問合せページよりご連絡下さい。
この記事をシェア