ロボットは東大に入れるか?
そのためにクリアすべきいくつかの課題
1980 年代以降、細分化されてきた人工知能の分野を再統合し、新たな地平を切り拓くことを目的に始まった、人工頭脳プロジェクト「ロボットは東大に入れるか。」 (略称:東ロボ)。国立情報学研究所が中心となって2011 年よりスタートした「東ロボ」では、ベンチマークとして、2016年までに大学入試センター試験で高得点をマークし、2021年には東京大学入試を突破す ることを目標にする。その目的と概要について、サブプロジェクトディレクターを務める宮尾祐介准教授に話を伺った。
田井中 プロジェクトの目的を教えてください。
宮尾 東大入試を突破できる計算機プログラムを開発することにより、「思考するプロセス」を研究しようというものです。問題を読んで答えを導くまでの全プロセス を実現するためには、言語理解をはじめさまざまな人工知能技術を実際につなげて動かさなくてはいけない。また、思考するプロセスというのは人間にとっては あたりまえでも、その計算方法は謎なことがまだまだたくさんあるため、これまでの人工知能研究では手つかずだった課題にも挑戦することになります。
田井中 物理的にロボットをつくる、というわけではないんですね?
宮尾 ええ、つくるのはロボットの頭脳の部分です。実際にロボットが赤門をくぐって試験会場に行き、鉛筆を握って試験問題を解く、というわけではありません。
田井中 どうして大学入試なのですか?
宮尾 ポイントは、人間にとってやさしいことと、コンピュータにとってやさしいことは違うということにあります。暗算はコンピュータのほうがはるかに得意だし、 チェスも将棋もプロを負かすほど強い。IBMの質問応答システム「Watson」※1もクイズの世界チャンピオンになりました。人間にとっては東大合格よ りも将棋のトッププロになるほうがずっと難しいけれど、コンピュータにとっては、東大合格より将棋のほうが簡単なのです。東大入試は、将棋やクイズほど ルールが明確ではないから難しい。知識やデータをいかに利用して答えを導くかという意味で、大学入試には、より人間らしい情報処理の仕方が必要になりま す。かといって、小学校の試験や一般社会ほど常識に依存するわけでもないので、人工知能の研究として次に狙うべきところとしてはほどよい目標と言えるで しょう。
田井中 小学校の問題のほうが難しいと。
宮尾 たとえば、「1日に3台の車をつくる工場があったとして、12台つくるには何日必要ですか?」という文章から、コンピュータは人間のように瞬時に数式を立 てることができません。車や工場といった概念がわからないので、関係性が理解できないのです。それに比べれば積分の計算のほうがずっと簡単です。
田井中 センター試験は選択式で、二次試験は筆記式ですね。
宮尾 当然、センター試験のほうが取り組みやすいし、正誤が明快なので評価もしやすい。二次試験となると文章を生成しなければなりません。コンピュータが出した答えを、いかにして人間にわかるように伝えるのか、プロジェクトの後半ではそちらに研究をシフトさせていく予定です。
田井中 試験科目によって難しさが違うのですか?
宮尾 難しさというよりも、人工知能の研究として取り組むべき課題が違ってきます。知識を問われる社会科の問題は記憶がモノを言うのでコンピュータなら簡単だろ うと思われるかもしれませんが、問題文に書かれていることと、コンピュータがもっている知識が意味的に一致しているのかどうかを判定するのは、実は簡単で はありません。これを可能にするのが、「含意関係認識」※ 2という手法で、成果を上げつつありますが、いまだ非常に難しい課題です。一方、倫理は一般常識を問われる問題が多く、国語的な理解が必要で、常識のない コンピュータにとってはさらに難しい。私自身は、暗記問題は苦手だったので、倫理を選択したんですけどね(笑)
田井中 倫理や国語は常識を問われるから難しいと。
宮尾 常識だけの問題ではないですが、英語もそうですね。たとえば、英語では会話の穴埋め問題があるのですが、それなりに生活経験がないと自然な会話を選ぶこと は難しいでしょう。読解問題では論理的・合理的思考を試されますが、ここでいう論理的・合理的思考というのはどういうことか、実は明らかではありません。 コンピュータにそれを教え込ませるにはどうしたらいいのか。また、科目に限らず、問題文の中に写真やグラフ、漫画が出てくる場合もあります。人間は無意識 のうちに理解しますが、こうしたものをコンピュータに理解させることは非常に難しいのです。
田井中 数式を解くのはやさしいのではないですか?
宮尾 数式だけが与えられていれば数式処理の問題で、コンピュータには得意そうに思えますが、そう簡単でもないそうです。また、問題文自体は自然言語で書かれて いるので、それを数式などの非言語的な世界と接続するのはさらに難しい。同じような難しさは、物理や化学のような数値的な世界、あるいは小説読解のように 感情やシチュエーションなど、どう記号化していいかわからない世界との接続でもあります。だからこそ、小学校の問題は難しいんですね。
田井中 難問が山積みですね。
宮尾 今まで誰も取り組んでいない課題がたくさんあるということ。だからこそチャレンジングで、異なる分野の人たちとの接点もできて、わくわくします。実用面で も、プロジェクトの成果は将来的には、意味に基づく検索や対話システム、実世界ロボットのインタフェースなど、汎用的なシステムに応用されていくことにな るでしょう。「東ロボ」では研究分野が多岐にわたるため、NIIがデータ整理やプラットフォームの構築など環境整備をし、国内外の研究者を巻き込んで目標 を達成したいと思っています。今後はさらにオープンプラットフォームを構築し、一般の人も参画できるしくみをつくっていきますので、我こそはと思う人はぜ ひ挑戦してください。
※1 Watson
IBM が開発した質問応答システム。IBMのグランドチャレンジとして2007 年に研究開発がスタートし、2011 年2 月に米国の有名なクイズ番組「Jeopardy !」で、2 名のクイズ王と対戦し、獲得賞金総額で首位となった。
※2 含意関係認識
二つの表現が違う文の間に、同じ意味が成り立つかどうかを判別すること。
中 央大学法学部法律学科卒。科学技術情報誌『ネイチャーインタフェイス』編集長、文科省 科学技術・学術審議会情報科学技術委員会専門委員などを歴任。本誌デスクのほか、書籍などの編集・執筆を手がける。共著に、『これも数学だった! ?カーナビ・路線図・SNS』(丸善ライブラリー)がある。分野は科学・技術、都市、環境、音楽など。専門家の言葉をわかりやすく伝える翻訳者の役割を追 求している。