ロボットは東大に入れるか。Todai Robot Project

日本語|English

センター試験XMLデータ

「ロボットは東大に入れるか」プロジェクトで開発した大学入試センター試験1990年度~2017年度の電子化問題データを公開します。 このデータは、本プロジェクトにおいて、川添愛氏を中心としてXMLによる構造化仕様を策定し、アノテーションを実施したものです。 元データの著作権者である独立行政法人大学入試センターのご厚意により、人工知能などに関する研究のための資源として一般に公開します。
 

データについて

  • データに含まれる科目は以下の通りです: 数学I・数学A、数学II・数学B、英語(筆記およびリスニング)、 物理、化学、地学、生物、 世界史、世界史A、世界史B、日本史、日本史A、日本史B、 地理、地理A、地理B、現代社会、倫理、政治経済
  • 以下のものはデータに含まれません
    • 国語問題データ
    • 英語リスニングの音声データ
    • 以下の科目の画像データ: 世界史、世界史A、世界史B、日本史、日本史A、日本史B、 地理、地理A、地理B、現代社会、倫理、政治経済
  • 上記以外にも、全ての年度のデータが含まれない科目があります。
  • 試験問題データの想定される使い方
    • 開発用データ(development data) ... システムの開発・チューニングに使ってください
    • 開発テスト用データ(development test data) ... 開発段階での性能測定およびエラー分析などに使ってください
    • 最終テスト用データ(final test data) ... システムの性能評価のみに使用し、チューニングやデータ分析には使用しないでください
  • データに関する問い合わせ先:torobo-data-inquiry アッとマーク googlegroups.com