ChatGPTが大学入学共通テストで9科目満点を獲得、AI技術の進化を実証

2026年1月20日、AIベンチャーの株式会社LifePromptは、大学入学共通テストを最新の生成AI3モデルに解答させた検証結果を公開しました。その結果は、AI技術の急速な進化を強く示すものとなりました。OpenAIの「ChatGPT GPT-5.2 Thinking」が、15科目中9科目で満点を獲得し、他のAIモデルを大きく上回る成績を記録したのです。

圧倒的な成績で他のAIに大差をつけるChatGPT

今回の検証実験では、ChatGPTの他に、Googleの「Gemini」とAnthropicの「Claude」という2つの主要なLLM(大規模言語モデル)も参加しました。ChatGPT GPT-5.2 Thinkingが記録した成績は、実に得点率97%という「超越的知能」を実証するものとなっています。

具体的には、ChatGPTは以下の9科目で満点を獲得しました:

  • 数学I・A
  • 数学II・B・C
  • 公共・政治・経済
  • 化学
  • 物理基礎
  • 化学基礎
  • 地学基礎
  • 生物基礎
  • 情報I

実際の受験生の選択科目に合わせた総合結果では、文系970点、理系968点(いずれも1000点満点)を獲得。一方、GeminiとClaudeは900点台前半で激しく競い合うという結果になりました。

数学の図形問題で新たな戦略を展開

特に注目すべき点は、数学I・Aでの満点獲得です。昨年までの検証では、図形問題への対応力が弱点とされていました。しかし、今年のChatGPTは図形を「絵」ではなく「座標データ」として脳内で再構築して処理することで満点を獲得しました。この戦略的なアプローチは、AI技術が単なる計算能力に留まらず、問題解決の方法論を進化させていることを示しています。

検証の実施方法と配慮された工夫

検証は、専用システムを通じて問題PDFを画像化し、API経由で各AIに入力するという厳密な環境下で実施されました。各モデルの実力を最大限に引き出すため、適切な調整が行われています。ChatGPTには数分間の思考時間を許容し、ClaudeやGeminiには思考プロセスや画像認識精度を高める設定が適用されました

ただし、注目すべき配慮として、音声データの入力が困難な英語リスニングについては、試験センター公開の読み上げスクリプトを代わりに使用。また、AIが読み取りを苦手とする縦書きの国語については、事前に文字起こししたテキストデータを代替入力するという措置が取られています。

処理速度で異なるアプローチが明らかに

興味深いことに、処理速度では大きな差が見られました。GeminiとClaudeは試験時間10時間10分のうち、わずか1時間40分前後で全科目を完了。これは試験時間の約6分の1という驚異的な速度です。一方、ChatGPTは5時間30分程かかっており、より慎重で思考的なアプローチを取っていることが伺えます。

全AIが共通して間違えた箇所が存在

完璧に見えるChatGPTの成績でも、全科目を通じてミスは数問存在します。さらに重要なのは、3つのAIモデル全てが共通して間違えた問題が存在することです。その最大の弱点は「小説における感情の機微の理解」と「イラスト・図解と文章を紐付ける視覚的論理」の欠如にあります。

つまり、AIがいかに高度な計算能力と知識を持っていたとしても、人間の感情的な理解や複雑な視覚的情報の統合という領域では、まだ限界を持っているということです。これらは、人間の思考と感性の独自性を示す重要な領域となっています。

4回目の実験で見える技術進化の軌跡

今回の検証は、LifePromptが実施する通算4回目の共通テストAI検証実験となります。毎年の成績推移を見ると、AIの急速な進化が明らかになります。昨年までの検証では「満点」という結果は考えられなかったとのことですが、2026年には複数科目での満点達成が実現しました。

この定点観測的な検証により、AI技術が教育領域をどのように変えていくのか、そしてどのような能力の限界を持つのかが、より明確に見えてくるのです。

今後の展開:東大試験への挑戦

LifePromptは、今回の共通テスト検証に続き、東京大学の二次試験にAIを挑戦させる企画も既に始動させているとのことです。昨年の検証では「理三合格ライン突破」という成果を残しており、今年度も同様に合格判定を得られるかが注目されています。

AIと人間教育の未来を考える

ChatGPTが共通テストで9科目満点を獲得したというニュースは、単なる技術的なマイルストーンではありません。これは、AIが「人間を凌駕する速度」と「ほぼ満点の精度」を手に入れたことを意味します。もはや「AIに解けない試験はない」と言えるレベルまで到達しているという評価もなされています。

しかし同時に、全AIが共通して間違える「人間感情への理解」と「視覚的論理」という領域が存在することも、今回の検証を通じて明確になりました。これは、今後の教育現場において、AIでは代替できない人間的な思考力や感受性を養うことの重要性をあらためて示唆しているのです。

AI技術の進化は確実に進んでいますが、人間にしかできない価値は確実に存在します。その違いを理解した上で、AIと人間が協働する教育の在り方を模索していくことが、これからの課題となるでしょう。

参考元