Thinking and Hacks: 【ヒット商品のネタ出しの会】　日本経済新聞の記事「東大入試数学、AIが合格水準」から

【ヒット商品のネタ出しの会】　日本経済新聞の記事「東大入試数学、AIが合格水準」から

2025/03/17

2025.3.16 日本経済新聞の記事「私見卓見：東大入試数学、AIが合格水準」から

推論モデルで進化し、教育にも影響が

コラムの著者越川智瑛氏（日本経済新聞社）によれば、AIは東京大学の入試問題の数学を「合格レベル」で解けるほどになったという。これまで他の科目に比べ数学は苦手なAIであったが、推論モデルの導入でモデルを論理思考に変えて成績を上げた。また、関係者の競争原理で大規模な投資が進み、スケーリング則と呼ばれる学習データの量を増やし、計算量も増やし、AIモデルのパラメーター数を増やすことでLLMの性能が大幅に改善してきているという。

◯合格ラインを超えたというより上位合格者のレベルになった

越川氏によれば、米オープンAIのo1モデルなど「推論モデル」が2024年9月以降相次いで登場し、従来とは異なるアプローチを身につけて状況が一変した。国立情報学研究所の新井紀子教授が「o1は東大合格者のレベルに達したと言っていい」というほど進化した。o1は2025年2月の東京大学2次試験の理系数学だけでなく、過去の難問とされる問題もほぼ解けそうだという。

2024年2月時点ではCharGPTでは東京大学の入学試験問題で数学には歯が立たなかった。それが数学などの論理的思考を必要とする課題の解決に特化した推論モデルの登場によって、1年で大飛躍した。同様のことが米国数学オリンピックの予選「AIME」の問題の正解率をみても大幅にこの1年で進化したことが示されているという。

なぜ推論モデルが高い成績を出せるのかは十分に明らかになっていないという：

「強化学習」：正しい推論をこなった場合に報酬を与える
「思考の連鎖」：課題を段階的に分けて解く
計算量の増加：推論にかける時間を増やし計算量を増やす

などの組み合わせ技術が技術向上につながるという。

AIが急速に進化する中で、大学の入試や教育は変革を迫られそうだという。AIを不正に利用しやすい試験や課題では、公正な成績評価や効果的学習が難しくなる可能性がある。自力で学びたい学生の成績がAIを使った学生よりも不利なことになりかねないからである。🧠📈👦👶🏫💬👩🤝👨💡🐡⛰️🌾🏣❤️👦👧💰📓🗺️🚢🩺💉🏢⚡️🎓👔⏰🔧💻🖥📻🖋🌏💡🔎🌍 happy01 🇯🇵