子ども vs AI、初戦は子どもの勝ちだった
正直に言う。
今回は、AIの完敗。
しかも負け方が、かなり象徴的だった。
・グラフの読み違え
・記述の弱さ
この2つで、AIはあっさり崩れた。
一方で、子どもは――
偏差値70台。
子どもとは言えいきなりラスボス級、
当然と言えば当然だが、
それでも「何が違ったのか」は、かなり面白い。
AIは“読める”が、“書けない”
今回、はっきり見えたのはここだ。
👉 選択問題は強い
👉 だが、記述になると急に弱くなる
理由はシンプルで、
AIは「正解の候補を当てにいく力」はあるが、
「根拠を圧縮して構造化する力」がまだ甘い。
人間の上位層はここをやっている。
・必要な情報だけを抜く
・余計なことは書かない
・設問の“型”に合わせて圧縮する
つまり、
👉 記述は“言語化”ではなく“設計”
ここに差が出た。
グラフ問題のズレは、むしろ致命的
もう一つ。
今回の敗因で一番重いのは、こっちだ。
👉 グラフの読み違え
これは単なるミスじゃない。
AIはここで、
・軸
・単位
・相対関係
のどれかを“雑に扱った”。
つまり、
👉 「見ているつもりで、見ていない」
これ、人間でもよくあるけど、
上位層はここを外さない。
なぜか?
👉 必ず「言語化して確認する」から
次のテーマは「記述の精度」
というわけで、次回のテーマはこれ。
👉 記述の精度をどこまで上げられるか
ここは面白い。
なぜなら、
AIは“伸びしろの塊”だからだ。
プロンプトを設計すれば、
・根拠の強制
・文字数制約
・不要要素の排除
このあたりは、かなり改善できる。
逆に言うと、
👉 設計しない限り、絶対に勝てない
いきなり偏差値70と戦うのは無謀
まあ、冷静に考えれば当然で。
いきなり偏差値70台と勝負して、
普通に勝てるわけがない。
ただ、ここはむしろ重要で、
👉 ベンチマークとしては最高
中途半端な相手だと、
差が見えない。
今回みたいにハッキリ負けた方が、
改善ポイントが一気に浮き上がる。
次回、AIはリベンジする(予定)
次は週テスト。
AI側は、完全にリベンジモードに入る。
・グラフは“言語化プロトコル”で潰す
・記述は“構造化プロンプト”で再設計する
さて、どこまで詰められるか。
この勝負、
たぶん、まだまだ面白くなる。


コメント