国語研究会で実際に使ったプロンプト

実験ログ

AIに「問題PDFをそのまま投げたらどうなるのか」

AIに問題PDFをそのまま投げたら、どこまで解けるのか。

今回は、あえて“何も工夫しない”状態で試しました。

プロンプトはこれだけです。

👉 この問題を解いて

以上。


なぜこんなことをやるのか

理由はシンプルです。

👉 AIの「素の実力」を見るため

私は普段、仕事でもAIを使っています。

だから正直に言うと、

👉 精度を上げるプロンプトは設計できる

むしろ、そこが仕事です。

ただ今回は、あえてやらない。

👉 “素のAIはどこまでできるのか”

これを見にいきます。

プロンプトを作り込めば、精度はいくらでも上がる。

でもそれは、AIの性能ではない。

👉 人間が補助しているだけ

だから今回だけは、何も足さない。


結果

結論から言うと

👉 普通に戦える

ただし

👉 普通にミスる


実際の挙動

今回の組分けテストではこうなりました。

■物語文(大問3)
👉 AIはかなり優秀
👉 解説も成立する

■説明文(大問4)
👉 グラフ問題でミス

これはなかなか面白いじゃないか。


見えてきたこと

この使い方をすると、AIの性質が露骨に出ます。

■強み
・文章構造を捉える
・それっぽい説明を作る
・一定の精度で当てる

■弱み
・根拠が曖昧になる
・推測が混ざる
・書いていないことを補完する

👉 一言で言うと

雑に強い


ハルシネーションの正体

今回、かなりはっきり見えました。

👉 AIは“埋めにいく”

情報が足りない状態を、そのまま放置できない。

だから補完する。

その結果

👉 存在しないストーリーを作る

これがハルシネーションの正体一つだと思う。


それでも使えるのか?

結論はYESです。

このレベルでも、普通に使えます。

例えば

・子どもの答案の比較
・別解の候補
・思考のヒント

👉 十分、教材になる


ただし問題もある

このままだと厳しい。

・精度がブレる
・毎回安定しない
・無駄な説明が多い

👉 実戦投入には耐えない


ここからが本題

ここまでが

👉 誰でもできる使い方

です。

そしてここからが

👉 差がつく領域


精度を上げる
ハルシネーションを抑える
解答を安定させる

これは全部

👉 プロンプト設計で変わる


まとめ

👉 AIはそのままでも使える

👉 ただし、そのままでは不安定

👉 性能は“使い方”で変わる


次回

👉 同じ問題を「プロンプトあり」で解かせたらどうなるか

ここを検証します。


最後に

AIは魔法じゃない。

👉 だが、使い方を知っている人間は魔法のように使う

コメント

タイトルとURLをコピーしました