実験ログ

AIは魔法ではありません。
むしろ、雑に使うと簡単に壊れます。

PDF解析で崩壊したり、
プロンプト次第で精度が大きく変わったりと、
実際の運用は試行錯誤の連続です。

このカテゴリでは、
AIを使った検証・失敗・改善の過程をそのまま記録しています。

うまくいった方法だけでなく、
うまくいかなかった理由まで含めて、
再現可能な形で積み上げていきます。

実験ログ

合不合判定テストの算数PDFは激甘だった

4/12の合不合判定テスト算数を、プロンプト設計なしでChatGPTに解かせて検証。方程式禁止でも中学受験向けの解法に切り替わり、復習の質が大きく変わった。親主導ではなく子ども主導で議論する復習法も整理。
実験ログ

同じ四谷大塚テストPDFなのにAIの難易度が違いすぎる理由|読めるPDFと読めないPDFの正体

四谷大塚の国語テストPDFをAIに読ませて検証。同じPDFでも「読めるもの」と「読めないもの」が存在する理由を構造レベルで解説。AIで中学受験を攻略するための本質が見える。
実験ログ

四谷大塚週テストPDFは、想像以上に“固かった”

四谷大塚週テストPDFをAIで解析した結果、問題文が崩壊。原因は縦書き・二段組など特殊レイアウトだった。AIが読めない本当の理由と、構造復元という解決アプローチを解説。
実験ログ

国語研究会で実際に使ったプロンプト|AIエンジニアのセオリー

AIで国語問題を解く際のプロンプト設計を解説。ハルシネーションを抑え、解答の再現性を高めるAIエンジニアのセオリーを具体例付きで紹介。
実験ログ

国語研究会で実際に使ったプロンプト

AIに問題PDFをそのまま読み込ませ「この問題を解いて」とだけ指示した場合、どこまで中学受験の国語に通用するのかを検証。四谷大塚組分けテストを使い、AIの強みと限界、ハルシネーションの実態を明らかにする。