评分数学一直是一门不完善的科学。标准化的测试将学生锁定到僵化的框架中,通常会缺少解决问题的细微差别。即使教师手动评估工作,该过程也是 耗时,主观且常常不一致– 特别是当学生采用非常规但有效的方法时。
现在,研究人员Tianyang Zhang,Zhuoxuan Jiang和Haotian Zhang 提出 激进的偏移:AI驱动的系统称为 Mathmistake检查器 这不仅将答案标记为对还是错,而是 分析每个步骤背后的推理,确定错误并提供个性化的反馈– 所有人都不依靠参考答案。
AI如何学会像人类一样评分
Mathmistake Checker以此为核心 两个阶段。第一阶段涉及 光学特征识别(OCR), 扫描和处理手写的解决方案,将印刷的问题与学生的回答分开。这不仅仅关乎读数数字 – 它段文本,了解方程并重建 学生答案的逻辑流。
第二阶段是真正的魔术发生的地方。这里, 大型语言模型(LLMS)使用经过思考的推理来预测问题中正确的下一步,将其与学生的响应进行比较并确定错误。 AI不简单地检查准确性,而是检测到 学生的逻辑出错了 并提供有针对性的解释 – 有效地模仿老师遇到错误的方式。
为什么这是改变教育的游戏改变者
大多数自动化的分级系统都取决于参考答案,这意味着它们与创造性问题解决。如果学生采用另一种但有效的方法,传统的基于AI的分级可能会 错误地将其标记为错误。另一方面,MathMistake检查器适应了学生的实际思维方式。
这种适应性意味着它不仅评估了正确性,还意味着 关于学习过程本身的有意义的反馈。实际上,这意味着可以:
- 识别和解释 逻辑错误,错误计算和概念错误
- 认出 多种有效方法 解决问题
- 提供 个性化的反馈 量身定制每个学生如何处理数学
这是一个转变 将作为判断系统作为学习工具的判断系统。
AI驱动的评估意愿 肯定会改变学生参与学习的方式。 学生们可以使用AI生成的反馈来实时完善自己的理解,而不是将成绩视为最终判决。
尽管MathMistake检查器专注于数学,但其框架可能远远超出了数学。未来的迭代可能会评估 科学的解释,逻辑问题甚至逐步分析,分析推理,而不是正确性。 这样,AI超越了简单的评估,并逐步进入 自适应,可扩展的导师。
对于老师来说,这可能意味着花费更少的时间,实际上花费更多的时间 教学。 对于学生来说,这意味着一个认可的教育系统 他们的想法,不仅是正确的。
特色图片来源: KeremGülen/Imagen 3