基于InternLM的答题卡选项识别技术 #3040
Jianfeng777
started this conversation in
project
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
📝 项目简介:基于 InternLM 的答题卡选项识别技术
本项目构建了一个端到端的智能识别系统,能够对考试答题卡中的选择题答案进行精准提取与结构化输出。整体流程融合了计算机视觉、多模态理解与大语言模型技术,核心模块包括:
InternVL 多模态模型:对 OCR 结果进行图文校对,确保答案识别的准确性;
InternLM2.5-20B 大语言模型:将校对后的内容进行格式化,输出标准化的“题号. 选项”结构。
该系统具有较强的鲁棒性与可扩展性,支持多图批处理、自动矫正图片方向、对识别错误进行自动补救与二次优化,广泛适用于高校课程的自动阅卷与教育评测系统建设。
🔁 系统整体流程图
A[输入:答题卡图片或压缩包] --> B[图像预处理:方向矫正]
B --> C[mmdetection检测答题区域]
C --> D[裁剪出答题区域图像]
D --> E[识别题号与选项]
E --> F[结构化匹配:题号 ↔ 答案]
F --> G[InternVL 校对识别内容]
G --> H[InternLM2.5 格式化为统一结构]
H --> I[输出:结构化CSV + 学生txt文档]
Beta Was this translation helpful? Give feedback.
All reactions