基于统计的图像目标检索

因为涉及公司具体的产品,本文的源码不便于公开,但是会详细阐述思路。

问题背景

该产品涉及线上以及线下的书法教育相关的产品。书法老师通常会留一些课后作业,学生通过APP拍照后将作业上传到系统,系统会收到大量的作业,由于人工批改效率低下,因此希望可以实现自动批改。但是自动批改需要把待批改的字拆分开,本文的背景就是基于这个问题。

识别区域

遇到的困难

正常情况下,只要拍摄的作业纸轮廓清晰,光线充足,是可以清晰的识别出每个写字的格子的,如下所示:

但是,有时候小朋友拍摄的图片并不是那么理想,比如作业有时候会有折痕,光线比较暗淡,这样就造成部分作业非常难以识别:

这里希望可以找到一种算法,可以自动扫描出没有正确识别的部分。

计算标准差

每五个为一组,尝试去计算每一组坐标的标准差,如果某一组存在缺失格子的情况,标准差和正常值相比,必然会较大,标准差偏离正常的范围,大概率是由于格子缺失。

至于判定标准差是否异常,应该根据图片的分辨率来具体分析,没有一个固定的阈值。

后记

通过计算标准差的方式,可以处理一些缺失不太严重的作业。

如果缺失很严重怎么办?这种情况我们就不处理了,说明拍照态度很有问题,那就重拍吧。

不知道看到这篇文章的你有没有什么比较好的处理方法?

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注