基于统计的图像目标检索

因为涉及公司具体的产品，本文的源码不便于公开，但是会详细阐述思路。

该产品涉及线上以及线下的书法教育相关的产品。书法老师通常会留一些课后作业，学生通过APP拍照后将作业上传到系统，系统会收到大量的作业，由于人工批改效率低下，因此希望可以实现自动批改。但是自动批改需要把待批改的字拆分开，本文的背景就是基于这个问题。

正常情况下，只要拍摄的作业纸轮廓清晰，光线充足，是可以清晰的识别出每个写字的格子的，如下所示：

但是，有时候小朋友拍摄的图片并不是那么理想，比如作业有时候会有折痕，光线比较暗淡，这样就造成部分作业非常难以识别：

这里希望可以找到一种算法，可以自动扫描出没有正确识别的部分。

每五个为一组，尝试去计算每一组坐标的标准差，如果某一组存在缺失格子的情况，标准差和正常值相比，必然会较大，标准差偏离正常的范围，大概率是由于格子缺失。

至于判定标准差是否异常，应该根据图片的分辨率来具体分析，没有一个固定的阈值。

通过计算标准差的方式，可以处理一些缺失不太严重的作业。

如果缺失很严重怎么办？这种情况我们就不处理了，说明拍照态度很有问题，那就重拍吧。

不知道看到这篇文章的你有没有什么比较好的处理方法？