基于计算机视觉的图书信息自动检测方法

文档序号:36999056发布日期:2024-02-09 12:41阅读:22来源:国知局
基于计算机视觉的图书信息自动检测方法

本发明涉及图像处理,具体涉及基于计算机视觉的图书信息自动检测方法。


背景技术:

1、随着数字图书馆的建设和图书数字化的推进,越来越多的纸质图书被扫描和转换为数字格式。这些数字图书的质量和可用性对于用户的阅读体验和信息获取非常重要。图书边框的自动检测可以帮助准确定位图书页面的边界,提高数字图书的质量和读取效果。自动检测图书边框可以成为文档分割和后续处理的重要步骤,有效地区分图书页面和其他背景信息,为后续的文字识别、布局分析等工作提供准确的输入。

2、其中,对于边框检测,通常检测图书在一张图像中的具体像素大小,并通过相机与采集物之间的距离得到其实际大小。在检测过程中,通常会出现背景和图书封面像素值接近,从而无法判断图书边框具体位置的问题,所以此处需要进行增强的操作,增加图书边框和背景之间的对比度,方便后续的边框检测。


技术实现思路

1、本发明提供基于计算机视觉的图书信息自动检测方法,以解决现有的问题。

2、本发明的基于计算机视觉的图书信息自动检测方法采用如下技术方案:

3、本发明一个实施例提供了基于计算机视觉的图书信息自动检测方法,该方法包括以下步骤:

4、采集图书灰度图像;

5、根据图书灰度图像得到边缘检测图,根据边缘检测图得到边框连通域;根据边框连通域得到边框的大致区域;

6、根据边框的大致区域中每个像素点的滑窗窗口内的所有像素点的灰度值得到每个像素点的信息熵;根据边框的大致区域中每个像素点与水平相邻的两个像素点之间的灰度差异和每个像素点的信息熵得到每个像素点的水平灰度差异;根据边框的大致区域中每个像素点与竖直相邻的两个像素点之间的灰度差异和每个像素点的信息熵得到每个像素点的竖直灰度差异;

7、根据边框的大致区域中每个像素点的水平灰度差异和竖直灰度差异得到每个像素点的灰度特征;根据边框的大致区域中每个像素点的灰度特征得到边框的大致区域中的所有边框像素点;

8、根据图书灰度图像中的所有边框像素点得到最佳滤波窗口的大小,根据最佳滤波窗口的大小对图书灰度图像进行滤波得到滤波后的图书灰度图像;

9、获取滤波后的图书灰度图像的图书信息并显示。

10、进一步地,所述根据图书灰度图像得到边缘检测图,根据边缘检测图得到边框连通域,包括的具体步骤如下:

11、使用canny算子对图书灰度图像进行边缘检测,得到边缘检测图,获取边缘检测图中的所有边缘像素点,获取边缘检测图中的所有边缘像素点组成的连通域,对所有的连通域作最小外接矩形,获取每个最小外接矩形的长,计算每个连通域最小外接矩形的宽与长的比值,得到每个连通域最小外接矩形的长宽比;

12、将连通域最小外接矩形的长宽比小于预设阈值a时对应的连通域记为边框连通域。

13、进一步地,所述根据边框连通域得到边框的大致区域,包括的具体步骤如下:

14、将所有的边框连通域按照最小外接矩形的长的方向进行延申,直到与另一个边框连通域相交时停止,得到由边框连通域对应的最小外接矩形围成的一个大致边框;

15、对大致边框延最小外接矩形的宽的方向扩展上b个像素点得到边框的大致区域,b为预设像素点数量。

16、进一步地,所述每个像素点的信息熵的具体获取步骤如下:

17、将灰度值相同的像素点归为一类;

18、每个像素点的信息熵的公式为:

19、

20、式中,表示边框的大致区域中的第i个像素点对应的滑窗窗口内第m类像素点个数与第i个像素点对应的滑窗窗口内所有像素点个数之间的比值,m表示边框的大致区域中的第i个像素点对应的滑窗窗口内的类别个数,表示边框的大致区域中的第i个像素点的灰度信息熵。

21、进一步地,所述每个像素点的水平灰度差异的具体获取步骤如下:

22、每个像素点的水平灰度差异的公式为:

23、

24、式中,表示边框的大致区域中的第i个像素点的灰度信息熵,表示边框的大致区域中的第i个像素点的灰度值,表示与第i个像素点水平向右相邻的一个像素点的灰度值,表示与第i个像素点水平向左相邻的一个像素点的灰度值,表示第i个像素点的水平灰度差异。

25、进一步地,所述每个像素点的竖直灰度差异的具体获取步骤如下:

26、每个像素点的竖直灰度差异的公式为:

27、

28、式中,表示边框的大致区域中的第i个像素点的灰度信息熵,表示边框的大致区域中的第i个像素点的灰度值,表示与第i个像素点竖直向上相邻的一个像素点的灰度值,表示与第i个像素点竖直向下相邻的一个像素点的灰度值,表示第i个像素点的竖直灰度差异。

29、进一步地,所述每个像素点的灰度特征的具体获取步骤如下:

30、每个像素点的灰度特征的公式为:

31、

32、式中,表示边框的大致区域中的第i个像素点的灰度特征,表示第i个像素点在水平方向上的灰度差异,表示第i个像素点在竖直方向上的灰度差异,表示以自然常数为底的指数函数。

33、进一步地,所述根据边框的大致区域中每个像素点的灰度特征得到边框的大致区域中的所有边框像素点,包括的具体步骤如下:

34、将边框的大致区域中的第i个像素点的灰度特征记为;当大于预设阈值d时,则判定边框的大致区域中的第i个像素点为边框像素点;当小于等于预设阈值d时,则判定边框的大致区域中的第i个像素点不是边框像素点。

35、进一步地,所述根据图书灰度图像中的所有边框像素点得到最佳滤波窗口的大小,根据最佳滤波窗口的大小对图书灰度图像进行滤波得到滤波后的图书灰度图像,包括的具体步骤如下:

36、首先统计出图书灰度图像中每行和每列的边框像素点个数,使用正太分布的3原则进行筛选,将每行和每列的边框像素点个数在的行和列进行保留,将每行和每列的边框像素点个数不在的行和列进行去除,依次对每行每列进行筛选,得到保留之后的所有行和列的边框像素点个数;其中分别表示所有行和列的边框像素点个数的均值和标准差;

37、然后获取保留之后的所有行和列的边框像素点个数,计算保留之后的所有行和列的边框像素点个数的均值除以2之后的边框像素点个数作为最佳滤波窗口的大小;通过最佳滤波窗口的大小使用中值滤波对图书灰度图像进行滤波得到滤波后的图书灰度图像。

38、进一步地,所述获取滤波后的图书灰度图像的图书信息并显示,包括的具体步骤如下:

39、通过滤波后的图书灰度图像使用canny算子进行边缘检测,得到边缘图,对边缘图中的所有边缘进行霍夫直线检测,得到所有的直线,获取处于同一条直线上的边缘,记为直线边缘,将最长的两个直线边缘记为图书的长和宽,将图书的长和宽作为图书信息进行显示。

40、本发明的技术方案的有益效果是:本发明通过对图书灰度图像的每个像素点与周围像素点之间的灰度信息作为中心像素点的灰度信息熵,通过每个像素点的灰度信息熵可以初步判断每个像素点为边框像素点的可能性;通过每个像素点与水平和竖直相邻像素点之间的灰度差异分析,对每个像素点的灰度信息熵进行修正,提高对每个像素点是否为边框像素点判断的准确性,根据修正后的结果得到每个像素点的灰度特征,根据每个像素点的灰度特征获取所有的边框像素点,根据所有的边框像素点确定出最佳滤波窗口的大小,根据最佳滤波窗口的大小对图书灰度图像进行滤波得到滤波后的图像,提高后续对图书的实际尺寸大小判断的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1