本发明涉及数据处理,具体涉及一种书本纸张边界识别裁切方法及设备。
背景技术:
1、随着信息技术的快速发展,电子资料成为人们快速获得有效信息的必要途径。对于以前出版的实体书本等出版物,则通常需要通过扫描、裁切生成其电子版本。现有书本图像裁切技术大多采用图像处理算法对rgb图像做分析处理,存在稳定性差、泛化性能弱的问题,具体体现在对于一些色彩简单、状况较好的书页处理效果较好,反之处理效果较差,容易受到色彩纹理影响。
技术实现思路
1、本发明的目的是针对现有技术存在的不足,提供一种书本纸张边界识别裁切方法及设备。
2、为实现上述目的,在第一方面,本发明提供了一种书本纸张边界识别裁切方法,包括:
3、获取书本在压平状态下的深度图像数据和彩色图像数据;
4、对所述深度图像数据进行二值化处理,然后利用霍夫直线获取书本的外边界线;
5、利用书本的外边界线定位书本中缝的附近区域,然后在书本中缝的附近区域寻找一组深度最大的点的集合,最后通过对所述深度最大的点的集合内的点进行拟合获得书本的中缝线;
6、将深度图像数据沿着书本的上下方向降维成一维数组,并利用分段函数来拟合该一维数组,以获得分段函数的间断点;
7、根据所述书本的中缝线的斜率和分段函数的间断点计算书本的内边界线,具体如下:
8、;
9、其中,为书本的内边界线的纵坐标值,为书本的内边界线的横坐标值,为深度图像中列的长度,为间断点的横坐标值;
10、根据书本的内边界线获取书本上下边界处的点坐标值集合,并通过对上下边界处的点坐标值集合内的点进行拟合获得书本的上下边界线,所述中缝线、内边界线和上下边界线围合形成书本纸张内边界;
11、利用所述深度图像数据和彩色图像数据完成配准所需要的缩放参数和旋转参数对所述书本纸张内边界进行缩放、旋转,然后沿着缩放、旋转后的书本纸张内边界对彩色图像数据进行裁切。
12、进一步的,采用最小二乘法进行拟合。
13、进一步的,将深度图像数据沿着书本的上下方向降维成一维数组的方式具体如下:
14、根据书本的中缝线的斜率对书本围绕着深度图像的中心旋转,使得旋转后的书本的中缝线处于竖直状态;
15、令a为深度图像的矩阵,ai是a的一列,则a=[a0,a1,a2...ai],降维成的一维数组b=[mean(a0),mean(a1)...mean(ai)],mean为对数列求平均值。
16、进一步的,所述分段函数为:
17、;
18、其中,为分段函数的纵坐标值,为分段函数的横坐标值,、分别为目标函数中两个一次函数的斜率,、分别为目标函数中两个一次函数的常数。
19、进一步的,所述缩放参数和旋转参数通过以下方式获得:
20、采用工业彩色相机和深度相机的红外摄像头同时拍摄一个压平状态下的目标,以分别获得目标的彩色图像和红外图像,通过缩放和旋转将目标的红外图像与彩色图像配准至重合,记录完成配准所需要的缩放参数和旋转参数。
21、在第二方面,本发明提供了一种书本纸张边界识别裁切设备,包括:
22、深度相机和工业彩色相机,分别用以获取书本在压平状态下的深度图像数据和彩色图像数据;
23、外边界线计算模块,用以对所述深度图像数据进行二值化处理,然后利用霍夫直线获取书本的外边界线;
24、中缝线计算模块,用以利用书本的外边界线定位书本中缝的附近区域,然后在书本中缝的附近区域寻找一组深度最大的点的集合,最后通过对所述深度最大的点的集合内的点进行拟合获得书本的中缝线;
25、间断点计算模块,用以将深度图像数据沿着书本的上下方向降维成一维数组,并利用分段函数来拟合该一维数组,以获得分段函数的间断点;
26、内边界线计算模块,用以根据所述书本的中缝线的斜率和分段函数的间断点计算书本的内边界线,具体如下:
27、;
28、其中,为书本的内边界线的纵坐标值,为书本的内边界线的横坐标值,为深度图像中列的长度,为间断点的横坐标值;
29、上下边界线计算模块,用以根据书本的内边界线获取书本上下边界处的点坐标值集合,并通过对上下边界处的点坐标值集合内的点进行拟合获得书本的上下边界线,所述中缝线、内边界线和上下边界线围合形成书本纸张内边界;
30、裁切计算控制模块,用以利用所述深度图像数据和彩色图像数据完成配准所需要的缩放参数和旋转参数对所述书本纸张内边界进行缩放、旋转,然后沿着缩放、旋转后的书本纸张内边界对彩色图像数据进行裁切。
31、进一步的,采用最小二乘法进行拟合。
32、进一步的,将深度图像数据沿着书本的上下方向降维成一维数组的方式具体如下:
33、根据书本的中缝线的斜率对书本围绕着深度图像的中心旋转,使得旋转后的书本的中缝线处于竖直状态;
34、令a为深度图像的矩阵,ai是a的一列,则a=[a0,a1,a2...ai],降维成的一维数组b=[mean(a0),mean(a1)...mean(ai)],mean为对数列求平均值。
35、进一步的,所述分段函数为:
36、;
37、其中,为分段函数的纵坐标值,为分段函数的横坐标值,、分别为目标函数中两个一次函数的斜率,、分别为目标函数中两个一次函数的常数。
38、进一步的,所述缩放参数和旋转参数通过以下方式获得:
39、采用工业彩色相机和深度相机的红外摄像头同时拍摄一个压平状态下的目标,以分别获得目标的彩色图像和红外图像,通过缩放和旋转将目标的红外图像与彩色图像配准至重合,记录完成配准所需要的缩放参数和旋转参数。
40、有益效果:本发明通过深度相机获取深度图像数据,然后根据深度图像数据先通过计算出外边界线,然后再依次计算出中缝线、内边界线和上下边界线,从而获得书本纸张内边界,然后再通过与彩色工业相机获得的彩色图像数据配准所需的缩放参数和旋转参数对书本纸张内边界进行缩放、旋转,最后沿着缩放、旋转后的书本纸张内边界对彩色图像数据进行裁切,从而使裁切结果准确,泛化性好,性能稳定。
1.一种书本纸张边界识别裁切方法,其特征在于,包括:
2.根据权利要求1所述的一种书本纸张边界识别裁切方法,其特征在于,采用最小二乘法进行拟合。
3.根据权利要求1所述的一种书本纸张边界识别裁切方法,其特征在于,将深度图像数据沿着书本的上下方向降维成一维数组的方式具体如下:
4.根据权利要求1所述的一种书本纸张边界识别裁切方法,其特征在于,所述分段函数为:
5.根据权利要求1所述的一种书本纸张边界识别裁切方法,其特征在于,所述缩放参数和旋转参数通过以下方式获得:
6.一种书本纸张边界识别裁切设备,其特征在于,包括:
7.根据权利要求6所述的一种书本纸张边界识别裁切设备,其特征在于,采用最小二乘法进行拟合。
8.根据权利要求6所述的一种书本纸张边界识别裁切设备,其特征在于,将深度图像数据沿着书本的上下方向降维成一维数组的方式具体如下:
9.根据权利要求6所述的一种书本纸张边界识别裁切设备,其特征在于,所述分段函数为:
10.根据权利要求6所述的一种书本纸张边界识别裁切设备,其特征在于,所述缩放参数和旋转参数通过以下方式获得: