一种书本纸张边界识别裁切方法及设备与流程

文档序号：36463917发布日期：2023-12-21 20:01阅读：87来源：国知局

技术简介：
本发明针对传统书本图像裁切技术稳定性差、泛化性弱的问题，提出基于深度图像与彩色图像融合的边界识别方法。通过深度图像二值化提取外边界线，结合中缝线定位与分段函数拟合确定内边界线，再利用配准参数对彩色图像进行精准裁切，提升裁切结果的准确性和鲁棒性。
关键词：书本边界识别,裁切方法

本发明涉及数据处理，具体涉及一种书本纸张边界识别裁切方法及设备。

背景技术：

1、随着信息技术的快速发展，电子资料成为人们快速获得有效信息的必要途径。对于以前出版的实体书本等出版物，则通常需要通过扫描、裁切生成其电子版本。现有书本图像裁切技术大多采用图像处理算法对rgb图像做分析处理，存在稳定性差、泛化性能弱的问题，具体体现在对于一些色彩简单、状况较好的书页处理效果较好，反之处理效果较差，容易受到色彩纹理影响。

技术实现思路

1、本发明的目的是针对现有技术存在的不足，提供一种书本纸张边界识别裁切方法及设备。

2、为实现上述目的，在第一方面，本发明提供了一种书本纸张边界识别裁切方法，包括：

3、获取书本在压平状态下的深度图像数据和彩色图像数据；

4、对所述深度图像数据进行二值化处理，然后利用霍夫直线获取书本的外边界线；

5、利用书本的外边界线定位书本中缝的附近区域，然后在书本中缝的附近区域寻找一组深度最大的点的集合，最后通过对所述深度最大的点的集合内的点进行拟合获得书本的中缝线；

6、将深度图像数据沿着书本的上下方向降维成一维数组，并利用分段函数来拟合该一维数组，以获得分段函数的间断点；

7、根据所述书本的中缝线的斜率和分段函数的间断点计算书本的内边界线，具体如下：

8、；

9、其中，为书本的内边界线的纵坐标值，为书本的内边界线的横坐标值，为深度图像中列的长度，为间断点的横坐标值；

10、根据书本的内边界线获取书本上下边界处的点坐标值集合，并通过对上下边界处的点坐标值集合内的点进行拟合获得书本的上下边界线，所述中缝线、内边界线和上下边界线围合形成书本纸张内边界；

11、利用所述深度图像数据和彩色图像数据完成配准所需要的缩放参数和旋转参数对所述书本纸张内边界进行缩放、旋转，然后沿着缩放、旋转后的书本纸张内边界对彩色图像数据进行裁切。

12、进一步的，采用最小二乘法进行拟合。

13、进一步的，将深度图像数据沿着书本的上下方向降维成一维数组的方式具体如下：

14、根据书本的中缝线的斜率对书本围绕着深度图像的中心旋转，使得旋转后的书本的中缝线处于竖直状态；

15、令a为深度图像的矩阵，ai是a的一列，则a=[a0,a1,a2...ai]，降维成的一维数组b=[mean(a0),mean(a1)...mean(ai)]，mean为对数列求平均值。

16、进一步的，所述分段函数为：

17、；

18、其中，为分段函数的纵坐标值，为分段函数的横坐标值，、分别为目标函数中两个一次函数的斜率，、分别为目标函数中两个一次函数的常数。

19、进一步的，所述缩放参数和旋转参数通过以下方式获得：

20、采用工业彩色相机和深度相机的红外摄像头同时拍摄一个压平状态下的目标，以分别获得目标的彩色图像和红外图像，通过缩放和旋转将目标的红外图像与彩色图像配准至重合，记录完成配准所需要的缩放参数和旋转参数。

21、在第二方面，本发明提供了一种书本纸张边界识别裁切设备，包括：

22、深度相机和工业彩色相机，分别用以获取书本在压平状态下的深度图像数据和彩色图像数据；

23、外边界线计算模块，用以对所述深度图像数据进行二值化处理，然后利用霍夫直线获取书本的外边界线；

24、中缝线计算模块，用以利用书本的外边界线定位书本中缝的附近区域，然后在书本中缝的附近区域寻找一组深度最大的点的集合，最后通过对所述深度最大的点的集合内的点进行拟合获得书本的中缝线；

25、间断点计算模块，用以将深度图像数据沿着书本的上下方向降维成一维数组，并利用分段函数来拟合该一维数组，以获得分段函数的间断点；

26、内边界线计算模块，用以根据所述书本的中缝线的斜率和分段函数的间断点计算书本的内边界线，具体如下：

27、；

28、其中，为书本的内边界线的纵坐标值，为书本的内边界线的横坐标值，为深度图像中列的长度，为间断点的横坐标值；

29、上下边界线计算模块，用以根据书本的内边界线获取书本上下边界处的点坐标值集合，并通过对上下边界处的点坐标值集合内的点进行拟合获得书本的上下边界线，所述中缝线、内边界线和上下边界线围合形成书本纸张内边界；

30、裁切计算控制模块，用以利用所述深度图像数据和彩色图像数据完成配准所需要的缩放参数和旋转参数对所述书本纸张内边界进行缩放、旋转，然后沿着缩放、旋转后的书本纸张内边界对彩色图像数据进行裁切。

31、进一步的，采用最小二乘法进行拟合。

32、进一步的，将深度图像数据沿着书本的上下方向降维成一维数组的方式具体如下：

33、根据书本的中缝线的斜率对书本围绕着深度图像的中心旋转，使得旋转后的书本的中缝线处于竖直状态；

34、令a为深度图像的矩阵，ai是a的一列，则a=[a0,a1,a2...ai]，降维成的一维数组b=[mean(a0),mean(a1)...mean(ai)]，mean为对数列求平均值。

35、进一步的，所述分段函数为：

36、；

37、其中，为分段函数的纵坐标值，为分段函数的横坐标值，、分别为目标函数中两个一次函数的斜率，、分别为目标函数中两个一次函数的常数。

38、进一步的，所述缩放参数和旋转参数通过以下方式获得：

39、采用工业彩色相机和深度相机的红外摄像头同时拍摄一个压平状态下的目标，以分别获得目标的彩色图像和红外图像，通过缩放和旋转将目标的红外图像与彩色图像配准至重合，记录完成配准所需要的缩放参数和旋转参数。

40、有益效果：本发明通过深度相机获取深度图像数据，然后根据深度图像数据先通过计算出外边界线，然后再依次计算出中缝线、内边界线和上下边界线，从而获得书本纸张内边界，然后再通过与彩色工业相机获得的彩色图像数据配准所需的缩放参数和旋转参数对书本纸张内边界进行缩放、旋转，最后沿着缩放、旋转后的书本纸张内边界对彩色图像数据进行裁切，从而使裁切结果准确，泛化性好，性能稳定。

技术特征：

1.一种书本纸张边界识别裁切方法，其特征在于，包括：

2.根据权利要求1所述的一种书本纸张边界识别裁切方法，其特征在于，采用最小二乘法进行拟合。

3.根据权利要求1所述的一种书本纸张边界识别裁切方法，其特征在于，将深度图像数据沿着书本的上下方向降维成一维数组的方式具体如下：

4.根据权利要求1所述的一种书本纸张边界识别裁切方法，其特征在于，所述分段函数为：

5.根据权利要求1所述的一种书本纸张边界识别裁切方法，其特征在于，所述缩放参数和旋转参数通过以下方式获得：

6.一种书本纸张边界识别裁切设备，其特征在于，包括：

7.根据权利要求6所述的一种书本纸张边界识别裁切设备，其特征在于，采用最小二乘法进行拟合。

8.根据权利要求6所述的一种书本纸张边界识别裁切设备，其特征在于，将深度图像数据沿着书本的上下方向降维成一维数组的方式具体如下：

9.根据权利要求6所述的一种书本纸张边界识别裁切设备，其特征在于，所述分段函数为：

10.根据权利要求6所述的一种书本纸张边界识别裁切设备，其特征在于，所述缩放参数和旋转参数通过以下方式获得：

技术总结
本发明公开了一种书本纸张边界识别裁切方法及设备。该方法包括获取书本在压平状态下的深度图像数据和彩色图像数据；对深度图像数据进行二值化处理，然后利用霍夫直线获取书本的外边界线；利用书本的外边界线定位书本中缝的附近区域，然后在书本中缝的附近区域寻找一组深度最大的点的集合，最后通过拟合获得书本的中缝线；将深度图像数据沿着书本的上下方向降维成一维数组，并利用分段函数来拟合获得间断点；计算书本的内边界线，根据书本的内边界线获取书本上下边界处的点坐标值集合，并通过拟合获得书本的上下边界线；然后沿着缩放、旋转后的书本纸张内边界对彩色图像数据进行裁切。本发明的裁切结果准确，泛化性好，性能稳定。

技术研发人员：梁宏华,孙溢凡,胡皇印
受保护的技术使用者：南京未来脑科技有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：梁宏华孙溢凡胡皇印
技术所有人：南京未来脑科技有限公司
我是此专利的发明人

上一篇：一种用于细长杆闸门阀杆组件的制作方法
下一篇：晾衣机的制作方法

该领域下的技术专家

1、李老师：1.计算力学 2.无损检测

2、毕老师：机构动力学与控制

3、袁老师：1.计算机视觉 2.无线网络及物联网

4、王老师：1.计算机网络安全 2.计算机仿真技术

5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！