提取文档边界的方法和装置与流程

文档序号：12365417阅读：来源：国知局

技术特征：

1.一种提取文档边界的方法，包括：

获取基准平面的深度；

获取放置在所述基准平面上的所述文档的文档图像；

获取所述文档图像的三维点的深度；

基于所述基准平面的深度以及所述文档图像的三维点的深度在所述文档图像中提取所述文档的边界。

2.根据权利要求1所述的方法，其中，提取所述文档的边界包括：

针对每一条扫描线，从所述文档图像的边缘开始，逐点地判定所述文档图像的三维点是否属于可能在文档上的三维点；

当连续出现超过预定个数的可能在文档上的三维点时，将所述连续出现的可能在文档上的三维点中的任何一个作为所述每一条扫描线上的候选外边界点；

基于从多条扫描线获取的所述候选外边界点拟合出所述文档的外边界；

其中，当所述文档图像的三维点的深度大于深度阈值并且小于所述深度阈值的预设倍数时，判定所述文档图像的三维点属于可能在文档上的三维点，所述深度阈值通过使预定比例的基准平面的采样点的深度小于所述深度阈值来确定。

3.根据权利要求2所述的方法，其中，提取所述文档的边界还包括：

针对每一条扫描线，从拟合出的所述文档的外边界开始，选取预定数量的三维点；

利用所选取的预定数量的三维点拟合出一条直线；

基于拟合出的所述直线，从所述文档的外边界内侧的下一个三维点开始，逐点地获取拟合误差；

将前n个拟合误差小于所述误差阈值的三维点中的任何一个作为候选内边界点；

基于从多条扫描线获取的所述候选内边界点拟合出所述文档的内边界。

4.根据权利要求2所述的方法，其中，提取所述文档的边界还包括：

选择一条所有三维点均属于在文档上的三维点的扫描线作为第一边，选择一条没有任何一个三维点属于在文档上的三维点的扫描线作为第二边，分别以所述第一边和所述第二边为基准向两侧扩展预定的距离，将经扩展的第一边和第二边之间的区域作为候选区域；

利用在所述候选区域中的多条扫描线上的三维点的深度生成掩模；

在所述掩模中提取所述文档的上边界或下边界；

其中，当所述文档图像的三维点的深度小于深度阈值时，判定所述文档图像的三维点属于在基准平面上的三维点，当所述文档图像的三维点的深度大于所述深度阈值的预设倍数时，判定所述文档图像的三维点属于在文档上的三维点，所述深度阈值通过使预定比例的基准平面的采样点的深度小于所述深度阈值来确定。

5.根据权利要求4所述的方法，其中，生成所述掩模包括：

从所述候选区域的外边界依次向内搜素，针对每一条扫描线，逐点地判定三维点是否属于所述在文档上的三维点；

当连续搜索到两个在文档上的三维点时，针对所述两个在文档上的三维点之间的区域：

以在所述扫描线上搜索到的任意相邻两个在文档上的三维点的横坐标的平均值的最小值作为所述掩模的一个边界；

以所述扫描线外侧相邻的扫描线的横坐标的最大值作为所述掩模的另一个边界，其中当所述扫描线是第一次搜索到的包括在文档上的三维点的扫描线的情况下，以所述候选区域的外边界作为所述掩模的另一个边界。

6.根据权利要求5所述的方法，其中，在所述掩模中利用动态规划法提取所述文档的上边界或下边界。

7.根据权利要求1-6中的任一项所述的方法，其中，放置在所述基准平面上的所述文档是书籍。

8.根据权利要求7所述的方法，其中，提取所述文档的边界还包括：

针对每一条扫描线上的三维点，逐点地获取当前三维点与在所述当前三维点之前和之后距离为预设步长的三维点之间的深度差，并且获取所述深度差之和；

将具有最大深度差之和的三维点作为所述每一条扫描线上的候选书脊线点；

基于从多条扫描线获取的所述候选书脊线点拟合出所述书籍的书脊线。

9.根据权利要求2，3或8所述的方法，其中，所述拟合采用RANSAC方法。

10.一种用于在文档图像中提取文档边界的装置，包括：

基准平面的深度获取单元，用于获取基准平面的深度；

文档图像获取单元，用于获取放置在所述基准平面上的文档的文档图像；

文档图像的三维点的深度获取单元，用于获取所述文档图像的三维点的深度；以及

边界提取单元，用于基于所述基准平面的深度以及所述文档图像的三维点的深度在所述文档图像中提取文档的边界。

完整全部详细技术资料下载

当前第2页1 2 3