一种信息搜索的方法和装置的制造方法

文档序号：9217209阅读：760来源：国知局

一种信息搜索的方法和装置的制造方法
【专利说明】
[0001]【技术领域】
[0002]本申请涉及计算机应用技术领域，特别涉及一种信息搜索的方法和装置。
[0003]【【背景技术】】
[0004]随着互联网技术的迅猛发展，网络搜索已经逐渐成为人们最常使用的信息获取方式之一。然而，传统PC上的搜索操作借助鼠标和键盘很容易实现，但在诸如智能手机、PDA、平板电脑等智能设备上实现一个搜索过程相对困难很多，选择搜索框并输入文字变得很繁琐且效率低下。因此语音输入法成为目前的一个流行方式，但语音识别准确率有限，在一些公共的场合用户也可能不愿意在人群中自言自语。
[0005]【
【发明内容】
】
[0006]有鉴于此，本申请提供了一种信息搜索的方法和装置，以便于简化用户操作，提高搜索效率。
[0007]具体技术方案如下:
[0008]本申请提供了一种信息搜索的方法，该方法包括:
[0009]启动包含定位标志的拍摄预览界面；
[0010]获取用户拍摄的图像；
[0011]确定利用定位标志从用户拍摄的图像中提取的目标文字区域；
[0012]确定对目标文字区域进行文字识别后的识别结果；
[0013]获取利用所述识别结果进行搜索的搜索结果。
[0014]根据本申请一优选实施方式，所述包含定位标志的拍摄预览界面采用在拍摄界面上叠加绘制有定位标志的画布界面的方式形成。
[0015]根据本申请一优选实施方式，所述确定利用定位标志从用户拍摄的图像中提取的目标文字区域包括:
[0016]利用定位标志从用户拍摄的图像中提取目标文字区域；或者，
[0017]将所述用户拍摄的图像和定位标志的位置发送给服务器端，接收服务器端利用定位标志从用户拍摄的图像中提取目标文字区域后返回的提取结果。
[0018]根据本申请一优选实施方式，所述利用定位标志从用户拍摄的图像中提取目标文字区域包括:
[0019]利用定位标志的位置获取子图像；
[0020]对所述子图像进行二值化处理；
[0021]将二值化处理后的子图像进行横向投影确定子图像内的各文字行区域，并利用所述定位标志的位置确定目标文字行区域；
[0022]将目标文字行区域进行纵向投影确定目标文字行区域内的各文字区域，并利用所述定位标志的位置确定目标文字区域。
[0023]根据本申请一优选实施方式，如果所述定位标志为横线，则所述利用定位标志的位置获取子图像包括:从横线位置开始向上下分别扩展N像素作为子图像的上下边界；将整个图像的宽度作为子图像的宽度，或者将横线的左端点向左扩展M个像素作为子图像的左边界，将横线的右端点向右扩展M个像素作为子图像的右边界，所述N和M为预设的正整数。
[0024]根据本申请一优选实施方式，如果所述定位标志为方框，则所述利用定位标志的位置获取子图像包括:将方框内的图像作为子图像。
[0025]根据本申请一优选实施方式，所述将二值化处理后的子图像进行横向投影确定子图像内的各文字行区域包括:将二值化处理后的子图像进行横向投影后，将横向投影值的低谷值点作为各文字行区域的分割处；
[0026]所述将目标文字行区域进行纵向投影确定目标文字行区域内的各文字区域包括:将目标文字行区域进行纵向投影后，将纵向投影值的低谷值点作为各文字区域的分割处。
[0027]根据本申请一优选实施方式，如果所述定位标志为横线，则利用所述定位标志的位置确定目标文字行区域包括:将横线在横向上的位置所落的文字行区域作为目标文字行区域。
[0028]根据本申请一优选实施方式，如果所述定位标志为方框，则利用所述定位标志的位置确定目标文字行区域包括:
[0029]将完整落在方框上下边界内的文字行区域作为目标文字行区域；或者，
[0030]将方框上下边界在横向上的位置所落的文字行区域以及完整落在方框上下边界内的文字行区域作为目标文字行区域；或者，
[0031]将靠近方框内部中间位置的文字行区域作为目标文字行区域。
[0032]根据本申请一优选实施方式，如果所述定位标志为横线，则利用所述定位标志的位置确定目标文字区域包括:将横线在纵向上的位置所落的文字区域作为目标文字区域。
[0033]根据本申请一优选实施方式，如果所述定位标志为方框，则利用所述定位标志的位置确定目标文字区域包括:将完整落在方框左右边界内的文字区域作为目标文字区域；或者，
[0034]将方框左右边界在纵向上的位置所落的文字区域以及完整落在方框左右边界内的文字区域作为目标文字区域。
[0035]根据本申请一优选实施方式，利用所述识别结果进行搜索包括:
[0036]将识别出的目标文字作为搜索词进行搜索；或者，
[0037]从识别出的目标文字中提取关键词，将提取的关键词作为搜索词进行搜索。
[0038]本发明本申请还提供了一种信息搜索的装置，该装置包括:
[0039]拍摄启动单元,启动包含定位标志的拍摄预览界面；
[0040]图像获取单元，通过所述拍摄预览界面获取用户拍摄的图像；
[0041]区域提取单元，确定利用所述定位标志从所述用户拍摄的图像中提取的目标文字区域；
[0042]文字识别单元，确定对所述目标文字区域进行文字识别后的识别结果；
[0043]结果获取单元，获取利用所述识别结果进行搜索的搜索结果。
[0044]根据本申请一优选实施方式，所述拍摄启动单元，在拍摄预览界面上叠加绘制有定位标志的画布界面。
[0045]根据本申请一优选实施方式，所述区域提取单元具体包括:
[0046]子图像获取子单元，利用定位标志的位置获取子图像；
[0047]二值化处理子单元，对所述子图像进行二值化处理；
[0048]文字行区域确定子单元，将二值化处理后的子图像进行横向投影确定子图像内的各文字行区域，并利用所述定位标志的位置确定目标文字行区域；
[0049]文字区域确定子单元，将目标文字行区域进行纵向投影确定目标文字行区域内的各文字区域，并利用所述定位标志的位置确定目标文字区域。
[0050]由以上技术方案可以看出，在本申请中采用定位标识和文字识别技术，能够将用户拍摄的感兴趣的文本自动识别后进行搜索，无需用户手工输入文本，简化了用户操作也提高了搜索效率，带来了更好的用户体验。
[0051]【【附图说明】】
[0052]图1为本申请实施例一提供的信息搜索方法的流程图；
[0053]图2为本申请实施例二提供的信息搜索方法的流程图；
[0054]图3a为实施例二提供的一个拍摄预览界面示意图；
[0055]图3b为由图3a所示拍摄预览界面所获取图像的子图像示意图；
[0056]图3c为由图3a所不拍摄预览界面所获取图像的另一个子图像不意图；
[0057]图3d为由图3c所示子图像确定出的目标文字行区域示意图；
[0058]图3e为由图3c所示子图像确定出的目标文字区域示意图；
[0059]图4为本申请实施例三提供的信息搜索方法的流程图；
[0060]图5a为本申请实施例三提供的一个拍摄预览界面示意图；
[0061]图5b为由图5a所示拍摄预览界面所获取图像的子图像示意图；
[0062]图5c为由图5b所示子图像确定出的目标文字行区域示意图；
[0063]图5d为由图5b所不子图像确定出的目标文字区域不意图；
[0064]图6为本申请实施例四提供的装置结构图。
[0065]【【具体实施方式】】
[0066]为了使本申请的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本申请进行详细描述。
[0067]鉴于视觉识别技术的不断发展，在此搜索技术也能够基于视觉识别来实现，本申请在搜索技术中引入视觉识别，通过文字识别技术从用户所拍摄图片中的文本中提取目标文字，从而实现基于该目标文字的搜索。本申请提供的方法和装置在具有内置摄像头的智能设备中实现。下面通过几个实施例对本申请提供的方法进行详细描述。
[0068]实施例一、
[0069]图1为本申请实施例一提供的信息搜索方法的流程图，如图1中所示，该方法可以包括以下步骤:
[0070]步骤101:启动包含定位标志的拍摄预览界面。
[0071]当本申请实施例提供的方法被触发时，开始执行本步骤。通常情况下，本申请实施例提供的方法以智能设备中的APP或者客户端的运行来实现，当该APP或者客户端被用户打开时，触发该方法的执行，或者当该APP或者客户端被用户打开并点击该APP或客户端上的某个功能按钮时，触发该方法的执行。即启动智能设备的摄像头，在拍摄预览界面中包含有定位标志。
[0072]该定位标志可以采用在拍摄预览界面上叠加绘制有定位标志的画布界面来形成，其中定位标志可以采用但不限于:直线段、波浪线、特殊标志串、

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杜志军;张宇;王卫星;秦剑;
技术所有人：阿里巴巴集团控股有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。