一种基于图像文字识别的商品推送方法和装置的制作方法

文档序号:6374586阅读:144来源:国知局
专利名称:一种基于图像文字识别的商品推送方法和装置的制作方法
一种基于图像文字识别的商品推送方法和装置
技术领域
本发明涉及计算机应用技术领域,特别涉及一种基于图像文字识别的商品推送方法和装置。
背景技术
随着移动互联网的迅速发展,基于移动终端摄像头采集到的图像的应用越来越广泛。其中图像文字识别技术将图像中的文字进行识别,转换为文本文字,从而减轻了用户输入对应文字信息的负担,方便用户存储、编辑对应的文字信息。在实际应用过程中存在如下情况,用户看到某个商品后想查询该商品的相关信息,例如商品用途、厂家、价格、哪里有售等等,现有的方式就是用户通过搜索引擎手工输入商品名称等作为query,并从大量搜索结果中找寻想要的商品信息,显然这种方式操作十分繁琐,需要大量的手工操作。

发明内容有鉴于此,本发明提供了一种基于图像文字识别的商品推送方法和装置,以便于减少用户获得商品信息的操作,实现更加方便。具体技术方案如下一种基于图像文字识别的商品推送方法,该方法包括SI、获取待识别图像中的文字区域;S2、对所述文字区域进行文字识别;S3、利用识别结果查询商品库获得识别结果对应的商品信息;S4、推送包含所述商品信息的商品查询列表。根据本发明一优选实施例,所述步骤SI具体包括服务器接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,服务器接收移动终端从待识别图像中提取并发送来的文字区域。根据本发明一优选实施例,所述步骤S2具体包括对文字区域进行二值化;对二值化后的文字区域分割为各字块;提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果;按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。根据本发明一优选实施例,所述商品库包括一个以上类别的商品库;在所述步骤S3中查询所有商品库;或者,在所述步骤SI中还获取用户选择的个性化选项内容,在所述步骤S3中查询所述用户选择的个性化选项内容对应的商品库。
根据本发明一优选实施例,所述查询商品库获得识别结果对应的商品信息具体包括依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前nl个的商品信息包含在商品查询列表中,nl为预设的正整数;或者,依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数;或者,
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设的正整数。根据本发明一优选实施例,所述计算商品信息的选择权重包括根据商品信息被查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大;或者,利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。一种基于图像文字识别的商品推送装置,该装置包括区域获取单元,用于获取待识别图像中的文字区域;文字识别单元,用于对所述文字区域进行文字识别;商品查询单元,用于所述文字识别单元的识别结果查询商品库获得识别结果对应的商品信息;结果推送单元,用于推送包含所述商品信息的商品查询列表。根据本发明一优选实施例,所述区域获取单元接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,接收移动终端从待识别图像中提取并发送来的文字区域。根据本发明一优选实施例,所述文字识别单元具体执行对文字区域进行二值化,对二值化后的文字区域分割为各字块,提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。根据本发明一优选实施例,所述商品库包括一个以上类别的商品库;所述商品查询单元查询所有商品库;或者,所述区域获取单元还获取用户选择的个性化选项内容,所述商品查询单元查询所述用户选择的个性化选项内容对应的商品库。根据本发明一优选实施例,所述商品查询单元在查询商品库获得识别结果对应的商品信息时,具体依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前nl个的商品信息包含在商品查询列表中,nl为预设的正整数;或者,依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数;或者,依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设 的正整数。根据本发明一优选实施例,所述商品查询单元在计算商品信息的选择权重时,具体根据商品信息被查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大;或者,利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。由以上技术方案可以看出,本发明在图像文字识别的基础上,利用识别结果查询商品库获得识别结果对应的商品信息,并推送包含商品信息的商品查询列表,从而使得用户能够通过上传图像的方式直接获取到商品信息,而无需人工通过搜索引擎从大量的搜索结果中搜寻商品信息,大大减少了用户操作,实现更加方便。

图I为本发明实施例提供的基于图像文字识别的商品推送方法流程图;图2为本发明实施例提供的系统结构图;图3为本发明实施例提供的基于图像文字识别的商品推送装置结构图;图4和图5为本发明实施例提供的移动终端的两个展示效果示意图。
具体实施方式为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。实施例一、图I为本发明实施例提供的基于图像文字识别的商品推送方法流程图,如图I所示,该方法可以包括以下步骤步骤101 :获取待识别图像中的文字区域。
服务器获取移动终端发送来的包含文字信息的图像,该图像可以是移动终端拍摄到的原始图像,服务器在本步骤中提取待识别图像中的文字区域。或者,该图像可以是移动终端拍摄到原始图像并提取出待识别图像中的文字区域后,将待识别图像中的文字区域发送给服务器。在提取文字区域时可以采用现有的方式,去除图像背景后提取文字区域,可以采用但不限于以下方式方式一、首先根据彩色欧式距离进行彩色游程编码,然后进行颜色聚类,基于聚类结果进行文字层的生成和选择,例如保留面积大于一定值的连通域,基于连通域与各颜色聚类中心的欧式距离生成各图像层面,最后依据各图像层面的像素个数与该层分割阈值的像素个数的关系确定文字层面、噪声层面或背景层面,最后取出噪声层面和背景层面后就得到文字层面,即文字区域。方式二、选择大量的文字样本图像和不含文字的图片,使用canny算子提取这两类图片的边缘信息作为稀疏表示分类字典的训练样本;将两类训练样本输入分类稀疏表示字典训练算法得到文字稀疏表示分类字典和非文字稀疏表示分类字典;将待识别图像转为 灰度图像,使用canny算子提取灰度图像的边缘信息;利用基于分类字典的稀疏表示提取灰度图像边缘信息中的候选文字区域;在水平方向上和垂直方向上分别使用游程平滑算法将候选文字区域孤立的边缘连接为较大的区域,再进行投影分析找出相应的文字行,同时舍去候选文字区域中文字行以外的孤立边缘;将检测出的文字区域标识出来。如果移动终端进行文字区域的提取,则可以采用已有的文字区域提取软件或者手动的方式进行文字区域的提取。另外,本步骤中获取的文字区域可以是一个,也可以是两个以上。由于本步骤中的内容为现有技术,在此不再赘述。步骤102 :对文字区域进行文字识别。其中对文字区域进行文字识别的过程同样可以采用现有技术,即包括以下步骤对文字区域进行二值化;对二值化后的文字区域分割为各字块;提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合就得到文字区域的识别结果。另外,文字识别的方式多种多样,除了上述方式之外还可以采用其他任意能够实现文字识别的方式,具体不再赘述。步骤103 :利用识别结果查询商品库获得识别结果对应的商品信息。本步骤中查询的商品库可以是实体商品库,也可以是虚拟商品库,这些商品库可以是本地的商品库,也可以是网络的商品库,也可以是第三方开放了访问接口的商品库。实体商品库可以包含但不限于包含图书商品信息的图书商品库、包含食品商品信息的食品商品库、包含服装商品信息的服装商品库、包含药品信息的药品商品库等各实体类商品库。虚拟商品库可以包含但不限于包含电子图书商品信息的电子图书商品库、包含游戏点卡商品信息的游戏点卡商品库、包含应用软件商品信息的应用软件商品库、包含服务商品信息的服务商品库等虚拟类商品库。在查询实体商品库或虚拟商品库时,计算商品信息中文字内容与识别结果的文字匹配权重,该文字匹配权重取决于商品信息与识别结果之间的语义相似度,将文字匹配权重达到预设文字匹配权重阈值的商品信息作为查询结果。其中语义相似度的确定可以采用现有技术,目的是计算商品信息的文字内容和识别结果在语义上的相似程度,确定方法可以采用但不限于以下方式提取识别结果中的关键语义词汇,查询商品信息的文字内容,获得匹配成功的关键语义词汇文字个数,以该个数作为语义相似度的确定基础。匹配成功的关键语义词汇文字个数越大表示语义相似度越大,对应的文字匹配权重越大。另外,鉴于实体商品的特殊性,实体商品会存在图像,在查询实体商品库时还可以进一步计算待识别图像与商品库的商品信息中图像之间的图像匹配权重,该图像匹配权重取决于商品信息中图像与待识别图像之间的相似度。然后结合商品信息对应的文字匹配权重和图像匹配权重计算商品信息对应的查询权重。其中在计算商品信息对应的查询权重时,可以将文字匹配权重和图像匹配权重的乘积,或者求和作为对应的查询权重。上述商品信息中图像与待识别图像之间的相似度的确定也可以采用现有技术,可以采用但不限于该方法分别提取待识别图像与商品图像的颜色直方图,计算颜色直方图之间的欧式距离,基于该欧式距离确定两图像之间的相似度。欧式距离越小两图像之间的 相似度越大,对应的图像匹配权重越大。一种实现方式是,在查询了所有商品库后,将文字匹配权重排在前nl个的商品信息包含在商品查询列表中以供返回给移动终端。特殊地,其中对于实体商品的商品信息可以将查询权重排在前n2个的商品信息包含在商品查询列表中以供返回给移动终端。其中nl和η2为预设的正整数。另一种实现方式是,移动终端向用户提供个性化设置选项,在向服务器发送图像时同时发送用户选择的选项内容,服务器在本步骤中查询各类别的商品库时,仅查询用户选择的选项内容对应类别的商品库。然后将文字匹配权重排在前nl个的商品信息包含在商品查询列表中以供返回给移动终端。特殊地,其中对于实体商品的商品信息可以将查询权重排在前n2个的商品信息包含在商品查询列表中以供返回给移动终端。其中nl和n2为预设的正整数。举个例子,移动终端向用户提供实体商品、虚拟商品等个性化设置选项,或者更具体地提供图书商品、食品商品、服装商品、电子图书商品、游戏点卡商品、应用软件商品、月艮务商品等个性化设置选项,如果用户通过移动终端拍摄了一种食品包装的图像,可以选择食品商品这一选项,然后移动终端将图像和用户选择的选项内容发送给服务器,服务器在针对图像的文字识别结果查询商品库时,就可以仅查询食品商品库,将获得的查询结果生成商品查询列表,然后在步骤104中返回给移动终端。当然,用户也可以选择一个以上的选项。还存在一种实现方式,在查询商品库时,依旧查询所有商品库或者查询用户选择的选项内容对应类别的商品库,但在返回商品信息时结合商品信息的查询权重和选择权重计算各商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表供返回给移动终端,n3为预设的正整数。其中商品信息的选择权重可以采用但不限于以下方式确定其一、该商品信息被查询到的总次数,该总次数越大选择权重值越大,这里的总次数指的是被所有用户查询到的总次数。其二、利用商品信息被所有用户查询到的总次数确定该商品信息对应的商品权重,再利用商品信息所属类别的所有商品信息被当前用户查看(即将商品信息推送给移动终端后,用户会查看其中某些类别的商品信息,例如向用户推送了食品商品信息和服装商品信息,如果用户查看了其中的食品商品信息,则会更新食品商品信息被查看的次数,用于更新食品商品信息的用户个性化权重)的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。在得到商品信息的 选择权重后,可以利用商品信息的选择权重和查询权重的乘积得到商品信息的总权重,当然也可以采用求和等方式得到商品信息的总权重。另外,本步骤在查询商品库时可以基于识别结果的全部文字信息,也可以基于对识别结果进行切词后获得的关键意义文字信息。步骤104 向移动终端推送包含对应商品信息的商品查询列表。服务器将商品信息返回给移动终端后,用户就能够从移动终端的显示获取到对应的商品信息。并且,其中的商品信息可能是一种以上类别的,如果用户查看了其中某一个或几个类别,则会向服务器上报,由服务器更新各商品信息被所有用户查询的总次数,同时更新商品信息所属商品类别对应的选择。另外,除了将商品查询列表返回给移动终端之外,可以将识别结果同时返回给移动终端。以上是对本发明所提供的方法进行的描述,下面通过实施例二对本发明所提供的装置进行详细描述。为了方便理解首先对本发明上述方法所应用的系统进行描述,如图2所示,该系统由移动终端和服务器构成,其中移动终端可以将拍摄到的包含文字的图像作为待识别图像发送给服务器,由服务器从中提取文字区域,或者,移动终端将拍摄到的包含文字的图像作为待识别图像后,从中提取出文字区域,将该文字区域发送给服务器。之后服务器执行实施例一中所示流程,向移动终端返回商品查询列表。本发明下述实施例二所提供的装置设置在服务器中,用于完成实施例一中所示流程。实施例二、图3为本发明实施例二提供的图像文字识别的装置结构图,如图3所示,该装置包括区域获取单元301、文字识别单元302、商品查询单元303和结果推送单元304。首先,区域获取单元301获取待识别图像中的文字区域。此处,区域获取单元301接收移动终端发送来的待识别图像,从待识别图像中提取文字区域;或者,接收移动终端从待识别图像中提取并发送来的文字区域。在提取文字区域时,可以采用实施例一中步骤101中所述的两种方式,由于该部分内容为现有技术,在此不再详述。然后文字识别单元302对文字区域进行文字识别。具体的识别过程可以包括对文字区域进行二值化,对二值化后的文字区域分割为各字块,提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合得到文字区域的识别结果。商品查询单元303利用文字识别单元302的识别结果查询商品库获得识别结果对应的商品信息。由于本发明中涉及的商品库包括一个以上类别的商品库,即可以是一个类别的商品库,也可以是多个类别的商品库,因此商品查询单元303在查询商品库时可以执行以下中的任一种商品查询单元查询所有商品库;或者,区域获取单元还获取用户选择的个性化选项内容,商品查询单元查询用户选择的个性化选项内容对应的商品库。其中在查询商品库获得识别结果对应的商品信息时,可以采用以下实施方式第一种实施方式依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前nl个的商品信息包含在商品查询列表中,nl为预设的正整数。第二种实施方式依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品 信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数。第三种实施方式依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设的正整数。具体地,商品查询单元303在计算商品信息的选择权重时,可以具体采用以下方式方式一、根据商品信息被所有用户查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大。方式二、利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。最后,结果推送单元304推送包含商品信息的商品查询列表。也可以将识别结果同时返回给移动终端。将商品查询列表返回给移动终端后,用户就能够从移动终端的显示获取商品信息。并且,其中的商品信息可能是一种以上类别的,如果用户查看了其中某一个或几个类另IJ,则会向服务器上报,由商品查询单元303更新各商品信息被所有用户查询的总次数,同时更新商品信息所属商品类别对应的选择。通过本发明的上述方法和装置,用户能够通过上传图片的方式获得对应的商品信息,而无需手工通过搜索引擎的方式从大量搜索结果中获得商品信息,显然更加方便和省力。例如,用户通过移动终端拍摄到包含文字“千年一叹”的图像,将其发送给服务器后,服务器经过上述过程进行图像文字识别和查询商品库后,返回识别结果和商品查询列表,其中商品查询列表的展示方式在本发明中并不加以限制,可以采用任意方式,例如图4中所示的引用框的方式。再例如,用户通过移动终端拍摄到包含文字“天黑请闭眼”的图像,将其发送给服务器后,服务器经过上述过程进行图像文字识别和查询商品库后,返回的商品查询列表中包含多种类别的商品,其中各类别商品的展示方式在本发明中也不加以限制,例如图5中所示的采用标号的方式。以上所述仅为本发明的较佳实施例而已,并不用以 限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
权利要求
1.一种基于图像文字识别的商品推送方法,其特征在于,该方法包括 51、获取待识别图像中的文字区域; 52、对所述文字区域进行文字识别; 53、利用识别结果查询商品库获得识别结果对应的商品信息; 54、推送包含所述商品信息的商品查询列表。
2.根据权利要求I所述的方法,其特征在于,所述步骤SI具体包括 服务器接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者, 服务器接收移动终端从待识别图像中提取并发送来的文字区域。
3.根据权利要求I所述的方法,其特征在于,所述步骤S2具体包括 对文字区域进行二值化; 对二值化后的文字区域分割为各字块; 提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果; 按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
4.根据权利要求I所述的方法,其特征在于,所述商品库包括一个以上类别的商品库; 在所述步骤S3中查询所有商品库;或者, 在所述步骤SI中还获取用户选择的个性化选项内容,在所述步骤S3中查询所述用户选择的个性化选项内容对应的商品库。
5.根据权利要求4所述的方法,其特征在于,所述查询商品库获得识别结果对应的商品信息具体包括 依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前nl个的商品信息包含在商品查询列表中,nl为预设的正整数;或者, 依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数;或者, 依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设的正整数。
6.根据权利要求5所述的方法,其特征在于,所述计算商品信息的选择权重包括 根据商品信息被查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大;或者, 利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。
7.一种基于图像文字识别的商品推送装置,其特征在于,该装置包括 区域获取单元,用于获取待识别图像中的文字区域; 文字识别单元,用于对所述文字区域进行文字识别; 商品查询单元,用于所述文字识别单元的识别结果查询商品库获得识别结果对应的商品/[目息; 结果推送单元,用于推送包含所述商品信息的商品查询列表。
8.根据权利要求7所述的装置,其特征在于,所述区域获取单元接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,接收移动终端从待识别图像中提取并发送来的文字区域。
9.根据权利要求7所述的装置,其特征在于,所述文字识别单元具体执行对文字区域进行二值化,对二值化后的文字区域分割为各字块,提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
10.根据权利要求7所述的装置,其特征在于,所述商品库包括一个以上类别的商品库; 所述商品查询单元查询所有商品库;或者, 所述区域获取单元还获取用户选择的个性化选项内容,所述商品查询单元查询所述用户选择的个性化选项内容对应的商品库。
11.根据权利要求10所述的装置,其特征在于,所述商品查询单元在查询商品库获得识别结果对应的商品信息时,具体 依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前nl个的商品信息包含在商品查询列表中,nl为预设的正整数;或者, 依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数;或者, 依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设的正整数。
12.根据权利要求11所述的装置,其特征在于,所述商品查询单元在计算商品信息的选择权重时,具体 根据商品信息被查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大;或者, 利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用 商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。
全文摘要
本发明提供了一种基于图像文字识别的商品推送方法和装置,其中方法包括S1、获取待识别图像中的文字区域;S2、对所述文字区域进行文字识别;S3、利用识别结果查询商品库获得识别结果对应的商品信息;S4、推送包含所述商品信息的商品查询列表。通过本发明用户能够通过上传图像的方式直接获取到商品信息,而无需人工通过搜索引擎从大量的搜索结果中搜寻商品信息,大大减少了用户操作,实现更加方便。
文档编号G06F17/30GK102831200SQ20121027936
公开日2012年12月19日 申请日期2012年8月7日 优先权日2012年8月7日
发明者韩钧宇, 丁二锐, 吴中勤, 文林福 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1