一种商品名称和型号智能识别系统及方法

文档序号:6365313阅读:1317来源:国知局
专利名称:一种商品名称和型号智能识别系统及方法
技术领域
本发明涉及商品名称和型号智能识别系统和方法,尤其是在电子商务领域自动识别商品名称和型号的智能信息处理技术的系统及方法。
背景技术
现在互联网已经成为人们购物及企业销售的重要途径,提供网上商品销售服务的网站也非常的多。而针对购物的应用工具也逐渐增多,比如针对购物的购物搜索、LBS等。 然而因为商家对商品的标题描述的不一致,导致计算机对商品的后续处理变得很难,比如对同一款液晶显示器,可能的商品名描述为1)情人节礼物超大液晶显示器;2)超薄超宽彩色液晶显示器送耳机。针对目前状况,本发明采用人工智能的方式,对系统加以训练后, 能够自动识别商品的名称和型号,能有效的解决因商品名称不规范而导致计算机很难对商品数据做后续处理的技术问题。

发明内容
本发明提供一种商品名称和型号智能识别方法,根据互联网电商提供的商品名称、分类信息,自动识别出商品的名称及型号,实现对商品的准确标识。
本发明的技术方案是一种商品名称和型号智能识别系统,它包括知识数据库、学习系统和识别系统。知识数据库是一个数据库系统,存储了特征关键词,及特征关键词与商品的对应关系。学习系统由一台或多台计算机组成,其连接知识数据库,通过人工识别的方法来增加知识数据库中特征关键词及模式规则内容,提高识别系统的自动识别的能力。识别系统由一台或多台计算机组成,其连接知识数据库和待识别的商品数据库, 它通过提起取商品的特征关键词集合,结合知识数据库的规则,准确识别出商品的名称和型号,对识别失败的,需要推送该商品到学习系统。
一种商品名称和型号智能识别系统及方法,它包括以下步骤a)学习系统从商品数据库中读入一个商品,并根据知识数据库中的特征词字典对商品原始标题、类别、品牌进行拆词,形成以特征词为基础的一个集合。b)通过人工方式,对商品和型号名称标识,I)回写入商品数据库,2)并检查该商品名为一个新的特征词,如果是,则回写入知识数据库中,3)检查新的特征词集合是否为新的规则,如果是,则写入知识库数据库中。c)识别系统,从商品数据库中读入待识别的商品,并以知识数据库中特征词为基础对商品的标题、类别、品牌拆词,形成一个特征词的集合。d)根据商品的特征词集合,总知识数据库中读取规则,根据规则中定义的商品名及型号对该商品重新命名。
识别流程见图2,1)根据商品的原始标题、分类和品牌,构建商品的特征词集合
2)检查特征词集合是否为空,如果为空,则无法识别
3)如果特征词集合不为空,则从知识数据库中根据特征词集合读取规则,如果读取成功,则识别成功,否则
4)根据特征词的创建时间,去除一个最近创建的特征词,重复步骤2),直到无法识别或识别成功e)把新的商品名和型号写回商品数据库,如果识别失败的,则标识该商品需要学习系统人工处理并帮助系统建立新的规则。
本发明的有益效果通过本发明,系统能够通过学习,可以准确识别商品的名称和型号,为互联网电子商务的应用开发提供更有利的数据基础。比如为购物搜索引擎提供更加准确的搜索结果。


图I是本发明的系统结构2是本发明的系统中识别系统的流程图具体实施方法实施例一下面结合图2和实施例对本发明进一步说明。I)现有四个商品A 耳机”,商品B 手机”,商品C 无线耳机”;商品D 智能手机,,2)通过学习系统,人工处理商品A和商品B,商品A :耳机,学习系统创建特征词耳机,及规则[耳机]_>耳机;商品B :手机,学习系统创建特征词手机,及规则[手机]手机。3)系统看是自动处理商品C和商品D,处理商品C的特征词集合为[耳机],从知识数据库中提取特征词集合[耳机]的对应规则为耳机,则标识商品名为耳机;商品D的特征词集合为[手机],从知识数据库中提取特征词集合[手机]的对应规则为手机,则标识商品名为手机。实施例二 现以购物搜索为例,背景,用户输入某个关键词比如耳机,他/她的真实愿望是能搜索到所有的耳机,而当使用全文搜索引擎是,对两个商品1)耳机,2)手机送耳机,都会成为关键结果,但是如何把这两个商品区分开,给用户一个准确结果和相关结果?根据本专利技术,第I)商品会被识别成真正的“耳机”,而第2)商品会被识别而为手机。最终搜索出现两个结果,但第I)商品名识别为“耳机”为准确结果,而第2)商品虽然也被搜索到了,但因为识别后的商品名不是“耳机”,因此作为相关结果显示给用户。本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
权利要求
1.一种互联网上商品名称和型号智能识别系统及方法,其特征在于它包括一个知识数据库,用于存储特征词和以特征词为基础的规则表;学习系统以真实商品为基础,建立新的特征词和规则;识别系统提取商品的特征词集合,并根据特征词提取规则以识别商品的名称与型号。
2.如权利要求I所述的商品名称和型号智能识别系统及方法,其特征在于它包括一个商品数据库,用于存储待识别和识别后的商品参数。
3.如权利要求I所述的商品名称和型号智能识别系统及方法,其特征在于学习系统会创建新的特征词和特征词集合的规则,并把新的特征词和创建时间存入知识库。
4.如权利要求I所述的商品名称和型号智能识别系统及方法,其特征在于特征词集合是根据原始商品名称、分类和品牌参数中的特征词组成的。
5.如权利要求I所述的商品名称和型号智能识别系统及方法,其特征在于商品识别是根据商品特征词集合,从知识数据库中查找该集合的规则,以此确定商品名称及型号。
6.如权利要求5所述的商品名称和型号智能识别系统及方法,其特征在于其识别的步骤为1)根据特征词集合,从知识数据库中查找规则2)如果查找失败,去除最近创建的特征词,并继续查找,直到集合为空或查找到相应规则为止。
全文摘要
一种商品名称和型号智能识别系统及方法,它包括一个知识数据库、学习系统和识别系统。针对目前电子商务中对商品命名不规范,导致计算机很难做后续处理。本发明能够在人工训练的基础上,自动识别商品的名称与型号,为购物搜索以及其他以商品名和型号为基础的应用提供数据准备基础。
文档编号G06F17/30GK102609853SQ20121004425
公开日2012年7月25日 申请日期2012年2月27日 优先权日2012年2月27日
发明者吴俊 , 吴娟, 吴敏, 蒋永 申请人:吴俊 , 吴娟, 吴敏, 蒋永
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1