一种检测商品模板失效的方法及装置制造方法

文档序号:6518399阅读:300来源:国知局
一种检测商品模板失效的方法及装置制造方法
【专利摘要】本发明实施例提供一种检测商品模板失效的方法及装置,用以解决现有技术中商品模板的失效检测方式效率低、精准性差的问题,导致线上商品的大面积下架的问题。该方法在待检测的网页中,识别出该网页包含的每个商品模板,根据该商品模板对应的检测参数,及在页面中获取的该模板对应位置包含的内容信息进行匹配,当匹配不成功时,确定该商品模板失效。本发明实施例还提供了一种检测商品模板失效的装置。由于在本发明实施例中针对商品模板对应的检测参数,及网页中该商品模板的位置包含的内容信息,对商品模板进行检测,以此来判断商品模板是否失效,从而实现了商品模板失效检测的自动化,提高了商品模板失效的检测效率及精确性。
【专利说明】一种检测商品模板失效的方法及装置
【技术领域】
[0001]本发明涉及电子商务【技术领域】,尤其涉及一种检测商品模板失效的方法及装置。【背景技术】
[0002]随着电商网站的不断发展,网络上充斥着海量的商品。用户在将商品的信息上传到网站中时,往往依赖于商品模板。商品模板可以有效的减少用户在进行商品信息录入时的工作量,避免用户的重复性操作。当一个域名下有多个商品模板时,商品模板的相关数据会成几何级数增长,因此做好商品模板的监控工作具有非常重要的意义。
[0003]现有技术中,工作人员会定期的对商品模板进行检测,通过人工方式判断商品模板是否失效。因为在商品模板的检测过程中完全依赖人工方式,并且检测的过程中工作量比较大,检测效率和正确性很大程度上依赖工作人员的熟练程度和工作经验,因为没办法保证检测的准确性,另外检测的效率也很低,没办法达到精准实时检测的目的。因此现有技术中的商品模板的失效检测方式效率低、精准性差,可能会因为商品模板检测的上述问题,导致线上商品的大面积下架。

【发明内容】

[0004]本发明实施例提供了一种检测商品模板失效的方法及装置,用以解决现有技术中商品模板的失效检测方式效率低、精准性差,可能会因为商品模板检测的上述问题,导致线上商品的大面积下架的问题。
[0005]本发明实施例提供了一种检测商品模板失效的方法,该方法包括:
[0006]获取待检测网页的统一资源定位符,识别该网页包含的每个商品模板;
[0007]针对识别出的每个商品模板,根据在网页中识别出该商品模板的位置,在该网页中的相应位置获取该网页包含的内容信息;
[0008]根据所述商品模板的标识信息,确定该商品模板的检测参数,并将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配;
[0009]当匹配成功时,确定该商品模板有效,否则,确定该商品模板失效。
[0010]较佳地,为了提高模板识别的效率,从而提高模板失效检测的效率。所述识别该网页包含的每个商品模板包括:
[0011]采用正则方法,识别该网页包含的每个商品模板。
[0012]较佳地,在检测重要商品模板失效时,为了能够降低用户的损失,提高商品模板的体验度,所述确定该商品模板失效后,所述方法还包括:
[0013]判断该失效的商品模板是否与重要商品模板库中的模板相同;
[0014]当失效的商品模板与重要商品模板库中的模板相同时,发出报警信息。
[0015]较佳地,为了有效的实现商品模板检测自动化,根据所述商品模块的标识信息,确定该商品模板的检测参数包括:
[0016]当根据所述商品模板的标识信息,确定该商品模板为标题模板时,确定该标题模板对应的检测参数为文字信息;
[0017]当根据所述商品模板的标识信息,确定该商品模板为价格模板时,确定该价格模板对应的检测参数为数字信息;
[0018]当根据所述商品模板的标识信息,确定该商品模板为图片模板时,确定该图片模板对应的检测参数为图片信息。
[0019]较佳地,为了有效的实现商品模板检测自动化,所述将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配,匹配成功包括:
[0020]当该商品模板为标题模板时,判断获取的该网页包含的内容信息中是否含有文字信息,当获取的该网页包含的内容信息中含有文字信息时,确定匹配成功;
[0021]当该商品模板为价格模板时,判断获取的该网页包含的内容信息中是否含有数字信息,当获取的该网页包含的内容信息中含有数字信息时,确定匹配成功;
[0022]当该商品模板为图片模板时,判断获取的该网页包含的内容信息中是否含有图片信息,当获取的该网页包含的内容信息中含有图片信息时,确定匹配成功。
[0023]本发明实施例提供了一种检测商品模板失效的装置,所述装置包括:
[0024]识别模块,用于获取待检测网页的统一资源定位符,识别该网页包含的每个商品模板;
[0025]获取模块,用于针对识别出的每个商品模板,根据在网页中识别出该商品模板的位置,在该网页中的相应位置获取该网页包含的内容信息;
[0026]匹配检测模块,用于根据所述商品模块的标识信息,确定并将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配;当匹配成功时,确定该商品模板有效,否则,确定该商品模板失效。
[0027]较佳地,为了提高模板识别的效率,从而提高模板失效检测的效率。所述识别模块,具体用于采用正则方法,识别该网页包含的每个商品模板。
[0028]较佳地,在检测重要商品模板失效时,为了能够降低用户的损失,提高商品模板的体验度,所述装置还包括:
[0029]告警模块,用于确定匹配检测模块检测商品模板失效后,判断该失效的商品模板是否与重要商品模板库中的模板相同;当失效的商品模板与重要商品模板库中的模板相同时,发出报警信息。
[0030]较佳地,为了有效的实现商品模板检测自动化,所述匹配检测模块,具体用于当根据所述商品模板的标识信息,确定该商品模板为标题模板时,确定该标题模板对应的检测参数为文字信息;当根据所述商品模板的标识信息,确定该商品模板为价格模板时,确定该价格模板对应的检测参数为数字信息;当根据所述商品模板的标识信息,确定该商品模板为图片模板时,确定该图片模板对应的检测参数为图片信息。
[0031]较佳地,为了有效的实现商品模板检测自动化,所述匹配检测模块,具体用于当该商品模板为标题模板时,判断获取的该网页包含的内容信息中是否含有文字信息,当获取的该网页包含的内容信息中含有文字信息时,确定匹配成功;当该商品模板为价格模板时,判断获取的该网页包含的内容信息中是否含有数字信息,当获取的该网页包含的内容信息中含有数字信息时,确定匹配成功;当该商品模板为图片模板时,判断获取的该网页包含的内容信息中是否含有图片信息,当获取的该网页包含的内容信息中含有图片信息时,确定匹配成功。
[0032]本发明实施例提供了一种检测商品模板失效的方法及装置,该方法在待检测的网页中,识别出该网页包含的每个商品模板,根据该商品模板对应的检测参数,及在页面中获取的该模板对应位置包含的内容信息进行匹配,当匹配不成功时,确定该商品模板失效。由于在本发明实施例中针对商品模板对应的检测参数,及网页中该商品模板的位置包含的内容信息,对商品模板进行检测,以此来判断商品模板是否失效,从而实现了商品模板失效检测的自动化,提高了商品模板失效的检测效率及精确性。
【专利附图】

【附图说明】
[0033]图1为本发明实施例提供的一种检测商品模板失效过程示意图;
[0034]图2为本发明实施例提供的进行检测的网页的URL集合的示意图;
[0035]图3为本发明实施例提供的针对某一网页进行商品模板失效检测的信息图;
[0036]图4A、图4B为本发明实施例提供的针对每个网页的商品模板进行测试后的测试结果示意图;
[0037]图4C为本发明实施例提供的检测商品模板失效的详细实施过程示意图;
[0038]图5为本发明实施例提供的一种检测商品模板失效的装置结构示意图。
【具体实施方式】
[0039]商品模板是使用在商品描述介绍中的模板,一般都是设计好后提供给用户使用的一大篇代码,也就是html代码。商品模板只显示在产品的介绍页面,无论什么用户都可以使用,没有限制。一般商品模板中包含的信息为展示信息、描述信息、邮资说明信息等。在网页中使用商品模板,一般是在网站中直接调用,在添加商品的时候,只要对商品模板中的内容进行相应的修改就可以,无需下载编辑,因此采用商品模板可以减少用户的工作量,提高用户信息发布的效率。
[0040]为了提闻商品|旲板失效的检测效率,提闻商品|旲板失效检测的精确性,避免商品模板失效检测的不及时性导致的线上商品的大面积下架问题,本发明实施例提供了一种检测商品模板失效的方法及装置。
[0041 ] 下面结合说明书附图,对本发明实施例进行详细说明。
[0042]图1为本发明实施例提供的一种检测商品模板失效过程示意图,该过程包括以下步骤:
[0043]SlOl:获取待检测网页的统一资源定位符URL,识别该网页包含的每个商品模板。
[0044]为了方便用户进行网页内容的编辑,网站一般会提供给用户很多商品模板,用户可以根据需要选择自身需要的商品模板。因此一般在网页中包含有多个商品模板,比如承载标题信息的标题模板,承载价格信息的价格模板,承载运费信息的运费模板、承载图片信息的图片模板,承载评价信息的评价模板等等。
[0045]在本发明实施例中对商品模板是否失效进行检测时,针对每个网页,首先识别出每个网页包含的每个商品模板,识别出的商品模板可能包括一个、几个、十几个不等,由网页呈现内容的多样性来决定。
[0046]S102:针对识别出的每个商品模板,根据在网页中识别出该商品模板的位置,在该网页中的相应位置获取该网页包含的内容信息。
[0047]当在网页中识别出网页包含的每个商品模板后,为了对商品模板是否失效进行检测,需要确定网页中该商品模板对应的位置的内容信息,是否与该商品模板对应的检测参数匹配。因此,在本发明实施例中需要针对识别出的每个商品模板的位置,在网页的相应位置获取该网页包含的内容信息。例如,在某一网页中共识别出三个模板分别为标题模板、价格模板和运费模板,识别出每个商品模板后,在网页中的相应位置获取该网页在每个相应位置包含的内容信息。
[0048]S103:针对在该网页中识别出的每个商品模板,根据所述商品模板的标识信息,确定该商品模板的检测参数。
[0049]S104:将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配,当匹配成功时,进行步骤S105,否则,进行步骤S106。
[0050]由于每个网页中包含多个商品模板,每个商品模板的类型不同,而不同的商品模板对应的匹配检测参数也不同。因此当识别出了商品模板和每个商品模板对应的内容信息时,为了检测商品模板是否失效,需要根据商品模板的检测参数来确定。
[0051]具体的,为了方便对每个商品模板进行检测,在本发明实施例中针对每个商品模板,设置了其对应的检测参数,具体的可以保存商品模板的标识信息与检测参数的对应关系。当在网页中识别出其包含的商品模板后,根据商品模板编写时的方法,可以确定商品模板的类型,从而可以确定每个商品模板的标识信息,根据该商品模板的标识信息,及保存的对应关系,可以确定该商标模板对应的检测参数。确定了商品模板的检测参数后,可以采用该检测参数与对应的内容信息进行匹配,根据检测参数与对应的内容信息是否匹配,确定该商品模板是否失效。
[0052]S105:确定该商品模板有效,之后进行步骤S107。
[0053]S106:确定该商品模板失效,之后进行步骤S107。
[0054]S107:判断该商品模板是否为该网页的待检测的最后一个商品模板,当判断结果为是时,进行步骤S108,否则,进行步骤S103。
[0055]S108:针对该网页的商品模板失效检测结束,检测下一网页的商品模板是否失效。
[0056]由于在本发明实施例中针对商品模板对应的检测参数,及网页中该商品模板的位置包含的内容信息,对商品模板进行检测,以此来判断商品模板是否失效,从而实现了商品模板失效检测的自动化,提高了商品模板失效的检测效率及精确性。
[0057]在对商品模板是否失效进行检测时,可以针对网站中的每个网页分别进行,但是网站中可能很多用户的网页都是基于相同的商品模板编辑的。因此为了减少商品模板失效检测的工作量,提高商品模板失效检测效率,在本发明实施例中选择具有代表性的网页作为检测的网页,将选择网页作为进行商品模板失效检测的基础,定期对选择网页的商品模板进行检测。
[0058]图2为本发明实施例提供的进行检测的网页的URL集合的示意图,图2中针对某一网站(测试集名)进行测试,在该网站中选择出了进行检测的网页,将待检测网页的URL输入到检测装置中,如图2所示。在具体进行检测时,可以根据需要对输入到检测装置中的网页的URL进行修改操作,或者可以进行删除、添加等操作。
[0059]确定了每个待检测的网页后,获取该网页的URL,采用正则方法或Xpach方法,匹配出该网页中包含的每个商品模板。采用正则方法或Xpach方法,在网页中匹配出商品模板的过程属于现有技术,在此不对该过程进行说明,相信本领域技术人员,可以根据本发明的描述,确定具体的实施方式。
[0060]针对每个待检测的网页,获取了该网页包含的每个商品模板后,首先根据每个商品模板的标识信息,确定每个商品模板对应的检测参数,然后再在该网页中获取该商品模板对应的内容信息。具体的,在网页中获取该商品模板对应的内容信息时,可以根据识别出的该商品模板的位置,在网页的对应位置获取该商品模板对应的内容信息。或者,获取了该网页包含的每个商品模板后,首先在该网页中获取该商品模板对应的内容信息,然后根据每个商品模板的标识信息,确定每个商品模板对应的检测参数。
[0061]在获取商品模板对应的检测参数和网页中的对应内容信息时,可以按照上述方式,不限定两者的获取顺序,只要在对商品模板是否失效进行检测之前,获取了检测参数和内容信息即可。
[0062]在对商品模板是否失效进行检测时,可能某一网页包含的商品模板很多,在每次进行检测时,可以针对每个商品模板都进行检测,也可以根据需要设置需要进行检测的商品模板,即在每次检测过程中,可以针对不同的商品模板分别进行检测。
[0063]图3为本发明实施例提供的针对某一网页进行商品模板失效检测的信息图,在该图3中针对待检测的网页,图3中的样例地址,在该待检测的网页中,检测该网页的商品模板包括:名称模板、价格模板、图片模板、导航模板1、2等,并且每个商品模板对应的检测参数如图3所示,名称模板对应的检测参数为名称(name)信息,价格模板对应的检测参数为价格(price)信息,图片模板对应的检测参数为图片(image)信息,导航模板对应的检测参数为导航(nav)信息等。并且在图3中针对该网页选择了名称模板、价格模板、图片模板、导航模板,即检测该网页中的名称模板、价格模板、图片模板、导航模板是否失效。
[0064]当确定了网页中的每个商品模板,针对每个商品模板,确定该商品模板对应的检测参数,为了有效的实现商品模板检测自动化,根据所述商品模板的标识信息,确定该商品模板的检测参数包括:
[0065]当根据所述商品模板的标识信息,确定该商品模板为标题模板时,确定该标题模板对应的检测参数为文字信息;
[0066]当根据所述商品模板的标识信息,确定该商品模板为价格模板时,确定该价格模板对应的检测参数为数字信息;
[0067]当根据所述商品模板的标识信息,确定该商品模板为图片模板时,确定该图片模板对应的检测参数为图片信息。
[0068]确定了商品模板的检测参数,并获取了网页中的对应内容信息后,将检测参数与网页中的对应内容信息进行匹配,根据是否匹配成功,以确定商品模板是否失效。具体的将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配,匹配成功包括:当该商品模板为标题模板时,判断获取的该网页包含的内容信息中是否含有文字信息,当获取的该网页包含的内容信息中含有文字信息时,确定匹配成功,该商品模板有效;当该商品模板为价格模板时,判断获取的该网页包含的内容信息中是否含有数字信息,当获取的该网页包含的内容信息中含有数字信息时,确定匹配成功,该商品模板有效;当该商品模板为图片模板时,判断获取的该网页包含的内容信息中是否含有图片信息,当获取的该网页包含的内容信息中含有图片信息时,确定匹配成功,该商品模板有效。
[0069]具体的,在本发明实施例中,当识别出该网页中包含标题模板时,该标题模板对应的检测参数为文字信息,因为作为标题应该是以文字的形式展示的,因此匹配该网页中的对应位置包含的内容信息是否包含文字信息,当该内容信息中包含文字信息时匹配成功,说明用户能够通过该标题模板进行信息的编辑,该标题模板有效。
[0070]而当识别出的商品模板为价格模板时,该价格模板对应的检测参数为数字信息,因为价格一般是以数字来表示的,因此匹配该网页中对应位置包含的内容信息是否包含数字信息,当该内容信息中包含数字信息时匹配成功,该价格模板有效。
[0071]而对于图片模板,用户一般在图片模板中编辑有图片信息,因此图片模板对应的检测参数为图片信息,匹配该网页中的对应位置的内容信息中是否包含有图片信息,当该内容信息中包含有图片信息时匹配成功,该图片模板有效。
[0072]采用上述方法,可以针对网页中识别出的每个商品模板进行检测。较佳地,在检测重要商品模板失效时,为了能够降低用户的损失,提高商品模板的体验度,所述确定该商品模板失效后,所述方法还包括:判断该失效的商品模板是否与重要商品模板库中的模板相同;当失效的商品模板与重要商品模板库中的模板相同时,发出报警信息。
[0073]即当检测某一商品模板失效时,判断该商品模板是否为重要模板,当该商品模板为重要模板时,发出报警信息,以提供管理员进行处理,避免线上商品下架。具体的,可以在检测装置中设置有重要商品模板库,在其中可以保存重要商品模板的信息,当检测到某一商品模板失效时,根据该重要商品模板库确定该失效商品模板是否为重要模板,从而确定是否报警。当该商品模板非重要模板时,在工作日志中记录该商品模板的失效信息,以便管理人员后期查阅。
[0074]图4A、图4B为本发明实施例提供的针对每个网页的商品模板进行测试后的测试结果示意图,在该图中显示了针对每个网页的商品模板进行检测时,是否检测到重要商品模板,针对重要商品模板是否发出了报警信息。例如图4A中在对前5个网页中的商品模板检测时,都检测到其中存在重要商品模板失效的问题,将鼠标移动到报警结果对应的图表处,会输出具体的哪个商品模板失效的信息,如图4B所示的导航模板2失效的显示信息。在图4A中后两个网页中不存在重要商品模板失效的问题,因此在报警结果栏显示的为“ X ”,并且根据操作栏中记录的“处理”字样可知,已经记录了该网页中每个商品模板的失效情况。
[0075]图4C为本发明实施例提供的检测商品模板失效的详细实施过程示意图,该过程包括以下步骤:
[0076]S401:获取待检测网页的统一资源定位符URL,识别该网页包含的每个商品模板。
[0077]S402:针对识别出的每个商品模板,根据在网页中识别出该商品模板的位置,在该网页中的相应位置获取该网页包含的内容信息。
[0078]S403:针对在该网页中识别出的每个商品模板,根据所述商品模板的标识信息,确定该商品模板的检测参数。
[0079]S404:将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配,当匹配成功时,进行步骤S405,否则,进行步骤S406。
[0080]S40 5:确定该商品模板有效。[0081]S406:确定该商品模板失效。
[0082]S407:判断该失效的商品模板是否与重要商品模板库中的模板相同,当判断结果为是时,进行步骤S408,否则,进行步骤S409。
[0083]S408:确定该商品模板为重要商品模板,发出报警信息。
[0084]S409:确定该商品模板非重要商品模板,记录该商品模板失效的信息。
[0085]由于在本发明实施例中针对商品模板对应的检测参数,及网页中该商品模板的位置包含的信息,对商品模板进行检测,以此来判断商品模板是否失效,从而实现了商品模板失效检测的自动化,提高了商品模板失效的检测效率及精确性。
[0086]图5为本发明实施例提供的一种检测商品模板失效的装置结构示意图,所述装置包括:
[0087]识别模块51,用于获取待检测网页的统一资源定位符,识别该网页包含的每个商品丰吴板;
[0088]获取模块52,用于针对识别出的每个商品模板,根据在网页中识别出该商品模板的位置,在该网页中的相应位置获取该网页包含的内容信息;
[0089]匹配检测模块53,用于根据所述商品模块的标识信息,确定并将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配;当匹配成功时,确定该商品模板有效,否则,确定该商品模板失效。
[0090]较佳地,为了提高模板识别的效率,从而提高模板失效检测的效率。所述识别模块51,具体用于采用正则方法,识别该网页包含的每个商品模板。
[0091]较佳地,在检测重要商品模板失效时,为了能够降低用户的损失,提高商品模板的体验度,所述装置还包括:
[0092]告警模块54,用于确定匹配检测模块检测商品模板失效后,判断该失效的商品模板是否与重要商品模板库中的模板相同;当失效的商品模板与重要商品模板库中的模板相同时,发出报警信息。
[0093]较佳地,为了有效的实现商品模板检测自动化,所述匹配检测模块53,具体用于当根据所述商品模板的标识信息,确定该商品模板为标题模板时,确定该标题模板对应的检测参数为文字信息;当根据所述商品模板的标识信息,确定该商品模板为价格模板时,确定该价格模板对应的检测参数为数字信息;当根据所述商品模板的标识信息,确定该商品模板为图片模板时,确定该图片模板对应的检测参数为图片信息。
[0094]较佳地,为了有效的实现商品模板检测自动化,所述匹配检测模块53,具体用于当该商品模板为标题模板时,判断获取的该网页包含的内容信息中是否含有文字信息,当获取的该网页包含的内容信息中含有文字信息时,确定匹配成功;当该商品模板为价格模板时,判断获取的该网页包含的内容信息中是否含有数字信息,当获取的该网页包含的内容信息中含有数字信息时,确定匹配成功;当该商品模板为图片模板时,判断获取的该网页包含的内容信息中是否含有图片信息,当获取的该网页包含的内容信息中含有图片信息时,确定匹配成功。
[0095]本发明实施例提供了一种检测商品模板失效的方法及装置,该方法在待检测的网页中,识别出该网页包含的每个商品模板,根据该商品模板对应的检测参数,及在页面中获取的该模板对应位置包含的内容信息进行匹配,当匹配不成功时,确定该商品模板失效。由于在本发明实施例中针对商品模板对应的检测参数,及网页中该商品模板的位置包含的内容信息,对商品模板进行检测,以此来判断商品模板是否失效,从而实现了商品模板失效检测的自动化,提高了商品模板失效的检测效率及精确性。
[0096]本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0097]本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0098]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0099]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0100]尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
[0101]显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
【权利要求】
1.一种检测商品模板失效的方法,其特征在于,该方法包括: 获取待检测网页的统一资源定位符,识别该网页包含的每个商品模板; 针对识别出的每个商品模板,根据在网页中识别出该商品模板的位置,在该网页中的相应位置获取该网页包含的内容信息; 根据所述商品模板的标识信息,确定该商品模板的检测参数,并将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配; 当匹配成功时,确定该商品模板有效,否则,确定该商品模板失效。
2.如权利要求1所述的方法,其特征在于,所述识别该网页包含的每个商品模板包括: 采用正则方法,识别该网页包含的每个商品模板。
3.如权利要求1所述的方法,其特征在于,所述确定该商品模板失效后,所述方法还包括: 判断该失效的商品模板是否与重要商品模板库中的模板相同; 当失效的商品模板与重要商品模板库中的模板相同时,发出报警信息。
4.如权利要求1所述的方法,其特征在于,根据所述商品模块的标识信息,确定该商品模板的检测参数包括: 当根据所述商品模板的标识信息,确定该商品模板为标题模板时,确定该标题模板对应的检测参数为文字信息; 当根据所述商品模板的标识信息,确定该商品模板为价格模板时,确定该价格模板对应的检测参数为数字信息; 当根据所述商品模板的标识信息,确定该商品模板为图片模板时,确定该图片模板对应的检测参数为图片信息。
5.如权利要求1所述的方法,其特征在于,所述将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配,匹配成功包括: 当该商品模板为标题模板时,判断获取的该网页包含的内容信息中是否含有文字信息,当获取的该网页包含的内容信息中含有文字信息时,确定匹配成功; 当该商品模板为价格模板时,判断获取的该网页包含的内容信息中是否含有数字信息,当获取的该网页包含的内容信息中含有数字信息时,确定匹配成功; 当该商品模板为图片模板时,判断获取的该网页包含的内容信息中是否含有图片信息,当获取的该网页包含的内容信息中含有图片信息时,确定匹配成功。
6.一种检测商品模板失效的装置,其特征在于,所述装置包括: 识别模块,用于获取待检测网页的统一资源定位符,识别该网页包含的每个商品模板; 获取模块,用于针对识别出的每个商品模板,根据在网页中识别出该商品模板的位置,在该网页中的相应位置获取该网页包含的内容信息; 匹配检测模块,用于根据所述商品模块的标识信息,确定并将该商品模板的检测参数与获取的该网页包含的内容信息进行匹配;当匹配成功时,确定该商品模板有效,否则,确定该商品模板失效。
7.如权利要求6所述的装置,其特征在于,所述识别模块,具体用于采用正则方法,识别该网页包含的每个商品模板。
8.如权利要求6所述的装置,其特征在于,所述装置还包括: 告警模块,用于确定匹配检测模块检测商品模板失效后,判断该失效的商品模板是否与重要商品模板库中的模板相同;当失效的商品模板与重要商品模板库中的模板相同时,发出报警信息。
9.如权利要求6所述的装置,其特征在于,所述匹配检测模块,具体用于当根据所述商品模板的标识信息,确定该商品模板为标题模板时,确定该标题模板对应的检测参数为文字信息;当根据所述商品模板的标识信息,确定该商品模板为价格模板时,确定该价格模板对应的检测参数为数字信息;当根据所述商品模板的标识信息,确定该商品模板为图片模板时,确定该图片模板对应的检测参数为图片信息。
10.如权利要求6所述的装置,其特征在于,所述匹配检测模块,具体用于当该商品模板为标题模板时,判断获取的该网页包含的内容信息中是否含有文字信息,当获取的该网页包含的内容信息中含有文字信息时,确定匹配成功;当该商品模板为价格模板时,判断获取的该网页包 含的内容信息中是否含有数字信息,当获取的该网页包含的内容信息中含有数字信息时,确定匹配成功;当该商品模板为图片模板时,判断获取的该网页包含的内容信息中是否含有图片信息,当获取的该网页包含的内容信息中含有图片信息时,确定匹配成功。
【文档编号】G06F17/30GK103593429SQ201310553137
【公开日】2014年2月19日 申请日期:2013年11月7日 优先权日:2013年11月7日
【发明者】周雷, 姜鑫, 高扬, 牛杏媛, 史雯缤 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1