一种产品情报的在线检索和智能分析方法与系统的制作方法

文档序号:6482504阅读:163来源:国知局
专利名称:一种产品情报的在线检索和智能分析方法与系统的制作方法
技术领域
电子商务 背景技术
本专利相关的方法与各种搜索引擎的不同之处在于搜索引擎是基于关键词提供 相关链接或参考信息,而本专利所公开的方法和系统提供的是经过业务分析的产品情报。实现方法和应用技术方面,就发明者所能访问的文献和互联网资源,仅有部分发 明人在另一种应用领域的专利申请“一种在线检索和智能分析产品情报的方法和系统”。而 该专利面向的是政府部门,目的是维护互联网秩序的违规产品判断;本专利面向的是企业, 目的是与市场相关的产品情报。搜索引擎由搜索系统、索引系统和检索系统构成。就搜索系统而言,本专利所采用 的搜索流程和搜索源是一种异构的,由电子商务门户、搜索引擎、专业电子商务网站组合成 的元搜索。本专利搜索结果的排序不以“被链接率”或“点击率”来判断优先级排序,不以 标题、网址、标记、检索词出现频率和位置等来排序,而是根据是否与市场竞争和企业经营 有关,来组织输出结果。语义分析技术方面,尽管语义技术在信息检索、互联网搜索引擎、电子商务产品比 价、在线数据挖掘等领域开展了很多研究和尝试,有了良好的技术成果和应用效果。然而, 现有的主流搜索引擎并没有系统使用语义技术与方法,搜索结果的精确度和完整性不能满 足在线产品的监测和统计。本专利采用的互联网产品信息分析方法,不仅可以解析网页结 构以解决网页的异构性,还可以解析产品各种属性来解决不同类型产品的异构性,并且判 断是否与市场竞争和企业经营有关。4、专利目的本专利所公开的产品在线情报检索与分析方法,利用元搜索技术检索互联网,利 用语义推理分析产品情报,利用精确、直观的表格,为企业和政府部门提供与市场竞争和企 业经营有关的产品情报服务。

发明内容
7. 1产品情报检索原理如图1和图2所示,本专利所公开的基于语义的在线产品情报检索、抽取和智能分 析方法,采用元搜索引擎思想,利用语义技术对各种电子商务网站、现有搜索引擎所提供的 产品信息进行有效地抽取、转化、汇集、筛选、排序、索引和展现。本专利所公开的语义分析方法,对在线产品信息进行了细粒度的解析和抽取,包 括产品的名称、价格、型号、品牌、产地、图片、性能指标等信息,极大地提高了收集信息的质 量和查询的准确性。系统检索还支持逻辑匹配检索(如AND和OR逻辑组合、*通配符、+ 和-词选项)和短语检索,部分具备了中文自然语言理解能力。专利设计和构建了通用的 在线产品语义字典,被应用于网页信息提取和和户检索语句的分析。语义字典引入本体论 的方法,使用较成熟的Prot6g6和Jena等工具来构建和维护在线产品的本体,从本体即可
3自动生成相应的语义字典。采用基于语义的在线产品信息智能分析和抽取方法,将特定产品的信息从各种网 页上经分析以结构化方式存储至数据库后。当用户输入多种检索条件时,需要对检索结果 集合进行排序。本专利的实现系统建立了有效的索引机制来提高数据库访问效率和减少查询响 应时间(如图1的情报网数据库)。系统采用数据仓库技术,通过多维数据模型提供所需的 汇总信息,并且具有Drill-down和Roll-up的功能。7. 2情报系统工作流程本专利工作流程如图3和图4所示。专利系统输入为产品相关参数,包括产品中 英文产品名称、商标、价格区间、产品类型、规格、计量单位、产地和生产厂家等。对于特殊产 品,还包括其特殊属性。例如医药类产品包括批准文号和通用名称等。这些特殊属性会根 据用户所选择的产品类型动态生成。专利系统的输出为与市场竞争和企业经营有关的产品情报。具体工作流程如下(1)用户利用分配的账号密码进行登录;(2)点击产品情报功能菜单;(3)输入检索产品参数,并提交;(4)系统执行搜索和语义分析;(5)输出符合检索条件的产品报表。7. 3产品信息元搜索流程(1)用户输入产品的名称、生产厂家、价格等产品属性参数;(2)系统根据输入的产品属性参数,首先在产品索引数据库中搜索,利用属性语义 和属性关联权重矩阵得到匹配项;(3)系统根据输入的产品属性参数,利用语义字典产生若干关键词对搜索引擎、电 子商务大全、比价网站等执行元搜索,对新发现的相关网页进行结构分析、语义分析,并将 网页中产品详细信息以结构化的方式存储到数据库,并建立相关的索引。7. 4产品情报智能抽取和分析流程网页信息智能抽取和判断流程如下(1)借助语义字典,对返回页面进行解析;(2)抽取在线产品信息并存入数据库;(3)将存入数据库的产品信息和产品市场经营相关关键词进行比对,比对过程中, 考虑产品不同属性权重进行分类;(4)周期地更新数据仓库;7. 5系统基本模块设计本专利的系统实现架构如图5所示。其中,系统的子系统模块如图6所示登录模块处理用户登录和系统初始化工作,包括对系统参数赋初值,启动数据库 连接池、语义字典和日志功能模块;参数预处理模块对输入的产品参数进行预处理;产品情报元搜索基于正则表达式对传统搜索引擎、电子商务网站、论坛等进行调
4用;产品情报语义分析模块对搜索到的结果进行语义分析,并且判断其与业务经营 和市场竞争的关联性。产品情报报表模块组织报表,展示结果。6、专利效果(1)受益用户本专利的用户为企业、政府部门和个人。(2)功能特征产品在线情报检索与分析方法,利用元搜索技术检索互联网,利用 语义推理分析产品情报,利用精确、直观的表格,为企业和政府部门提供与市场竞争和企业 经营有关的产品情报服务。(3)技术指标情报覆盖率可达整个互联网。情报精确度产品情报的精确度可以达到50%以上。计算能力可以实时响应用户大规模并发操作,每隔两周更新系统所跟踪的网站 fn息o用户要求用户只需使用当前主流的浏览器都可以正常登录和使用本系统,对于 用户带宽没有特殊要求。可靠性作为第一个版本,系统可以保障7X24小时中,95%以上时间运行正常。安全性本系统采用主机托管的服务方式,服务器主机位于电信级机房中,拥有完 善的安全防范措施,系统能够全天候的正常稳定的工作。


附图1是本专利的基本原理图附图2是本专利的功能模块图附图3是本专利的操作流程图附图4是本专利的输入输出图附图5是本专利的技术架构图附图6是本专利的系统模块图附图7是本专利实施例中的产品情报语义字典结构附图8是本专利实施例中的产品情报网功能结构图附图9是本专利实施例中的产品情报网的首页界面
10具体实施例方式基于本专利所描述方法所实现的系统是产品智能情报网(www, onlinefbi.com,如 图9所示)。10. 1系统操作场景如图9所示,(1)用户利用分配的账号密码进行登录;(2)点击产品情报功能菜单;(3)输入检索产品参数并提交;
(4)系统执行搜索和语义分析;(5)输出符合检索条件的产品报表。10. 2系统输入输出专利系统输入为产品相关属性参数,包括待检索产品情报的中英文产品名称、商 标、价格区间、产品类型、规格、计量单位、产地和生产厂家等。对于特殊产品,还包括其特殊 属性。例如医药类产品包括批准文号和通用名称等。专利系统的输出为产品情报报表和来 源。10. 3系统功能结构如图8及表1所示,产品情报系统既可以提供给用户特定产品及时、准确、直观的 检索结果,用户也可以通过设定产品参数、电子邮件、报告时间和频率,后台定时按设定的 参数以电子邮件方式将结果报表发送给用户。表1.系统所提供的功能 10. 4智能分析和判断网页信息智能分析、抽取和判断流程如下(1)通过产品情报语义字典,对返回页面进行解析;(2)抽取产品相关详细信息并存入数据库;(3)将存入索引数据库的产品信息进行分类;(4)周期地更新数据仓库;(5)定期检查产品信息来源网页是否可以正常访问。10. 5语义元搜索流程智能搜索流程如下(1)用户输入产品的名称、生产厂家、价格等产品情报参数;(2)系统根据输入的产品属性参数,首先在产品索引数据库中搜索,利用属性语义 和属性关联权重矩阵得到匹配项;(3)系统根据输入的产品属性参数,利用语义字典产生若干关键词对搜索引擎、电 子商务网站、比价网站等执行元搜索,对新发现的相关网页进行结构分析、语义分析,并将 网页中产品详细信息以结构化的方式存储到数据库,并建立相关的索引。(4)利用索引库,判断产品信息与企业经营、市场的相关性,计算每条搜索结果的 关联度,降序方式输出关联度大于设定阀值的产品信息列表。(5)输出产品情报报表。10. 6产品情报的报表
6
系统采用TimerTask每天按规定的时间从数据库读取所有任务,设置任务参数, 自动生成报表,并且通过javamail向用户进行发送。用户可以定制产品情报检索的条件、 报告时间和频率。本专利的实现系统建立了有效的索引机制来提高数据库访问效率和减少查询响 应时间。为了便于用户获取在线交易的汇总信息,系统采用数据仓库技术,通过多维数据模 型提供所需的汇总信息,并且具有Drill-down和Roll-up的功能。10. 7产品情报语义字典及其实现本专利通过构建产品情报语义字典,使用网页结构分析和语义分析技术对产品信 息发布页面进行智能分析和抽取。首先过滤掉类似FONT、I、B等格式控制标签,构建反映 网页的逻辑结构的D0M树;然后利用语义字典所提供的词汇和语义关系信息定位目标信 息(产品信息的属性,如价格、生产厂家、批准文号等),同时要求目标信息具有一定的聚集 度,即目标信息在D0M树中有较近的共同父结点。满足上述条件的目标信息通过存储在语 义字典中的模式进行匹配,抽取出产品信息的属性值。如图7所示,语义字典由3个顶层类组成商品、属性和地域。产品存储在线商品信息的各种属性,包括中文名称、英文名称、生产单位、规格、 计量单位、价格、商标、描述、网址。目前商品类下又分药品、保健食品、医疗器械三类,它们 分别又有各自的特殊属性。以药品类为例,特殊属性包括批准文号、批准日期、功能主治、主 要成分、剂型、是否处方药。属性存储对在线商品属性进行抽取时所需的相关信息。包括属性的中文名称、英 文名称、缩写、描述、同义词、标签、属性正则表达式、属性取值、属性值正则表达式。地域以分层方式存储了商品产地的行政区域信息,这些信息可用于对数据进行 分区域统计。在线产品语义字典的构建,采用了手动与自动相结合的方法。首先,对于产品标记 和产品属性,采用人工方法进行语义提取,形成语义字典的静态部分。其次,对于电子商务 产品涉及的概念,结合通用的产品分类体系进行手工语义提取与构建。最后,在手工构造的 初级语义字典基础上,利用本体集成技术融入现有的通用语义字典,利用关联规则挖掘方 法丰富和优化产品概念及其关系。语义字典的作用是支持在线所发布产品信息的语义分析,实现对互联网上的产品 信息进行检索和统计。语义字典包括了生产商、产地、报价、发布网站、网站注册情况、用户 所关注的词汇。本专利所设计的产品情报语义字典采用了本体论的思想,其目的在于开发中可以 使用现有的领域本体开发和设计工具。产品语义本体的构建,包括电子商务领域的产品知 识建模、产品属性建模以及产品概念建模。所设计的三维在线产品语义字典,包含产品词汇、产品属性、产品标记三个维度的 术语。通过明确定义领域术语及其关系,形成了电子商务领域的三维在线产品语义库、产品 属性语义库以及产品概念语义库。产品情报语义又分为电子商务常识和行业知识。常识是电子商务领域的背景知 识,例如“电子商务”等于“网络交易”等。行业知识包括电子商务行业定义的概念词汇及其 关系,主要依据联合国标准产品与服务分类代码(United Nation Standard Products andServices Code,UNSPSC)分类层次与关系,同时考虑产品属性、表示方法、发布机构、标准规 范等互联网应用特点。在线产品涉及的产品词汇,来源于国内外网上交易的商品名称以及这些名称所关 联的词汇。在线产品的语义字典与WordNet和CCD有所不同,后两者有25个义类,而UNSPSC 是通用的国际规范,因此在线产品语义字典在WordNet的初始义类的基础上增加了一层, 并对WordNet的初始义类进行了删减。这样,在线产品语义字典的根义类与WordNet—致, 二级义类与UNSPSC —致。在本专利中,在线产品涉及的产品属性,包括全球贸易专利代码、全球位置编码、 产品中文名称、产品英文名称、规格型号、商标中文名称、产品分类、产品目标市场、包装形 态代码、包装尺寸、度量单位、原产地、产品保持期、关键字(中文)、关键字(英文)、上市时 间、下市时间、产品短描述(中文)、产品短描述(英文)、输入项名称、产品描述、价格信息、 包装信息、计量信息、订购信息等。在线产品涉及的产品标记,主要是HTML语言中常见标签 及其与分析产品信息有关的自定义标签,如P、Image, Price等。在线产品语义字典与WordNet和CCD的总体结构类似。产品词汇、产品属性、产品 标记等三个层次分别以同义词集来定义概念,在概念之间定义关系,所形成的三维语义,各 自有独立的语义描述,相互之间也有语义关系。在语义字典在初级语义基础上,本专利将利用本体集成的方法来拓展概念词表。 具体实现方式是对每个概念词汇进行同义词的扩充。可选的外部资源有通用语义字黄或者 与电子商务相关的领域语义本体或字典,如面向出入境的产品本体等。下面以WordNet和《中国汉语大词典》为例,说明所采用的集成方法。领域本体与WordNet的融合有很多算法。大多是根据属性值来判断外部节点和 WordNet节点的相似度,再进行属性的复制和节点的合并。由于本专利需要最大程度的考 虑准确性,所以不能依据WordNet的语义距离来计算两个节点的相似度。因此我们根据 WordNet的节点名称来判断该节点与在线产品本体里的节点值是否相同。引入WordNet时需要重点解决的是下义词问题。因此,与WordNet的合并算法首先 是根据在线产品语义字典的每一个概念名称,从WordNet中寻找到具有相同名称的节点。 其次是将WordNet该节点的下义复制到在线产品本体对应概念的下义列表。本专利还将与《中国汉语大词典》进行集成,该词典的格式是“词,词性,解释”。该 词典主要解决同义词的问题,合并算法如下■对外部词典进行正规化,对解释进行分词,只保留名词、形容词和量词。■获取基本概念词汇表中的词w,得到其词性C(W),查询外部词典的解释。在词典 里,大多数的同义词,解释部分只有一个或少量的名词。若词W存在于解释中,且和词条的 词性相同。可以根据以下公式计算出两个词条的相似程度。S(W” D) = 1/Nd+Ad■通过小样本的手工验证,来寻找合适的阀值。大于阀值的自动归入同义词表,其 余的根据其相似值归入关联词条,供人工进一步审核。其中Nd表示词条解释中含有的名词个数,Ad表示词条解释中含有的非名词、形容 词和量词的个数。从公式可见,若解释里只有W—个名词,且无其它词,则两者的相似度为 1。
8
通过这种方式,可以方便的得到同义词列表。
(4)基于关联规则挖掘的语义字典优化除了以上的语义字典构造方法,本专利实现系统还将采用基于品类信息的关联规 则挖掘方法,对在线产品搜索引擎运行过程中形成的历史数据进行处理,得到感兴趣的关 联规则,再利用这些关联规则补充和优化语义字典。本专利采用目前使用较多的本体描述语言OWL来描述在线产品语义字典。使用较 成熟的Prot6g6和Jena等工具来构建和维护在线产品的本体,从本体可自动生成相应的语 义字典。OffL允许使用者定义适合自己使用的属性及其关系,描述逻辑是其逻辑学基础,具 有很大的灵活度。在线产品本体定义里涉及到的概念、属性及其关系都可以通过OWL语言 来进行描述。10. 8基于语义的元搜索技术产品情报元搜索涉及的主要技术包括搜索引擎整合与优化、产品信息抽取、检索 结果排序、数据库索引等。产品情报元搜索目前所集成的搜索资源包括■产品搜索引擎。目前有Google的Product Research ;■电子商务网址大全类网站。作用是能够快速、高效地定位知名电子商务网站,同 时还能根据电子商务网址大全所提供的分类说明,作为语义分析的辅助信息。目前采用的 是Alibaba网站;■产品比价网站。这种网站本身提供了结果处理的产品信息。目前使用Paipai 网;■第三方电子商务平台。作用是可以高效获得数以百万计的电子商务网站,而且 这些网站通常采用相同的发布信息和表达格式。目前采用的是Alibaba网站。各个搜索资源的结果集,采用以下方法进行调整■对每个独立的搜索引擎Si赋以权重Wtl,即Wi = W。;■计算从氏中提取的结果数量Ni, Ni = C1IRjwi/ Σ Wi, Ri表示集合Ri的基数, C1是常数,可以取0. 1,0. 01等,视返回结果的数量要求而定。各种搜索引擎的权重以百分 数表示,并且令Σ Wi = 1 ;■将Ri中前Ni个结果取出,并合并形成2级结果集,对2级结果集应用位置排序 算法进行排序,取出前η个结果形成3级结果集。其中η = C2 Σ Ni, C2的作用和C1 一样, 用来控制3级结果集中结果的数量;■ Si对3集结果集的贡献比率Pi表示为Si对3级结果集贡献的结果数Iii除以Si 在2级结果集中的个数,pi = η,/Ν,,规范化的贡献比率调节系数Pi = Pi/ Σ Pi ;■重新调整每ASi的权重Wi,Wi = C3WjC4Pit5其中, 都为常数,并且。+ = 1。对所有Wi重新计算后,为了保证每次Pi对Wi的影响是一样的,将Wi进行归一化;■对每次查询,重复步骤2到5。产品信息分析与抽取是元搜索的重要组成部分,本专利包含两种信息分析功能, 一种面向预定义电子商务网站,目的是获得一定数量的精确数据;另一种是面向没有预定 义的电子商务网站,在互联网范围内智能定位并且解析新的电子商务网站所发布的产品信 息。使用的信息分析技术,主要包含语义分词、语义消岐、关联度确定等方法。
(1)预定义产品信息提取与更新产品信息抽取一般有两个过程首先是定位到产品详细信息的页面,其次是对产 品详细信息进行解析,并且抽取所需信息。由于电子商务网站产品发布格式的不一致,很难 用一个体系去准确匹配所有网站。为此,本专利将首先结合所建立的三维在线产品语义字 典,对产品信息量大、特定电子商务模式的主要电子商务网站,如一些比价网站、第三方电 子商务平台等建立正则匹配模版,目的是为在线监测提供一定的精确数据。该模板也包括HTML标签、产品属性和产品类别等元素。专利将基于上述正则模板 开发一个预定义产品信息提取与更新服务,不间断地对建立正则表达式的电子商务网站, 以及在数据库中保存的产品信息进行持续的更新。(2)动态的产品信息搜索与处理 本专利开发了一个面向未定义产品网站的产品信息提取服务,基于三维在线产品 语义字典,对未知电子商务网站的页面进行结构和语义分析,自动分析产品所在网页的信 息,并且提取产品相关的属性信息。该服务可以根据网页中的超链接循环地提取网页信息,并自建网页数据库,保存 搜索结果。无需存储所有检索到的网页页面信息,只需要根据超链接逐级深入直至产品详 细信息页面,再进行内容的提取和整理,因此Spider需要根据网页的特征以特定算法迅速 地分辨出该网页是否为详细页面,并据此对是否进行内容的提取做出辨别。对于网页的信息自动抽取,主要是通过对网页的结构和语义分析,定位并抽取出 所需的信息。算法步骤如下从语义字典中获取所有需要检索的词汇;从HTML页面中定位需要检索的词汇(注意,需要检索的词汇应与可能的取值成对 的出现,比如“价格”后面应该有形如“10. 78元”的信息,后者用正则表达式检查。有些属 性的值可能要用语义字典中定义的属性取值集合的元素来匹配);确定需要抽取的信息,主要是考虑信息满足一定的聚合度(经观察,所抽取的信 息一般在HTML形式的树结构中呈兄弟姐妹关系,而单独出现的检索词汇一般是孤立的标 题,利用价值不大。初步考虑可以对HTML文件用树的宽度遍历算法,当需要检索的词在一 定的范围内连续出现若干次后,可以确定一组信息聚集区);将抽取信息存入相应的数据库中。上述步骤可以实现比较全面地覆盖网上的产品发布信息,并且有比较持续的可扩 容性和增长性,可以对语义字典作进一步的完善,以提高准确率。(3)产品信息的中文语义分词比较成熟的分词方法,有基于字符串匹配的分词方法和基于统计的分词方法两大 类。基于字符串匹配的分词方法又叫做机械分词方法,它按照一定的策略将待分析的汉字 串与一个“充分大的”语义字典中的词条进行匹配,若在字典中找到某个字符串,则匹配成 功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同 长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按照是否与词性标 注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。常用的几种 机械分词包括正向最大匹配、逆向最大匹配和最少切分。
本专利的实现系统将采用机械分词方法,先采用语义字典对网页进行分词,再将 分词结果进行人工验证。最后将调整后的分词结果整理成分词词典,对剩余的大量语料进 行分词。语义分词的基本思想如下■根据语义字典,找出字串中所有的可能词,构造词语切分有向无环图。每个词对 应图中一条有向边,并赋给相应边长(权值);■然后针对该切分图,在起点到终点所有路径中,求出长度值按严格升序排列依 次为第1. . . n条路径作为相应的粗分结果集。如果两条或以上路径长度相等,那么其长度 为i,列入粗分结果集;■最后粗分结果集合大小大于或等于N。(4)确定在线产品术语经过分词以后,还需要对剩下的词汇进行筛选,选出领域相关的词汇。首先要定义 抽取词汇的模式,再利用模式匹配算法从文档中抽取出词汇。一般来说,概念通常是名词或 名词短语。如计算机、手机等。前面提到的禁用词主要是指无意义的词汇,这里还需要去除 有意义但在该领域频繁出现,对单个词条意义不大的词,所以选取候选词的算法主要考虑 到某个词汇对该领域重要程度的量化。衡量术语重要程度的量化公式常用的有两个一个是TFIDF方法,一个是领域相 关度(Domain Relevance)和领域一致度(Domain Consensus)组合方法。这里采用后一种方法。假定领域集合Domain Set =他,D2,. . .,Dn},t候选术 语集中的一个元素。那么t对于领域Dk而言的领域相关度,简写为DRt,k,它的计算公式如 下。
领域相关度是通过和无关领域比较反映术语与特定领域的相关程度。(5)产品信息语义消歧由于存在大量的一个词多个含义的现象,所以语义消歧特别重要。在多数现有的 自然语言处理算法中,上下文消歧法通常取自以目标词为中心的单词窗,这个窗一般只取 目标词周围的一或二个单词,并且不考虑与目标词的距离及语法关系等。本专利通过手工的调整分词词典以及其生成的分词结果,可以达到比较好的排除 歧义的效果。(6)搜索的关联度计算在计算关联度时,要分别对在线产品语义字典中定义的各种关系进行处理。例如, 处理修饰关系时首先需要使用定义的修饰关系关联度。对于每一个搜索结果,考虑产品属 性关键词和修饰关系属性词的关联度。对修饰关系的具体处理算法是通过改进并串联系统 稳定度数学模型来计算匹配情况。例如,对于第i个搜索结果的产品属性值Pi,其在语义字 典中的第j个产品属性关键词是被该匹配所使的用产品属性关键词。将Pi在语义字典中 的第j个商品名关键词记为NKijt)根据语义分类树,在NKU的修饰关系属性词有n个节点 匹配到商品名,把每个节点都看作一个并联组件,计算Pi的匹配情况为
其中,a为属性词层的修饰关系节点,C(IN)是对产品属性名的利用率,假设过滤 附属词后的商品名长度为m,可由n/m得到。考虑到属性层修饰关系节点存在关联度因子r 等于1,即和关键词100%关联的情况下,将屏蔽其他属性词的影响,再为因子r加入了一个 调整函数。则Pi的关联度计算公式变成 10. 9系统开发环境客户端通用浏览器开发语言Java/J2EE,网页采用ASP/HTMLJfU^iM :MyEclipseEnterprise Workbench 5. 1. OGA数据库0raclelOg应用服务器Tomcat5. 0服务器端操作系统MicrosoftWindows 2003Server Edition客户端连接互联网,有通用浏览器软件的计算机10. 10软硬件需求运行本专利实现系统,服务器端所要求硬设备的最小配置为PIII-lOOOMHz 以上 CPU2GM以上内存100GB以上硬盘空间;10/100MB自适应网卡数据库0racle10g应用服务器Tomcat5. 0服务器端操作系统MicrosoftWindows 2003 Server Edition客户端要求连接互联网,有主流浏览器软件的计算机。
权利要求
一种在线检索产品情报的方法。特征基于元搜索技术,检索与市场竞争和企业经营有关的互联网产品情报信息,搜索范围可以覆盖整个互联网。
2.一种智能分析产品情报信息的方法。特征基于语义技术和网页结构分析技术,智 能分析产品信息是否与市场竞争和企业经营有关。
3.一种情报网Web系统的实现方法。特征使用权利要求(1)、(2)的在线检索和智能 分析方法,采用B/S架构和Web系统架构,通过在线方式为用户提供产品情报服务。
全文摘要
本发明包括产品情报的在线检索和智能分析方法和软件系统实现方法。目前的应用实例是对互联网产品信息进行搜索和分析的智能情报网系统。基于本发明实现的情报系统,利用元搜索技术检索互联网,利用语义推理分析产品情报,利用精确、直观的产品情报表,为企业和政府部门提供与市场竞争和企业经营有关的产品情报服务。
文档编号G06F17/30GK101866340SQ20091004924
公开日2010年10月20日 申请日期2009年4月14日 优先权日2009年4月14日
发明者李涛, 李银胜, 柴跃廷 申请人:上海成方信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1