一种基于搜索引擎的数据优化方法、装置及设备与流程

文档序号:19251160发布日期:2019-11-27 20:15阅读:249来源:国知局
一种基于搜索引擎的数据优化方法、装置及设备与流程

本说明书涉及计算机技术领域,尤其涉及一种基于搜索引擎的数据优化方法、装置以及设备。



背景技术:

企业名称是一个企业区别于其他企业的文字符号,依次由企业所在地的行政区域、字号、行业或者经营特点、组织形式等四部分组成,并且工商登记、税务登记会给企业标注唯一的登记编码。其中,字号是区别不同企业的主要标志。

目前,社会大众对企业的认知往往是通过企业简称或企业产品或品牌形成的,比如“中国建设银行股份有限公司”、“中国建设银行股份有限公司北京市分行”和“中国建设银行股份有限公司上海黄浦支行”在社会认知中都认定为“建设银行”;同样,在各个应用场景,比如搜索引擎中,用户也会通过检索“建设银行”进行信息检索。再比如“中国移动”、“中国人寿”、“肯德基”等大型企业也是基于企业简称或企业产品或品牌形成的公众认知。可见,利用企业简称或企业产品或品牌来代称企业是一种常见的文化现象。对于一个企业而言同样也会有多个简称,或者多个品牌形象,或多个产品推广,所以对于企业的代称也有很多,比如,“阿里巴巴中国技术”、“阿里巴巴中国”、“阿里巴巴网络”、“阿里巴巴”、“alibaba”等“阿里巴巴网络技术有限公司”的简称,还有“淘宝网”、“零售通”、“天猫”等企业品牌或产品。

由于部分企业的简称或企业产品或品牌信息过多,因此存在企业信息表达过量的情况,把不相关的信息挂靠到该企业下面;或者存在部分企业简称或企业产品或品牌存在于多个企业下面,由此产生企业简称或企业产品或品牌作为企业挂靠信息时,存在企业挂靠不准确的情况;或者由于企业简称或企业产品或品牌表意宽泛或在不同场景下的表意变化,使得企业简称或企业产品或品牌不适合作为企业挂靠信息。基于上述原因,需要对企业名称、企业的简称、产品或品牌等能够代指企业的关键名词的集合进行优化。



技术实现要素:

本说明书实施例提供一种基于搜索引擎的数据优化方法、装置及设备,用于解决以下技术问题:能够提高待优化数据的准确性及可信度。

为解决上述技术问题,本说明书实施例是这样实现的:

本说明书实施例提供的一种基于搜索引擎的数据优化方法,包括:

基于搜索引擎对待优化数据进行搜索爬取,获得所述待优化数据的爬取数据;

基于所述待优化数据的爬取数据,建立关联映射数据;

对所述关联映射数据进行特征提取,获得特征提取数据;

基于所述特征提取数据的融合数据,对所述待优化数据进行优化,其中,所述融合数据为将所述特征提取数据进行融合得到的数据。

本说明书实施例提供的一种基于搜索引擎的数据优化装置,包括:

爬取单元,基于搜索引擎对待优化数据进行搜索爬取,获得所述待优化数据的爬取数据;

关联单元,基于所述待优化数据的爬取数据,建立关联映射数据;

提取单元,对所述关联映射数据进行特征提取,获得特征提取数据;

优化单元,基于所述特征提取数据的融合数据,对所述待优化数据进行优化,其中,所述融合数据为将所述特征提取数据进行融合得到的数据。

本说明书实施例还提供一种基于搜索引擎的数据优化设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

基于搜索引擎对待优化数据进行搜索爬取,获得所述待优化数据的爬取数据;

基于所述待优化数据的爬取数据,建立关联映射数据;

对所述关联映射数据进行特征提取,获得特征提取数据;

基于所述特征提取数据的融合数据,对所述待优化数据进行优化,其中,所述融合数据为将所述特征提取数据进行融合得到的数据。

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:

本实施例基于待优化数据的爬取结果,建立待优化数据与爬取结果的关联映射数据,进一步利用获取的关联映射数据进行特征提取,并进行数据融合,以对待优化数据进行优化,能够减少数据优化过程中的搜索工作量,提高待优化数据的准确性及可信度。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种基于搜索引擎的数据优化方法的框架图;

图2为本申请实施例提供的一个查询结果示意图;

图3为本申请实施例提供的一个爬取结果示意图;

图4为本申请实施例提供的一种基于搜索引擎的数据优化方法的流程图;

图5为本申请实施例提供的一种基于搜索引擎的数据优化方法的逻辑结构图;

图6为本说明书实施例提供的一种基于搜索引擎的数据优化装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

如前所述,社会大众对企业的认知往往是通过企业简称或企业产品或品牌形成的,在实际应用中,可以通过企业别称表,包含企业简称、企业品牌等信息,形成企业名库,以便社会大众用于企业查询。企业名库是企业名称、企业的简称、产品或品牌等能够代指企业的关键名词的集合。

表1为本申请实施例提供的企业别称表示意图。

表1

如表1所示,“上海二三四五网络科技有限公司”中,存在企业简称或企业产品或品牌信息过多的情况,将不相关的信息引入挂靠到该企业下,诸如浏览器、动画片大全等存在表意模糊,在实际应用中,不能较好的实现企业简称或企业产品或品牌与企业全称之间的信息融合。

表2为本申请实施例提供的又一个企业别称表示意图,“农投公司”作为企业简称挂靠到几十家企业下,会影响挂靠信息的准确性,产生信息挂靠的不准确性。

表2

表3为本申请实施例提供的又一个企业别称示意图,其中,“金融交易所”属于一个宽泛的概念,不适合描述“天津金融资产交易所有限责任公司”,此类由于企业简称或企业产品或品牌表意宽泛或不同场景下的表意变化,会造成不同场景下代指企业的可信度的变化。

表3

在实际应用中,诸如企业信息检索时,企业信息检索的关键词直接决定了检索信息的数量及有效性,决定了是否可以召回更多更准确的信息。由于搜索引擎往往利用倒排索引进行构建,倒排索引利用词语作为索引标记,同时对词语进行分词、改写等操作,因此在进行企业信息检索时,如何选择检索关键词作为搜索种子至关重要。由于搜索引擎或其他技术的引入,检索信息与企业进行匹配时,需要对检索信息进行实体抽取,以分析实体所指的企业。

随着企业的发展,企业产品、企业品牌等亦会发生变更,企业名称亦会发生变更,企业简称亦会发生变更,因此,相应的,企业名库的信息也需要发生变更。

由于现有企业数量巨大,目前全国存活企业数量在5000万以上,再加上企业的简称、产品或品牌,数据量巨大。现有技术中,为了保证企业名库的准确性,需要通过人工方式进行标注校验,由于数据量巨大,人工标注成本较高,准确率低,可靠性差;采用机器学习算法亦需要进行数据标注,因此也无法提取较好的数据特征以克服现有技术中的问题。

基于上述问题,本申请实施例提供一种基于搜索引擎的数据优化方法,以减少搜索工作量,提高企业的简称、产品或品牌作为企业挂靠信息的准确性及可信度。以下结合附图,详细说明本申请实施例提供的技术方案。

图1为本申请实施例提供的一种基于搜索引擎的数据优化方法的框架图,具体包括如下步骤:

步骤s101:基于搜索引擎对待优化数据进行搜索爬取,获得所述待优化数据的爬取数据。

企业名库作为企业名称、企业的简称、产品或品牌等代指企业关键名词的集合,可用于企业信息检索等场景。为保证检索信息的准确性,需要对企业名库进行优化。在本申请的一个实施例中,以企业名库作为待优化数据。需要特别说明的是,以企业名库作为待优化数据,仅为本申请的一个示例性说明。待优化数据亦可为其它数据集合,名称全称与名称简称、名称全称与名称全称对应的产品。

在本申请的一个实施例中,获得待优化数据的爬取数据,具体包括:

对待优化数据进行统计分析,获取搜索种子;

基于预设规则,以所述搜索种子为搜索条件,进行搜索爬取,获得所述待优化数据的爬取数据。

待优化数据进行搜索爬取前,需要寻找合适的搜索种子。在本申请中,对待优化数据进行统计分析,获取搜索种子。在本申请的一个实施例中,以企业名库作为待优化数据,进行统计分析;以所述企业名库中各词语作为搜索种子。需要特别说明的是,所述统计分析包括对所述企业名库中各词语关联企业的数量、所述企业名库中各词语的长度的统计分析。在具体实施过程中,为保证后续结果的准确性,针对不同的业务特点,企业名库中各词语所关联企业的数量应予以控制,不超过一定的数量阈值,数量阈值根据业务特点和/或业务场景而定。

由于搜索引擎的特殊设置,利用搜索种子进行搜索爬取时,会对搜索种子进行分词等操作,为了保证搜索爬取结果的准确性,在具体实施时,对企业名库中各词语的长度进行统计分析,将处于搜索阈值范围内的词语作为搜索种子。搜索阈值范围的确定由业务特点和/或业务场景和/或搜索引擎自身特点而定。

在本申请的一个实施例中,以企业名库作为待优化数据,将企业名库中包含的词语作为搜索种子,因此,搜索种子可以为企业的简称、品牌或产品。为便于后续实施例说明,将企业的简称、品牌或产品统称为企业简称。

由于作为搜索种子的词语的长度不能过短,过短的搜索种子往往会造成较大的信息误差,因此,在本申请的一个实施例中,搜索种子的长度可以大于等于3个字符,将3个字符作为搜索阈值范围的下限。由于搜索引擎的分词会影响搜索爬取结果的准确性,因此,作为搜索种子的词语的长度不宜过长,将适用的搜索种子长度的最大值作为搜索阈值范围的上限。在本申请的一个实施例中,将12个字符作为搜索阈值范围的上限。在本申请的又一个实施例中,以搜索引擎自身规定的允许搜索输入的最大字符长度作为搜索阈值范围的上限。

搜索种子通过搜索引擎的搜索功能,进行搜索,获得爬取数据。在具体实施过程中,搜索爬取的预设规则可通过搜索引擎进行设置。预设规则包括但不限于:时间筛选条件、搜索爬取结果返回条数。为了保证搜索引擎所在的服务器数据的更新,时间筛选条件可设置搜索周期,具体可以按照初始搜索周期较长、后续时间窗口较短的时间筛选条件。具体地,在首次使用搜索引擎进行搜索爬取时,可以选择较长的周期,例如一年,将初始搜索周期设置相对长的时间。考虑到搜索引擎所在的服务器数据的更新,在第一次之后使用搜索引擎进行搜索爬取时,可以设置相对较短的周期,例如一个月,将后续时间窗口设置为相对较短的时间,以减少搜索爬取的数据量,同时能够实现爬取数据的及时更新。

以搜索种子作为查询条件,通过搜索引擎,获得基于搜索种子的查询结果。由于搜索引擎自身的特殊设置,存在查询结果分词、改写、查询结果补足等操作,因此,获得的查询结果中有一部数据与待优化数据的关联性是很小的。为了减少后续待优化数据的优化处理的数据量,同时保证待优化数据的优化准确性,进一步需要对查询结果进行筛选,根据业务特点和/或业务场景,选取查询结果的前n条作为爬取数据。在本申请的一个实施例中,n为100条。

为了便于后续进行数据优化,爬取数据包含基本信息,基本信息的内容包括但不限于:搜索种子(查询关键词,诸如企业简称等)、标题、摘要、正文、搜索链接。爬取数据以结构化存储的形式进行存储。结构化存储是把树状文件系统的原理应用到单个的文件中,使得单个文件也能像文件系统一样包含“子目录”,“子目录”还可以包含更深层次的“子目录”,各个“目录”可以含多个文件,把原来需要多个文件存储的内容以树状结构和层次保存到一个文件中去。

步骤s103:基于所述待优化数据的爬取数据,建立关联映射数据

如前所述,由于搜索引擎的特殊设置,会造成通过搜索引擎的部分查询结果跟预期的查询结果不符。图2为本申请实施例提供的一个查询结果示意图。以“鲁商电子”作为搜索种子进行查询,图2所示的查询结果是与搜索种子不符的。因此,需要进一步通过实体识别技术,建立待优化数据与爬取数据的准确关联。具体地,基于待优化数据的爬取数据,利用实体识别技术,建立搜索种子与待优化数据的爬取数据之间的关联映射数据。

实体识别技术常用的技术手段包括:

(1)字符串匹配技术,利用字符串匹配算法计算字符串包含关系或者字面相似技术。此类技术方法简单,有时会存在一定二义性。比如“五六间”检索出来的搜索信息:政府严控“三公”消费,高端餐饮(专题阅读)店接连倒闭,中原地产工商铺区域营业经理吴锋透露,在珠江新城和天河一带已经有五六间高端餐饮店关门,以每间400......。在搜索信息中,“五六间”存在二义性。同样搜索链接通过标题、摘要、正文文本内容进行企业计算时亦会存在准确性问题。

(2)企业实体识别技术,利用实体识别技术(namedentityrecognition,简称ner)进行企业实体识别。命名实体识别,又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。目前实体识别技术的准确度也比较可靠,但需要投入资源进行数据标注和校验。

在本申请中,优选企业实体识别技术,进行企业实体识别。

以搜索种子作为查询关键词获得的爬取结果,进一步采用企业实体识别技术,形成搜索种子-企业名称-搜索链接之间的关联映射数据。延续前述实施例,将企业简称作为搜索种子,形成的关联映射数据为企业简称-企业名称-搜索链接之间的关联映射数据。

步骤s105:对所述关联映射数据进行特征提取,获得特征提取数据.

基于前述步骤s103获得的关联映射数据及所述待优化数据,进行特征提取,获得所述待优化数据的特征。需要特别说明的是,待优化数据的特征是基于关联映射数据及待优化数据的统计分析获得的。

延续前述实施例,基于企业简称-企业名称-搜索链接之间的关联映射数据及企业名库的统计分析,获得企业名称-企业简称的特征。

待优化数据的特征包括:企业简称共享度、企业简称召回度、企业简称二义度、企业简称表意度、企业简称包含度。具体地,

(1)企业简称共享度

企业简称对应的企业数量越多,企业简称共享度越低。比如“农投公司”代表多家企业,被多家企业共享简称,由此该词的代表性低。企业简称对应的企业数为ncom,企业简称共享度为

(2)企业简称召回度

表示企业简称出现频率或文档数越大,表示该词召回的意义越强,表意明确。在实际应用场景中,企业简称召回度表明企业简称在公众认知中的程度,大众通过强召回的企业简称来描述企业,因此,企业简称召回度越高,表明该企业简称的认知程度越高。取企业简称出现的文档数为ndoc,企业简称召回度为s2=log(ndoc+1)。

需要特别说明的是,企业简称出现文档数指的是爬取数据中的出现企业简称的文档数。前述中,以企业简称作为搜索种子进行搜索爬取,获得的爬取数据按照结构化存储。由于结构化存储是把原来需要多个文件存储的内容按树状结构和层次保存到一个文件中,因此,一个文档数表示企业简称出现了一次。

(3)企业简称二义度

由于企业名称中存在企业链接挂靠多个企业的情况,针对单个企业简称而言,企业能召回的文档数量都应对应同一个企业,则表明该企业简称的信息更聚合,二义性更明确。因此利用企业别名文档数/企业数(文档数/企业数代表该词更能代表特定企业)来表示企业简称二义度。企业简称搜索链接对应的企业数为ndoc_com,则企业简称二义度为

(4)企业简称表意度

为便于理解企业简称表意度,图3为本申请实施例提供的一个爬取结果示意图。某企业共有3个简称,分别为简称1、简称2和简称3。分别以简称1、简称2及简称3为搜索种子,进行搜索爬取,获得爬取数据。其中,简称1和简称2有56个相同的搜索链接,简称1和简称3有31个相同的搜索链接,简称2和简称3有43个相同的搜索链接,因此,简称2更具有代表性。

基于图3所示例子,产生企业简称表意度指标,计算企业下别称爬取相同文档网络,提取更代表该企业的别称。不同企业简称的相同搜索链接为nsame_doc,则企业简称表意度为s4=log(nsame_doc+1)。

(5)企业简称包含度

以下述实例为例“华夏恒业投资基金管理(北京)有限公司(下称华夏恒业)”,由此“华夏恒业”对于“华夏恒业投资基金管理(北京)有限公司”更有表达能力。因此构建企业简称包含度指标来刻画,企业简称的包含次数为ncontains_com,则企业简称表意度为s5=log(ncontains_com+1)。

步骤s107:基于所述特征提取数据的融合数据,对所述待优化数据进行优化,其中,所述融合数据为将所述特征提取数据进行融合得到的数据。

基于前述步骤获得的融合数据,采用对待优化数据进行评分的方法,对待优化数据进行优化,具体包括:

将所述特征提取数据与所述特征提取数据对应的权重进行融合,获得所述待优化数据的评分结果;

将所述评分结果进行阈值过滤,以对所述待优化数据进行优化。

在具体实施中,待优化数据的评分以sfinal表示,sfinal=∑wi*si,其中,si为前述步骤s105获得的特征提取数据,wi为所述特征提取数据对应的权重。需要特别说明的是,wi可根据实际业务特点和/或业务场景进行调整。对于同一个企业下面的多个企业简称(企业的简称、品牌或产品等)利用评分结果,根据实际业务特点和/或业务场景进行阈值过滤,以保证企业下代指关系更合理。

以上为本说明书实施例提供的数据优化方法的框架图,下面将基于图1所述的框架图,以企业名库作为待优化数据作为具体实施例,以详细说明数据优化流程。图4为本申请实施例提供的一种基于搜索引擎的数据优化方法的流程图,具体包括:

步骤s401:企业名库作为待优化数据进行统计分析。

步骤s403:基于所述企业名库的统计分析结果,确定搜索种子。

步骤s405:基于所述搜索种子,利用搜索引擎进行搜索爬取,获得爬取数据。

步骤s407:基于所述爬取数据,利用实体识别技术,形成企业简称-企业名称-搜索链接之间的关联映射数据。

步骤s409:基于所述关联映射数据及所述企业名库的统计分析结果,进行特征提取,获得企业名称-企业简称的特征。

需要说明的是,企业名称-企业简称的特征,可用于分析企业简称与企业名称之间的代指强度关系,进而用于优化企业名库。

步骤s411:将所述企业名称-企业简称的特征与所述企业名称-企业简称的特征对应的权重进行融合,以对企业名库进行优化。

为进一步理解本申请实施例提供的数据优化方法,下面结合图1和图4所示的数据优化方法,予以综合分析说明。图5为本申请实施例提供的一种基于搜索引擎的数据优化方法的逻辑结构图,具体包括:

基于企业名库获得搜索种子,对搜索种子进行搜索引擎查询,获得搜索链接,对搜索链接进行信息抓取,最后利用企业实体识别技术及企业名库进行企业挂靠。对查询链接进行信息抓取的内容包括:链接对应的标题、摘要、内容。在上述逻辑中,建立了搜索种子(企业简称)-企业名称-搜索链接之间的关联映射数据,然后利用产生的关联映射数据进行特征提取,获得企业名称-企业简称的特征,分析企业简称和企业名称之间的代指强度关系,从而实现企业名库的优化。

需要说明的是,企业名库作为待优化数据进行数据优化,仅为本申请的一个示例性说明。名称全称与名称简称、名称全称与名称全称对应的产品等亦可作为待优化数据进行数据优化。

采用本说明书实施例提供的数据优化方法,基于搜索引擎的搜索爬取可以解决现有技术中对待优化数据进行搜索,信息量过大的问题;进一步利用爬取数据建立关联映射数据,进行数据优化,可以压缩数据量,减少歧义表达,提高表达的准确性及可信度。

上述内容详细说明了一种基于搜索引擎的数据优化方法,与之相应的,本说明书还提供了一种基于搜索引擎的数据优化装置,如图6所示。

图6为本说明书实施例提供的一种基于搜索引擎的数据优化装置的示意图,所示装置包括:

爬取单元601,基于搜索引擎对待优化数据进行搜索爬取,获得所述待优化数据的爬取数据;

关联单元603,基于所述待优化数据的爬取数据,建立关联映射数据;

提取单元605,对所述关联映射数据进行特征提取,获得特征提取数据;

优化单元607,基于所述特征提取数据的融合数据,对所述待优化数据进行优化,其中,所述融合数据为将所述特征提取数据进行融合得到的数据。

所述爬取单元601具体用于:对所述待优化数据进行统计分析,获取搜索种子;

基于预设规则,以所述搜索种子为搜索条件,进行搜索爬取,获得所述待优化数据的爬取数据。

所述爬取单元601还用于:以企业名库作为待优化数据,进行统计分析,其中,所述统计分析包括对所述企业名库中各词语关联企业的数量、所述企业名库中各词语的长度的统计分析;

以所述企业名库中各词语作为搜索种子。

所述关联单元603具体用于:基于所述待优化数据的爬取数据,利用实体识别技术,建立所述搜索种子与所述待优化数据的爬取数据之间的关联映射数据。

所述提取单元605具体用于:基于所述关联映射数据及所述待优化数据,进行特征提取,获得所述待优化数据的特征。

所述待优化数据的特征包括:

企业简称共享度、企业简称召回度、企业简称二义度、企业简称表意度、企业简称包含度;

所述企业简称共享度为

所述企业简称召回度为s2=log(ndoc+1);

所述企业简称二义度为

所述企业简称表意度为s4=log(nsame_doc+1);

所述企业简称包含度为s5=log(ncontains_com+1);

其中,

ncom为企业简称对应的企业数,ndoc为企业简称出现的文档数,ndoc_com为企业简称搜索链接对应的企业数,nsame_doc为不同企业简称的相同搜索链接,ncontains_com为企业简称的包含次数。

所述优化单元607具体用于:将所述特征提取数据与所述特征提取数据对应的权重进行融合,获得所述待优化数据的评分结果;

将所述评分结果进行阈值过滤,以对所述待优化数据进行优化。

基于同样的思路,本说明书实施例还提供一种基于搜索引擎的数据优化设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

基于搜索引擎对待优化数据进行搜索爬取,获得所述待优化数据的爬取数据;

基于所述待优化数据的爬取数据,建立关联映射数据;

对所述关联映射数据进行特征提取,获得特征提取数据;

基于所述特征提取数据的融合数据,对所述待优化数据进行优化,其中,所述融合数据为将所述特征提取数据进行融合得到的数据。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书实施例提供的装置、电子设备、非易失性计算机存储介质与方法是对应的,因此,装置、电子设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、电子设备、非易失性计算机存储介质的有益技术效果。

在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmablelogicdevice,pld)(例如现场可编程门阵列(fieldprogrammablegatearray,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardwaredescriptionlanguage,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等,目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc625d、atmelat91sam、microchippic18f26k20以及siliconelabsc8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据优化设备的处理器以产生一个机器,使得通过计算机或其他可编程数据优化设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据优化设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据优化设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1