一种智能电力客服系统的构建方法及系统与流程

文档序号:12272731阅读:490来源:国知局
本发明涉及电力
技术领域
,特别涉及一种智能电力客服系统的构建方法及系统。
背景技术
:随着电力体制改革的持续推进以及全社会对电力的关注度的提高,电力客户数量快速增长,用电需求趋于多元化,用户更加注重服务体验,渴望得到更便捷、多渠道、多元化、更高效的服务,对客户服务的要求越来越高。基于互联网、尤其是移动互联网的高速发展,催生了大量的客服需求,对客服人员的管理提出了更高要求。目前,传统的客服中心,客服人员通常是根据产品说明手册或者电子知识库作为业务支撑。当客户来电询问,而客服人员的记忆中又无相关知识点时,就会从产品说明手册或者电子知识库中寻找答案,以响应客户对于业务问题的服务需求。但是,客服人员从产品说明手册或者电子知识库中对众多的业务知识和内容进行查找时,由于业务水平参差不齐,对业务问题分类的维度、问题类别、问题等级以及答案的模糊匹配程度等的把握不一,容易导致客户等待的时间过长甚至找不到答案的情况发生,而且不同的客服人员针对同一个问题可能会有多个版本的解答,耗费大量人力物力却导致用户的体验不佳。技术实现要素:有鉴于此,本发明提供了一种智能电力客服系统的构建方法及系统,用于构建智能电力客服系统,以缩短客户的等待时间,并实现对业务问题的准确解答,提升用户体验。为实现上述目的,本发明提供如下技术方案:一种智能电力客服系统的构建方法,包括:采集电力业务数据,根据所述电力业务数据建立电力词库;所述电力词库包括通用词库、行业词库、近义词库和包含词库;采集电力知识数据,根据所述电力知识数据建立电力知识库;所述电力知识库包括专业知识库和本体库;根据电力领域的电力实体、电力实体之间的关联关系以及每个电力实体的属性及属性值,建立电力知识图谱;根据所述电力词库、电力知识库和所述电力知识图谱,构建智能电力客服系统。优选地,所述采集电力业务数据,根据所述电力业务数据建立电力词库,包括:从通用已开放词库数据、业务资料数据、网站数据和外部数据中采集电力业务数据,并对采集的所述电力业务数据进行汇总;对所述电力业务数据进行数据处理;所述数据处理包括新词抽取处理、词性标注处理、词频统计处理以及权重计算处理;对经过所述数据处理之后的所述电力业务数据进行分类,并根据所述分类分别构建所述通用词库、所述行业词库、所述近义词库和所述包含词库。优选地,所述采集电力知识数据,根据所述电力知识数据建立电力知识库,包括:采集所述电力领域的标准问题和标准答案,按照预设的分级标准使所述标准问题和所述标准答案分布在不同的目录层级,构建所述专业知识库;基于动态模板构建语义表达式,并按照所述语义表达式中的本体的类别和内容,使所述语义表达式中的本体分布在不同的目录层级,构建所述本体库。优选地,所述根据电力领域的电力实体、电力实体之间的关系以及每个电力实体的属性及属性值,建立电力知识图谱,包括:为每个所述电力实体设定一个标识符,并确定每个所述电力实体的属性、属性值及各个所述电力实体之间的关联关系;根据所述标识符、属性、属性值及所述关联关系进行实体对齐、知识图谱模式构建、属性和属性值决策、属性值推理、关系推理以及实体重要性排序,建立所述电力知识图谱;所述电力知识图谱中的节点为各个所述电力实体,所述电力知识图谱中的边为各个所述电力实体之间的关联关系。优选地,还包括:对所述智能电力客服系统中的所述电力词库、所述电力知识库和所述电力知识图谱进行维护更新。一种智能电力客服系统的构建系统,包括:词库建立模块,用于采集电力业务数据,根据所述电力业务数据建立电力词库;所述电力词库包括通用词库、行业词库、近义词库和包含词库;知识库建立模块,用于采集电力知识数据,根据所述电力知识数据建立电力知识库;所述电力知识库包括专业知识库和本体库;图谱建立模块,用于根据电力领域的电力实体、电力实体之间的关联关系以及每个电力实体的属性及属性值,建立电力知识图谱;系统构建模块,用于根据所述电力词库、电力知识库和所述电力知识图谱,构建智能电力客服系统。优选地,所述词库建立模块,包括:采集单元,用于从通用已开放词库数据、业务资料数据、网站数据和外部数据中采集电力业务数据,并对采集的所述电力业务数据进行汇总;对所述电力业务数据进行数据处理;所述数据处理包括新词抽取处理、词性标注处理、词频统计处理以及权重计算处理;分类单元,用于对经过所述数据处理之后的所述电力业务数据进行分类,并根据所述分类分别构建所述通用词库、所述行业词库、所述近义词库和所述包含词库。优选地,所述知识库建立模块,包括:专业知识库构建单元,用于采集所述电力领域的标准问题和标准答案,按照预设的分级标准使所述标准问题和所述标准答案分布在不同的目录层级,构建所述专业知识库;本体库构建单元,用于基于动态模板构建语义表达式,并按照所述语义表达式中的本体的类别和内容,使所述语义表达式中的本体分布在不同的目录层级,构建所述本体库。优选地,所述图谱建立模块,包括:确定单元,用于为每个所述电力实体设定一个标识符,并确定每个所述电力实体的属性、属性值及各个所述电力实体之间的关联关系;建立单元,用于根据所述标识符、属性、属性值及所述关联关系进行实体对齐、知识图谱模式构建、属性和属性值决策、属性值推理、关系推理以及实体重要性排序,建立所述电力知识图谱;所述电力知识图谱中的节点为各个所述电力实体,所述电力知识图谱中的边为各个所述电力实体之间的关联关系。优选地,还包括:更新模块,用于对所述智能电力客服系统中的所述电力词库、所述电力知识库和所述电力知识图谱进行维护更新。通过本申请提供的智能电力客服系统的构建方法及系统,采集电力业务数据,根据所述电力业务数据建立电力词库;所述电力词库包括通用词库、行业词库、近义词库和包含词库;采集电力知识数据,根据所述电力知识数据建立电力知识库;所述电力知识库包括专业知识库和本体库;根据电力领域的电力实体、电力实体之间的关联关系以及每个电力实体的属性及属性值,建立电力知识图谱;根据所述电力词库、电力知识库和所述电力知识图谱,构建智能电力客服系统。可见,本申请实施例提供的技术方案,基于电力业务数据、电力知识数据和电力实体构建电力词库、电力知识库和电力知识图谱,能够整合自然语言处理和人机交互技术,并涵盖电力领域的各种业务和知识,为构建出的智能电力客服系统提供基础支撑,能够让构建的智能电力客服系统更清楚用户的意图,直接提供给用户准确的答案,可以缩短客户的等待时间,并实现对业务问题的准确解答,从而提升用户体验。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明第一具体实施例提供的智能电力客服系统的构建方法的流程示意图;图2是本发明第二具体实施例提供的智能电力客服系统的构建系统的结构示意图。具体实施方式相关术语解释:词库:词库是词语资料的集合,存贮于数据库中以备特定的程序检索调用;知识库:知识库是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合;这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等;知识图谱:知识图谱本质上是语义网络,是一种基于图的数据结构,根据专家设计的规则与不同种类的实体连接所组成的关系网络;知识图谱提供了从“关系”的角度去分析问题的能力。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。请参阅图1,图1是本发明第一具体实施例提供的电力客服系统的构建方法的流程示意图。本发明第一具体实施例提供的电力客服系统的构建方法,包括以下步骤:S101:采集电力业务数据,根据所述电力业务数据建立电力词库;所述电力词库包括通用词库、行业词库、近义词库和包含词库;在本申请实施例中,所述采集电力业务数据,根据所述电力业务数据建立电力词库,包括:从通用已开放词库数据、业务资料数据、网站数据和外部数据中采集电力业务数据,并对采集的所述电力业务数据进行汇总;对所述电力业务数据进行数据处理;所述数据处理包括新词抽取处理、词性标注处理、词频统计处理以及权重计算处理;对经过所述数据处理之后的所述电力业务数据进行分类,并根据所述分类分别构建所述通用词库、所述行业词库、所述近义词库和所述包含词库。电力词库作为典型知识库的专业业务知识一部分,是服务于业务管理、客服代表、厂家部门及用电客户群体的多方面的电力专业信息。通过词库建设是进行文本挖掘的基础,为电力客服服务中心提升服务能力提供支撑。本申请实施例提供的方法中涉及到的对电力词库的建设与维护如下:电力词库构建主要包含数据来源、数据处理以及词库建设3个方面,下面将分别针对上述3个方面进行详细阐述,具体如下:1)数据来源。电力词库的主要来源包含通用已开放词库、业务资料数据、网站数据和其他外部数据。需要利用数据采集技术,即利用第三方工具对可能使用的文本中的词进行汇总。常用以下主要2种采集方式:一是自动采集。通过将95598业务支持系统等的文本数据进行采集,实现文本正文内容的自动提取。围绕电力客户服务的各种业务,通过采集业务系统中的文本数据,为构建词库提供基础支撑,为后续智能问答查询等提高效率提供铺垫。二是手动添加。当然除了自动采集,也可由用户人工自由输入任意的词汇。作为自动化采集的有效补充手段,人工方式是建设词库的一个重要方法。经过自动采集和手动采集后,此时的数据的特点是分散的、异构的、不确定的、冗余的、不完备的和含噪音的,还不能直接用来构建词库,需要对这些数据进行处理后才能使用。2)数据处理。将各种分散的文本数据来源进行整合,将非结构化数据和结构化数据进行异构到同构的转化,将来源广泛且不一致的不确定数据进行清晰化操作,将自动采集到的数据进行人工自定义添加保证其完备性,将数据中的错误或引起歧义的数据清洗形成词库建设的可靠来源。一是新词抽取。其中自动化更新中最重要的一个就是新词发现。二是词性标注。词性标注的效果直接影响着基于标注结果的各种信息处理的准确度。词性标注主要将词语归类为名词、动词、助词、副词、连词、介词、形容词、时间词、代词、数词、量词、前缀、后缀等;如通过词语词性的标注要准确识别出“国家电网客户服务中心”是一个组织机构名称,是一个特殊名词。三是统计词频。从中文文章中拆分出单词后,将词语在各个数据来源文本中出现的频次进行统计,可以帮助更好地分析文章句子语义。词频排序之后可以导出txt文档,以备继续作进一步统计分析。四是权重计算。权重是指词语在整体词库中的相对重要程度。考虑词语的业务使用场景以及词语的出现频率等,并在此基础上给出词库中的词语权重计算方法。3)词库建设。按照使用意图进行分类建设,主要包括:通用词库、行业词库、近义词库和包含词库。词库建设的一个重点就是为了能够实现和客户服务领域的应用的无缝对接。一是通用词库。在电力词库的建设和使用中,是不可能完全脱离现有各种通用词库的。现有通用词库的词汇是词库选词的主要来源,否则就会造成不必要的重复劳动;通用词库主要是基于外部开放的词库进行自动获取,其目的在于覆盖各种范围的汉语词汇,为智能问答、语音质检等提供完备支撑。词语词性频次是v.50现在n.30山西n.25多少n.35家庭n.10………表1通用词库二是行业词库。在电力词库的建设和使用中,最重要和核心的是构建行业词库。行业词库的与实际电力业务密切相关,构建一个符合当前业务场景的专用词表非常重要,多通过人工的方式进行构建,涵盖发电、输电、变电、配电、电力调度和售电等全链条的行业词汇。如电价、变电器、电压、新能源等。分词基础是分词词库,客户服务中心大数据场景建设中涉及大量文本挖掘内容,电力行业词库可增加用户自定义词,提高文本分词结果准确性。词语词性频次电价n.25电量n.10电费n.20居民n.5充电桩n.8………表2行业词库三是近义词库。将现有的各种汉语词汇汇集在一起,去除重复,遇到对同一概念的表达意义一致的情况,采用具有等同关系的词语联系起来,从而达到词库同义性的要求。即从通用词库、行业词库中梳理出近义词,在业务中这些词可以被互相替代,其中最典型的词被称为近义词中的代表词。如(目前、现在),(居民、家庭),(电价、电力价格)等。代表词近义词…近义词目前目前…现在居民居民…家庭…………表3近义词库近义词基于模式的方法可以抽取到一部分。比如在语料中设置规则“A的简称是B”、“A和B是近义词”、“A的近义词是B”、“A的原名是B”等,自动检索语料,从中抽取出近义词(见下表4)。模式示例A1又叫A2元宵节又叫上元节A1又称A2元宵节又称上元节A1简称A2上海简称沪A1又名A2荷花又名莲花A1俗称A2计算机俗称电脑A1原名A2老舍原名舒庆春A1是A2的近义词喜欢是喜爱的近义词A1是A2的近义词美丽是漂亮的近义词A1是A2的简称沪是上海的简称表4近义词提取规则除此之外,电力领域专业人员可根据实际业务需求,手动提取标注出敏感词近义词词库、情感词近义词词库等,支撑客户服务水平的提升。四是包含词库。包含词是具备某类相似特征的词的组合,如覆盖省名集合、市名集合、县名集合、区名集合、街道名集合等,如覆盖百家姓等各种姓氏集合。目前语音识别引擎在录音转译时对姓氏词、电力行业词、地址地名等行业词转译不准确,通过电力包含词库建设,形成电力姓氏以及地址/地名库等供语音识别引擎使用,有助于提高语音识别准确率。集合名元素…元素省名山西…西藏姓氏张…刘…………表5包含词库包含词基于模式的方法可以抽取到一部分。比如在语料中设置规则“A包含A1、A2,……”、“A1、A2,……是A的子集”、“A1、A2,……属于A”等,自动检索语料,从中抽取出包含词。表6包含词提取规则除此之外,电力领域专业人员可根据实际业务需求,手动提取标注出市名包含词库、区名包含词库和街道包含词库等,辅助在线服务水平的提升。举例词库的应用。根据词库可以进行用户问题文本的分词。如电力词库中已有词语“山西”、“现在”、“电价”、“家庭”、“居民”、“是”、“多少”(见通用词库表、行业词库表、近义词库表和包含词库表),若在业务场景中出现一句话“山西现在家庭电价是多少”,需要根据词库完成分词。以最大正向匹配算法为例,首先将这句话进行拆字,从左至右第一个字为“山”字,在词库中未查到。继续往后追加为“山西”,在电力词库中找到对应的词语。此时还不能确定“山西”是否为词库中以山西为前缀的最长的词语,继续往后追加直至“山西现在家庭电价是多少”为止都没有查到更长的词,此时输出完成首个词语“山西”的切词。在剩余“现在家庭电价是多少”中,循环上述步骤,依次可以拆出剩余的词。得到最终的分词结果为“山西/现在/家庭/电价/是/多少”,联系我们的近义词库和包含词库,业务场景中的原话“山西现在家庭电价是多少”形成推荐语义“[省名|山西][现在][居民][电价][是][多少]”。词库的维护更新。词库的维护更新是保证一个词库的长期有效性。建设一个词库并不是一成不变的,需要对词库进行持续的长期维护。根据词库包含的内容和其特点,具体维护更新如下:通用词库。根据已有通用词库新词完成通用词提取,根据电力业务自身的更新扩展进而从文本语料中新出现的通用词更新。行业词库。根据已有通用词库新行业词提取形成一部分更新,根据电力业务自身的更新扩展进而从文本语料人工提取出新行业词,或者根据新词发现的词语进行更新。包含词库。从更新后的通用词库和行业词库中提取新的包含词,根据电力业务自身的更新扩展进而从文本语料中提取新的包含词,基于规则的包含词语更新等。近义词库。需要根据通用词库、行业词库和已有近义词库更新提取新的近义词,根据电力业务自身的更新扩展进而从文本语料中提取新的近义词,基于规则的近义词语更新等。综上所述,各种词库的更新支持自动更新和手动更新两种方式。更新词汇在加入相应的词库前需要进行人工审计,进而实现词库的更新维护。S102:采集电力知识数据,根据所述电力知识数据建立电力知识库;所述电力知识库包括专业知识库和本体库;在本申请实施例中,所述采集电力知识数据,根据所述电力知识数据建立电力知识库,包括:采集所述电力领域的标准问题和标准答案,按照预设的分级标准使所述标准问题和所述标准答案分布在不同的目录层级,构建所述专业知识库;基于动态模板构建语义表达式,并按照所述语义表达式中的本体的类别和内容,使所述语义表达式中的本体分布在不同的目录层级,构建所述本体库。本申请实施例提供的方法中涉及到的对电力知识库的建设与维护如下:电力知识库作为智能在线客服系统的核心部分,是支撑座席人员快速响应用户需求的重要环节,为客服中心提升服务水平意义重大。电力知识库构建主要包含专业知识库和本体库建设2个方面,融合多种人工智能技术和知识本体网络构建技术,以成熟的本体知识体系为基础,以强大的智能搜索引擎为核心,支持内外部全渠道应用,突破了传统客服知识管理平台只能管理非结构化知识、知识搜索效率低、知识积累无体系、知识关联少等弊端,真正实现了知识应用智能化、知识管理统一化、知识展现个性化,充分满足企业未来的知识应用需求。下面将分别针对上述2个方面进行详细阐述,具体如下:1)专业知识库。电力领域专业人员根据自身经验,设计出专业知识的目录和层级分布,按照业务实际,将知识分布在一级菜单、二级菜单、三级菜单、……等,目录的最终级菜单上包含若干个标准问题和标准答案。标准问的示例如“山西居民生活用电电价标准”,标准答的示例如“居民电量双月处于第一档[0-340度]:电压等级不满1千伏的每千瓦时电价0.477元,其余电压等级的每千瓦时电价0.467元;居民电量双月处于第二档[341-520度]:电压等级不满1千伏的每千瓦时电价0.527元,其余电压等级0.517元;居民电量双月处于第三档520度以上:电压等级不满1千伏的每千瓦时电价0.777元,其余电压等级0.767元”。2)本体库。基于动态模板的知识智能化采编发布,本体库专家根据自身经验,设计出本体库的目录和层级分布。将本体按照类别和所属内容分布在一级菜单、二级菜单、三级菜单、……等,目录的最终级菜单上包含若干个语义表达式。语义表达式的示例如“[XXX][执行][电价][标准]”、“[XXX][电价][多少]”、“[XXX][电价][贵]”,其中[XXX]为语义块,语义块示例为“[山西]”“[居民]”等。语义块和语义表达式的结合产生的动态扩展问题。当用户利用电力智能在线客服系统的知识库进行查询时,首先系统会根据词库将用户的原始问题进行拆分和理解,形成推荐语义表达式,示例如下:[省名|山西][目前][居民][电价][是][多少]之后,系统会对比推荐语义表达式和知识库中标准问、动态扩展问的相似度,按照相似度从高到低排序,设置输出阈值后就直接输出高于阈值的最佳标准问题以及标准答案。知识库的维护更新。知识库的维护更新是保证一个知识库的长期有效性。建设一个知识库并不是一撮而就的,需要对知识库进行持续的长期维护。根据知识库包含的内容和其特点,具体维护更新如下:专业知识库。由于结构化和半结构化的数据源中的专业业务知识有更新,或者因为专业业务知识更新引起的。已有目录下标准问、标准答修改,直接替换后更新;已有某目录删除,则下级目录及所属内容删除;已有某标准问、标准答删除,直接删除;新增目录、标准问、标准答,进行冲突检测,之后人工审核更新。本体库。因为专业业务知识更新引起的、因为本体库自身的结构、内容优化引起的更新。已有目录下语义表达式修改,直接替换后更新。已有某目录删除,则下级目录及所属内容删除。已有某语义表达式删除,直接删除。新增目录、语义表达式,进行冲突检测,之后人工审核更新。综上所述,电力知识库的更新支持基本需要手动方式更新。更新内容在加入相应的专业知识库和本体库前需要进行人工审计,进而实现知识库的更新维护。S103:根据电力领域的电力实体、电力实体之间的关联关系以及每个电力实体的属性及属性值,建立电力知识图谱;在本申请实施例中,所述根据电力领域的电力实体、电力实体之间的关系以及每个电力实体的属性及属性值,建立电力知识图谱,包括:为每个所述电力实体设定一个标识符,并确定每个所述电力实体的属性、属性值及各个所述电力实体之间的关联关系;根据所述标识符、属性、属性值及所述关联关系进行实体对齐、知识图谱模式构建、属性和属性值决策、属性值推理、关系推理以及实体重要性排序,建立所述电力知识图谱;所述电力知识图谱中的节点为各个所述电力实体,所述电力知识图谱中的边为各个所述电力实体之间的关联关系。本申请实施例提供的方法中涉及到的对电力知识图谱的建设与维护如下:电力知识图谱作为智能在线客服系统的含金量最高级内容,是支撑座席人员快速响应用户需求的不可或缺环节,为客服服务水平产生质的飞越作用显著。知识图谱旨在描述真实世界中存在的各种实体或概念,可被看作是一张巨大的图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。其中:1)实体。每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符。最典型的包括人名、地名、机构名等三类通用实体。对于电力行业,除了通用实体外,存在更丰富的实体,如变压器、变电站、输电线路、配网、主网、充电桩等等。2)属性-值。每个属性-值对用来刻画实体的内在特性。属性值范围包括:数值型(如年龄),枚举型(如民族、星座),短文本(如出生地),长文本(如简介);3)关系。而关系用来连接两个实体,刻画它们之间的关联。典型的关系抽取方法采用自的思想,按照“模板生成实例抽取”的流程不断迭代直至收敛。例如,最初可以通过“X是Y的总部地址”模板抽取出(国家电网,总部地址,北京)三元组实例;然后根据三元组中的实体对“国家电网-北京”可以发现更多的匹配模板,如“Y的总部地址是X”、“X是Y的中心”等;进而用新发现的模板抽取更多新的三元组实例,通过反复迭代不断抽取新的实例与模板。还可以通过识别表达语义关系的短语来抽取实体间关系。例如,通过句法分析,可以从文本中发现“国家电网”与“北京”的如下关系:(国家电网,总部位于,北京)、(国家电网,总部设置于,北京)、以及(国家电网,将其总部建于,北京)。通过这种方法抽取出的实体间关系非常丰富而自由,一般是一个以动词为核心的短语。电力知识图谱通过整合海量的电力业务的碎片化信息,对搜索结果进行重新优化计算,将核心的信息展现给用户。而这就与传统的“关键词搜索”区别较大,不是单纯的抓取知识数据,而是引入“语义理解”技术,使得用户查询搜索更加精准,权威和全面,提升用户的查询体验,这一切都离不开下述几种技术的支持:一是实体对齐。旨在发现具有不同ID但却代表真实世界中同一对象的那些实体,并将这些实体归并为一个具有全局唯一标识的实体对象添加到知识图谱中。实体对齐普遍采用的方法是聚类,关键在于定义合适的相似度度量。这些相似度度量遵循如下观察:具有相同描述的实体可能代表同一实体(字符相似);具有相同属性-值的实体可能代表相同对象(属性相似);具有相同邻居的实体可能指向同一个对象(结构相似)。这种自动化方法无法保证100%的准确率,所以这些方法的产出结果将作为候选供人工进一步审核和过滤。二是知识图谱模式构建。模式是对知识的提炼,而且遵循预先给定的模式有助于知识的标准化,更利于查询等后续处理。为知识图谱构建模式相当于为其建立本体。最基本的本体包括概念、概念层次、属性、属性值类型、关系、关系定义域概念集以及关系值域概念集。在此基础上,我们可以额外添加规则或公理来表示模式层更复杂的约束关系。模式定义了领域,类别和实体。每个领域有若干类别,每个类别包含多个实体且和多个属性值关联,这些属性值规定了属于当前类别的那些实体需要包含的属性和关系。三是属性-值决策。有一些实体会同时属于两个互斥的类别(如男女)或某个实体所对应的一个属性对应多个值。这样就会出现不一致性。这些互斥的类别对以及属性-值以看作是模式层的知识,通常规模不是很大,可以通过手工指定规则来定义。而由于不一致性的检测要面对大规模的实体及相关事实,纯手工的方法将不再可行。一个简单有效的方法充分考虑数据源的可靠性以及不同信息在各个数据源中出现的频度等因素来决定最终选用哪个类别或哪个属性值。也就是说,我们优先采用那些可靠性高的数据源(如电力法律类或业务标准中的结构化数据)抽取得到的事实。另外,如果一个实体在多个数据源中都被识别为某个类别的实例,或实体某个属性在多个数据源中都对应相同的值,那么倾向于最终选择该类别和该值。四是推理。被广泛用于发现隐含知识。推理功能一般通过可扩展的规则引擎来完成。知识图谱上的规则一般涉及两大类。一类是针对属性的,即通过数值计算来获取其属性值。例如:知识图谱中包含某人的电量及电价数据,在计算其缴纳电费时,可以通过电量乘以电价获取其电费。这类规则对于那些属性值随其他因素发生改变的情况特别有用。另一类是针对关系的,即通过链式规则发现实体间的隐含关系。例如,可以定义规定:岳父是妻子的父亲。利用这条规则,当已知姚明的妻子(叶莉)和叶莉的父亲(叶发)时,可以推出姚明的岳父是叶发。结合用户上下文语义进行知识推理和扩展,能适应客户更加复杂化的提问方式。例如,当山西省电力用户在智能在线客服系统中先后查询“山西现在家庭电价是多少?”和“近2月没超340度,但上月交的电费贵了20多元”,系统输出的答案是“居民电费是由电量和电价相乘计算得到。当前您执行双月第一档电价,电价没有变化,电价最高为每千瓦时0.477元。您的电费增加了20多元,是电量至少增加了40度”,这是结合上下文推理的答案。除了这样的“一问一答”,用户还可以继续与系统对话,问它又一个问题“电量怎么会变化这么大呢?”,系统最终回答“居民电量增加的原因主要包括:已有用电器线路老化、新购用电器增加功率以及被盗电”。这样可以让用户使用自然语言进行搜索,并且采用多轮交互的方式来逐步澄清和满足需求,从而完成深度决策型的搜索任务。五是实体重要性排序。智能在线客服系统识别用户查询中提到的实体,并通过知识卡片展现该实体的结构化摘要。当查询涉及多个实体时,系统将选择与查询更相关且更重要的实体来展示。知识图谱中的节点从单一的网页变成了各种类型的实体,而图中的边也由连接网页的超链接变成丰富的各种语义关系。由于不同的实体和语义关系的流行程度以及抽取的置信度均不同,而这些因素将影响实体重要性的最终计算结果。电力知识图谱的维护更新。知识图谱的维护更新是保证一个知识图谱的长期有效性。建设一个知识图谱需要不断地去完善和优化,因为加入到知识图谱中的数据不是一成不变的。如实体类型对应的实例往往是动态变化的(中国国家主席随着时间的推移可能对应不同的人)。需要对知识图谱进行持续的长期维护。根据知识图谱包含的内容和其特点,具体维护更新如下:数据层的更新。结构化和半结构化的数据源中的知识有更新。对于实体、关系、属性、值的自身内容的更新,由于它们的变更影响的仅是当前内容本身,可以直接替换或者利用编辑器进行编辑修改等操作即可。数据模式的更新。因为使用的自动学习算法在语料添加、算法改进等方面变化时,所学习的知识发生变化,这些知识变化规约到数据模式层的变化。知识图谱的数据模式为了保证其质量,由专业团队审核和维护。为了提高电力知识图谱的覆盖率,需要借助自动化算法从各种电力业务数据源抽取新的类型信息(也包含关联的属性信息),这些类型信息通过一个称为概念的数据结构保存。它们不是马上被加入到知识图谱数据模式中。有些今天生成后第二天就被删除了,有些则能长期的保留在概念中,如果概念中的某一种类型能够长期的保留,发展到一定程度后,由专业的人员进行决策和命名并最终成为一种新的类型。如果是对现有实体、关系、属性(包括属性类型,值类型,值域)的添加,系统检测到冲突以后,由人工进行处理即可。若无检测到冲突,直接增加即可;如果是对对现有实体、关系、属性(包括属性类型,值类型,值域)的删除:删除实体时去除实体及所属的关系、属性等全部内容;删除关系时直接删除关系即可,去掉链接。删除属性时,属性属于的所有实体中该属性全部被移除。综上所述,电力知识图谱的更新需要人工参与结合程序自动方式同时使用。更新内容在加入相应的知识图谱前需要进行人工审计,进而实现知识图谱的更新维护。S104:根据所述电力词库、电力知识库和所述电力知识图谱,构建智能电力客服系统。在本申请实施例中,建立所述电力词库、电力知识库和所述电力知识图谱后,就可以根据所述电力词库、电力知识库和所述电力知识图谱,构建智能电力客服系统。依托互联网技术、人工智能语技术、自然语言处理技术等,适用于电网公司客户服务中心的智能电力客服系统可以根据用户的提问向用户输出对应的标准答案。智能电力客服系统内嵌电力词库,电力知识库和电力知识图谱,可以将来自微信、网站、移动端APP等多个渠道的问题汇总到同一个智能进行管理,支持对客户咨询自然语言的多层次语义分析、支持跨业务的语义检索、支持用户上下文的知识推理、支持电力业务信息和关联知识融合,真正做到智能在线客服。只要电力客户服务中心在后台将相关问题及编辑好的答案收录到智能问答系统当中,就可以一劳永逸的自动为用户提供日夜无休的匹配解答。这种智能在线客服将会是非常受用户喜欢的一种服务方式。智能电力客服系统利用海量的数据积累与数据处理能力,解决了人工重复回答、客服人员不足等问题,保证人工客服仅专注于解决用户个性化问题,为企业节省大比例的人工客服成本。本发明能快速准确洞悉用户意图,并自组答案为用户解答,大幅提升客服工作效率。相比现有的电子知识库,本发明主要体现出以下优势:第一电力词库。基于语义而非词形的语言词典结构,涵盖范围广且包含词汇的词性、频次等内容,为电力智能在线客服提供基础支撑;第二多层次、多视角、细粒度的电力知识库。利用成熟的本体理论,创建知识本体,并将语言知识库和业务知识库分离,利用语义规则关联语言知识和业务知识,基于语义模型的句子相似度计算技术推算关联知识,建立电力客服领域本体的动态多维度智能知识库模型,有利于电力知识的结构化管理和精细化维护。第三最全面、最有深度和广度的电力知识图谱。整合自然语言处理和人机交互技术,构建电力知识图谱。电力知识图谱通过建立实体之间的属性与关系,让智能在线客服系统更懂用户的意图,提供用户直接答案,解答用户的疑惑。借助于知识图谱,结合用户行为信息,为用户提供更符合当前场景的搜索结果。通过知识图谱梳理业务脉络,为用户在广度和深度上提供多维度的内容。通过电力知识图谱建立实体之间的关联,扩展用户搜索结果,发现更多内容,为用户提供更丰富的相关信息推荐。电力智能在线客服系统的上线不仅可以为企业提供细粒度知识管理技术,还能为企业与海量用户之间的沟通建立一种基于自然语言的快捷有效的技术手段,还可以为广大用电群体提供新的问题解决渠道,更为特殊的用电群体带来了新技术的福音。智能在线客服系统的开通,也可以让听说障碍人士及时得到帮助。只要电力客户服务中心开启系统的在线即时互动方式,这种沟通方式可以有效地填补“帮助中心”所不具备的亲和力,同时又比电话服务更为自由开放,符合用电用户的需求,且能用最少的人力,为客户提供最满意的服务。请参阅图2,图2是本发明第二具体实施例提供的电力客服系统的构建系统的结构示意图。本发明第二具体实施例提供的电力客服系统的构建系统,包括:词库建立模块1,用于采集电力业务数据,根据所述电力业务数据建立电力词库;所述电力词库包括通用词库、行业词库、近义词库和包含词库;知识库建立模块2,用于采集电力知识数据,根据所述电力知识数据建立电力知识库;所述电力知识库包括专业知识库和本体库;图谱建立模块3,用于根据电力领域的电力实体、电力实体之间的关联关系以及每个电力实体的属性及属性值,建立电力知识图谱;系统构建模块4,用于根据所述电力词库、电力知识库和所述电力知识图谱,构建智能电力客服系统。优选地,所述词库建立模块1,包括:采集单元,用于从通用已开放词库数据、业务资料数据、网站数据和外部数据中采集电力业务数据,并对采集的所述电力业务数据进行汇总;对所述电力业务数据进行数据处理;所述数据处理包括新词抽取处理、词性标注处理、词频统计处理以及权重计算处理;分类单元,用于对经过所述数据处理之后的所述电力业务数据进行分类,并根据所述分类分别构建所述通用词库、所述行业词库、所述近义词库和所述包含词库。优选地,所述知识库建立模块2,包括:专业知识库构建单元,用于采集所述电力领域的标准问题和标准答案,按照预设的分级标准使所述标准问题和所述标准答案分布在不同的目录层级,构建所述专业知识库;本体库构建单元,用于基于动态模板构建语义表达式,并按照所述语义表达式中的本体的类别和内容,使所述语义表达式中的本体分布在不同的目录层级,构建所述本体库。优选地,所述图谱建立模块3,包括:确定单元,用于为每个所述电力实体设定一个标识符,并确定每个所述电力实体的属性、属性值及各个所述电力实体之间的关联关系;建立单元,用于根据所述标识符、属性、属性值及所述关联关系进行实体对齐、知识图谱模式构建、属性和属性值决策、属性值推理、关系推理以及实体重要性排序,建立所述电力知识图谱;所述电力知识图谱中的节点为各个所述电力实体,所述电力知识图谱中的边为各个所述电力实体之间的关联关系。优选地,还可以包括:更新模块,用于对所述智能电力客服系统中的所述电力词库、所述电力知识库和所述电力知识图谱进行维护更新。本申请实施例提供的电力客服系统的构建系统,可以采用上述方法实施例中的电力客服系统的构建方法,具体功能可以参照上述方法实施例中的步骤描述,此处不再赘述。通过本申请提供的智能电力客服系统的构建方法及系统,采集电力业务数据,根据所述电力业务数据建立电力词库;所述电力词库包括通用词库、行业词库、近义词库和包含词库;采集电力知识数据,根据所述电力知识数据建立电力知识库;所述电力知识库包括专业知识库和本体库;根据电力领域的电力实体、电力实体之间的关联关系以及每个电力实体的属性及属性值,建立电力知识图谱;根据所述电力词库、电力知识库和所述电力知识图谱,构建智能电力客服系统。可见,本申请实施例提供的技术方案,基于电力业务数据、电力知识数据和电力实体构建电力词库、电力知识库和电力知识图谱,能够整合自然语言处理和人机交互技术,并涵盖电力领域的各种业务和知识,为构建出的智能电力客服系统提供基础支撑,能够让构建的智能电力客服系统更清楚用户的意图,直接提供给用户准确的答案,可以缩短客户的等待时间,并实现对业务问题的准确解答,从而提升用户体验。为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或
技术领域
内所公知的任意其它形式的存储介质中。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1