配网设备状态数据处理方法、装置、计算机设备及介质与流程

文档序号:18900780发布日期:2019-10-18 21:54阅读:214来源:国知局
配网设备状态数据处理方法、装置、计算机设备及介质与流程

本发明涉及计算机数据处理领域,特别是涉及一种配网设备状态数据处理方法、装置、计算机设备及计算机存储介质。



背景技术:

在电力系统的运行过程中,管理员需要周期性检测配电网的状态信息,以便于发现尽快配网设备状态的异常并解决,保证电力系统的正常运行。

随着电网的发展,以及用户对供电可靠性要求的逐渐提高,传统的周期性检测方式已无法满足配电网的运维需求,存在效率低、准确度不高、检测过于主观的缺点。



技术实现要素:

基于此,有必要针对现有配网周期性检修效率低、准确度低、检测过于主观的问题,提供一种配网设备状态数据处理方法及装置。

一种配网设备状态数据处理方法,包括:获取配网设备的历史状态数据;对历史状态数据进行分词处理,得到多个分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练;根据数据训练的输出参数更新神经网络模型的权值;根据更新后的神经网络模型监测配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。

上述配网设备状态数据处理方法,基于神经网络算法,并根据配网设备的运行机制对神经网络算法进行优化,将优化后的算法运用于配网设备的状态参数监测。与传统的周期性检测方式对比,上述方法对电力设备进行状态监测得到的数据更加精准与及时,同时能监控到的逻辑因素也更加丰富,能够实现高效、便捷地对配网设备的状态进行监控。

在其中一个实施例中,在对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理之前,上述方法还包括:根据预设的停词库,过滤上述多个分词中的停词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。

在其中一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,上述方法还包括:查询预设的分词库中是否包含过滤后的分词;若预设的分词库中不包含过滤后的分词,则将过滤后的分词更新到分词库中。

在其中一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,上述方法还包括:接收修正指令;根据修正指令修正过滤后的分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。

在其中一个实施例中,对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对上述多个分词进行文本聚类处理,得到至少一个类别;分别计算每个类别中的关键字;对每个类别中的关键字进行关联分析处理。

在其中一个实施例中,根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练,包括:初始化预设的神经网络模型的至少一个参数;根据至少一个参数及预设的训练数据计算神经网络模型的隐含层输出;根据隐含层输出计算神经网络模型的输出层输出。

在其中一个实施例中,根据数据训练的输出参数更新神经网络模型的权值,包括:将训练数据输入神经网络模型,记录神经网络模型的输出层输出;计算输出层输出与期望输出值之间的误差;根据误差更新神经网络模型的输入层到隐含层的权重。

在其中一个实施例中,提供一种配网设备状态数据处理装置,其包括:获取模块,用于获取配网设备的历史状态数据;分词模块,用于对历史状态数据进行分词处理,得到多个分词;聚类分析模块,用于对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;训练模块,用于根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练;更新模块,用于根据数据训练的输出参数更新神经网络模型的权值;监测模块,用于根据更新后的神经网络模型监听并检测配网设备的状态信息,并在根据所述状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。

上述配网设备状态数据处理装置,基于神经网络算法,并根据配网设备的运行机制对神经网络算法进行优化,将优化后的算法运用于配网设备的状态参数监测。与传统的周期性检测方式对比,上述装置对电力设备进行状态监测得到的数据更加精准与及时,同时能监控到的逻辑因素也更加丰富,能够实现高效、便捷地对配网设备的状态进行监控。

在其中一个实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现本发明任一实施例的方法的步骤。

在其中一个实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本发明任一实施例的方法的步骤。

附图说明

图1为本发明一实施例的配网设备状态数据处理方法的流程示意图;

图2为本发明另一实施例的配网设备状态数据处理方法的流程示意图;

图3为本发明又一实施例的配网设备状态数据处理方法的流程示意图;

图4为本发明一实施例的配网设备状态数据处理装置的结构示意图;

图5为本发明一实施例的配网设备状态数据处理装置中的聚类分析模块的结构示意图;

图6为本发明一实施例的配网设备状态数据处理装置中的训练模块的结构示意图;

图7为本发明一实施例的计算机设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

在一个实施例中,提供一种网设备状态数据处理方法,其包括如下步骤:获取配网设备的历史状态数据;对上述历史状态数据进行分词处理,得到多个分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;根据上述关联分析处理的输出参数创建神经网络模型,并对上述神经网络模型进行数据训练;根据上述数据训练的输出参数更新上述神经网络模型的权值;根据更新后的神经网络模型监测上述配网设备的状态信息,并在根据状态信息检测到配网设备状态处于异常状态时,对配网设备进行检修。

在一个实施例中,提供一种配网设备状态数据处理方法。如图1所示,此配网设备状态数据处理方法包括如下步骤:

s101,获取配网设备的历史状态数据。

其中,获取电力系统中至少一种配网设备的历史状态数据。

在一个实施例中,获取电力系统中至少一种配网设备在不同条件下的历史状态数据。例如,获取每种配网设备在不同气候、环境、设备年限、负载情况等条件下的历史状态数据。该历史状态数据包括故障数据。

s103,对上述历史状态数据进行分词处理,得到多个分词。

在本步骤,通过分词处理,将历史状态数据中包含的文字序列切分成多个具有意义的词。其中,历史状态数据中包括故障描述信息,经过分词处理后,故障描述信息被切分成多个分词。

在一个实施例中,通过ansj分词算法对历史状态数据进行分词处理。

s105,对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理。

其中,通过文本聚类处理,将上述多个分词划分为至少一个类别。根据预设的关键词算法分别对每个类别中的分词进行关键词计算,得出每个类别中的至少一个关键词。对同一类别中的至少一个关键词进行关联分析处理,计算出同一类别的多个关键词之间的关联度或支持度。

在一个实施例中,文本聚类处理之后,若存在不属于任何一个类别的分词,则将该分词作为噪声对象进行过滤。

在一个实施例中,如图2所示,步骤s105包括:

s1051,对上述多个分词进行文本聚类处理,得到至少一个类别。

一个实施例中,通过基于密度的聚类算法对上述多个分词进行文本聚类处理,得到至少一个类别,并且同个类别中的任意两个分词密度相连。

其中,设定邻域半径为e,核心对象的阈值为m。则以特定对象为球心,以邻域半径e为半径的球形区域成为该对象的e邻域。其中邻域半径e的界定可以采用距离、余弦相似度、word2vec等表征。例如本步骤可采用余弦相似度来表征。若特定对象e邻域内的对象个数大于等于m,则称该对象为核心对象或核心点。

在一个实施例中,确定一个核心点后,从该核心点出发,不断向密度可达的区域扩张,从而密度相连的最大集合,即得到一个包含核心对象和边界对象的最大化区域,区域中任意两点密度相连。

其中,密度相连指的是:给定一个对象集合d,若存在对象o属于d,使对象p和q均从o关于e和m密度可达的,那么对于对象p到q是关于e和m密度相连的。密度可达指的是:给定一个对象集合d,若存在一个对象链p1,p2,p3,...,pn,p1=q,pn=p,对于pi属于d,i属于1~n,p(i+1)是从pi关于e和m直接密度可达的,则称对象p从对象q关于e和m密度可达的。直接密度可达指的是:给定一个对象集合d,若对象p在q的e邻域内,且q是一个核心对象,则称对象p从对象q出发是直接密度可达的。

其中,给定一个对象集合d,若核心对象p中存在对象q,但是q对象自身并非核心对象,则称q为边界对象。给定一个对象集合d,若对象o既不是核心对象,也不是边界对象,则称o为噪声对象。

在一个实施例中,确定任一核心点后,寻找从该核心点出发的所有密度相连的数据点。遍历该核心点的邻域内的所有核心点,寻找与这些数据点密度相连的点,直到没有可以扩充的数据点为止,最后聚类成的簇的边界节点都是非核心数据点。在一个实施例中,寻找没有被聚类的核心点,重复上述步骤,直到数据集中没有新的核心点为止。数据集中没有包含在任何簇中的数据点则识别为异常点,即噪声对象。

s1052,分别计算每个类别中的关键字。

其中,根据每个类别中词语的统计信息计算各类别中的关键字。对于每个类别,通过预处理确定该类别的候选词集合,采用特征值来量化每个候选词的分数,根据分数从候选词中确定该类别的关键词。

可选地,上述特征值是基于词频(tf)和逆文档概率(idf)的特征值。或者,上述特征值是基于文档位置信息的特征值。或者,上述特征值是基于词跨度计算的特征值。

s1053,对每个类别中的关键字进行关联分析处理。

其中,本步骤包括:计算每个类别中的各关键字之间的支持度。支持度指的是几个关联的数据在数据集中出现的次数占总数据集的比重,或者说是几个数据关联出现的概率。

在一个实施例中,对每个类别中的任意两个关键字x和y,根据如下公式计算关键字x和关键字y之间的支持度s(x,y):其中,num(xy)为关键字x和关键字y同时出现的次数,num(a)为关键字的总数量。

在一个实施例中,对每个类别中的任意三个关键字x、y和z,根据如下公式计算关键字x、关键字y和关键字z之间的支持度s(x,y,z):其中:num(xyz)为关键字x、关键字y和关键字z同时出现的次数,num(a)为关键字的总数量。

s107,根据上述关联分析处理的输出参数创建神经网络模型,并对上述神经网络模型进行数据训练。

在一个实施例中,如图3所示,步骤s107包括如下步骤:

s1071,初始化预设的神经网络模型的至少一个参数。

具体地,本步骤包括:初始化预设的神经网络模型的输入层节点个数为n、隐含层节点个数l、输出层的节点个数m、输入层到隐含层的权重ωij、隐含层到输出层的权重ωjk、输入层到隐含层的偏置aj、隐含层到输出层的偏置bk和学习速率为η;以及,初始化激励函数g(x)为

s1072,根据上述至少一个参数及预设的训练数据计算上述神经网络模型的隐含层输出。其中,根据计算上述神经网络模型的隐含层输出hj。

s1073,根据上述隐含层输出计算上述神经网络模型的输出层输出。其中,根据计算上述神经网络模型的输出层输出ok。

s109,根据上述数据训练的输出参数更新上述神经网络模型的权值。

在一个实施例中,步骤s109包括:将训练数据输入上述神经网络模型,记录上述神经网络模型的输出层输出。计算上述输出层输出与期望输出值之间的误差;例如,根据计算上述输出层输出与期望输出值之间的误差,其中ok为上述神经网络模型的输出层输出,yk为期望输出值;其中,i=1…n,j=1…l,k=1…m。根据上述误差更新上述神经网络模型的输入层到隐含层的权重。

在一个实施例中,以误差函数达到最小值为条件,更新神经网络模型的输入层到隐含层的权重。具体地,根据如下公式更新上述权重:

其中,ek=yk-ok。

s111,根据更新后的神经网络模型监测上述配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。

其中,将权值更新后的神经网络模型运用在配网系统中,用于检测配网设备的状态信息,包括监测配网设备的运行状态、风险信息等。当根据状态信息检测到配网设备状态处于异常状态时,对配网设备进行检修。

上述配网设备状态数据处理方法,基于神经网络算法,并根据配网设备的运行机制对神经网络算法进行优化,将优化后的算法运用于配网设备的状态参数监测。与传统的周期性检测方式对比,上述方法对电力设备进行状态监测得到的数据更加精准与及时,同时能监控到的逻辑因素也更加丰富,能够实现高效、便捷地对配网设备的状态进行监控。本发明实施例较大程度提高了配网的供电可靠性和检修效率,为配网设备的性能支撑与运行保护工作起到很大的帮助作用。

在一个实施例中,在步骤s105之前,上述配网设备状态数据处理方法还包括如下步骤:根据预设的停词库,过滤上述多个分词中的停词。其中,停词指的是不需要处理的词,可以是标点符号或者是常见的语气词、副词、连接词等。本实施例中,预先设置了停词库,停词库中包括至少一个停词。在步骤s103之后,将得到的每个分词与停词库进行对比,若得到的分词存在于停词库中,则将该分词过滤掉。此时,步骤s105包括:对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。这样,可以减少计算量,提升计算效率。

在一个实施例中,在根据预设的停词库,过滤上述多个分词中的停词之后,上述配网设备状态数据处理方法还包括如下步骤:查询预设的分词库中是否包含过滤后的分词;若预设的分词库中不包含过滤后的分词,则将过滤后的分词更新到上述分词库中。这样,能够增加分词库中的样本数,使得分词库愈加完善,提升后续分词的准确性。

为了提升数据处理的准确性,在一个实施例中,在根据预设的停词库,对上述多个分词进行过滤之后,上述配网设备状态数据处理方法还包括如下步骤:接收修正指令;根据上述修正指令修正过滤后的分词;相应地,步骤s105包括:对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。这样,当自动分词的结果不够准确时,根据修正指令对分词结果进行修正,以确保分词的准确性,从而保证后续数据处理的准确性。进一步地,还可根据修正后的分词更新分词库,以提升系统分词的准确性。

在一个实施例中,如图4所示,提供一种配网设备状态数据处理装置40,其包括获取模块401、分词模块402、聚类分析模块403、训练模块404、更新模块405及监测模块406,其中:获取模块401用于获取配网设备的历史状态数据;分词模块402用于对上述历史状态数据进行分词处理,得到多个分词;聚类分析模块403用于对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;训练模块404用于根据上述关联分析处理的输出参数创建神经网络模型,并对上述神经网络模型进行数据训练;更新模块405用于根据上述数据训练的输出参数更新上述神经网络模型的权值;监测模块406用于根据更新后的神经网络模型监测上述配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。

上述配网设备状态数据处理装置,基于神经网络算法,并根据配网设备的运行机制对神经网络算法进行优化,将优化后的算法运用于配网设备的状态参数监测与检修。与传统的周期性检测方式对比,上述装置对电力设备进行状态监测得到的数据更加精准与及时,同时能监控到的逻辑因素也更加丰富,能够实现高效、便捷地对配网设备的状态进行监控。本发明实施例较大程度提高了配网的供电可靠性和检修效率,为配网设备的性能支撑与运行保护工作起到很大的帮助作用。

在一个实施例中,为了可以减少计算量,提升计算效率,上述配网设备状态数据处理装置还包括过滤模块,过滤模块用于根据预设的停词库,过滤所述多个分词中的停词;此时,聚类分析模块403还用于对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。

在一个实施例中,为了完善分词库,上述配网设备状态数据处理装置还包括查询模块,用于查询预设的分词库中是否包含过滤后的分词;上述分词模块402还用于当预设的分词库中不包含过滤后的分词时,则将过滤后的分词更新到所述分词库中。这样,能够增加分词库中的样本数,使得分词库愈加完善,提升后续分词的准确性。

在一个实施例中,为了提升数据处理的准确性,上述配网设备状态数据处理装置还包括:接收模块,用于接收修正指令;修正模块,用于根据所述修正指令修正过滤后的分词;此时,上述聚类分析模块403还用于对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。这样,当自动分词的结果不够准确时,根据修正指令对分词结果进行修正,以确保分词的准确性,从而保证后续数据处理的准确性。进一步地,还可根据修正后的分词更新分词库,以提升系统分词的准确性。

在一个实施例中,如图5所示,聚类分析模块403包括聚类单元4031、第一计算单元4032和关联分析单元4033,其中聚类单元4031用于对所述多个分词进行文本聚类处理,得到至少一个类别;第一计算单元4032用于分别计算每个类别中的关键字;关联分析单元4033用于对每个类别中的关键字进行关联分析处理。

在一个实施例中,关联分析单元4033还用于计算每个类别中的各关键字之间的支持度。

在一个实施例中,关联分析单元4033还用于对每个类别中的任意两个关键字x和y,根据如下公式计算关键字x和关键字y之间的支持度s(x,y):其中,num(xy)为关键字x和关键字y同时出现的次数,num(a)为关键字的总数量。

在一个实施例中,关联分析单元4033还用于对每个类别中的任意三个关键字x、y和z,根据如下公式计算关键字x、关键字y和关键字z之间的支持度s(x,y,z):其中,num(xyz)为关键字x、关键字y和关键字z同时出现的次数,num(a)为关键字的总数量。

在一个实施例中,如图6所示,训练模块404包括初始化单元4041、第二计算单元4042和第三计算单元4043,其中初始化单元4041用于初始化预设的神经网络模型的至少一个参数;第二计算单元4042用于根据所述至少一个参数及预设的训练数据计算所述神经网络模型的隐含层输出;第三计算单元4043用于根据所述隐含层输出计算所述神经网络模型的输出层输出。

在一个实施例中,初始化单元4041还用于初始化预设的神经网络模型的输入层节点个数为n、隐含层节点个数l、输出层的节点个数m、输入层到隐含层的权重ωij、隐含层到输出层的权重ωik、输入层到隐含层的偏置aj、隐含层到输出层的偏置bk和学习速率为η;以及,初始化激励函数g(x)为

在一个实施例中,第二计算单元4042用于根据计算所述神经网络模型的隐含层输出hj。

在一个实施例中,第三计算单元4043用于根据计算所述神经网络模型的输出层输出ok。

在一个实施例中,更新模块包括:记录单元、第四计算单元和权重更新单元,其中记录单元用于将训练数据输入所述神经网络模型,记录所述神经网络模型的输出层输出;第四计算单元用于计算所述输出层输出与期望输出值之间的误差;权重更新单元用于根据所述误差更新所述神经网络模型的输入层到隐含层的权重。

在一个实施例中,如图7所示,提供一种计算机设备,其包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现如下步骤:获取配网设备的历史状态数据;对历史状态数据进行分词处理,得到多个分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练;根据数据训练的输出参数更新神经网络模型的权值;根据更新后的神经网络模型监测配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。

在一个实施例中,在对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理之前,处理器执行计算机程序时还实现如下步骤:根据预设的停词库,过滤上述多个分词中的停词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。

在一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,处理器执行计算机程序时还实现如下步骤:查询预设的分词库中是否包含过滤后的分词;若预设的分词库中不包含过滤后的分词,则将过滤后的分词更新到分词库中。

在一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,处理器执行计算机程序时还实现如下步骤:接收修正指令;根据修正指令修正过滤后的分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。

在一个实施例中,对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对上述多个分词进行文本聚类处理,得到至少一个类别;分别计算每个类别中的关键字;对每个类别中的关键字进行关联分析处理。

在一个实施例中,对每个类别中的关键字进行关联分析处理,包括:计算每个类别中的各关键字之间的支持度。

在一个实施例中,计算每个类别中的各关键字之间的支持度,包括:对每个类别中的任意两个关键字x和y,根据如下公式计算关键字x和关键字y之间的支持度s(x,y):其中,num(xy)为关键字x和关键字y同时出现的次数,num(a)为关键字的总数量。

在一个实施例中,计算每个类别中的各关键字之间的支持度,包括:对每个类别中的任意三个关键字x、y和z,根据如下公式计算关键字x、关键字y和关键字z之间的支持度s(x,y,z):其中,num(xyz)为关键字x、关键字y和关键字z同时出现的次数,num(a)为关键字的总数量。

在一个实施例中,根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练,包括:初始化预设的神经网络模型的至少一个参数;根据至少一个参数及预设的训练数据计算神经网络模型的隐含层输出;根据隐含层输出计算神经网络模型的输出层输出。

在一个实施例中,初始化神经网络模型的至少一个参数,包括:初始化预设的神经网络模型的输入层节点个数为n、隐含层节点个数l、输出层的节点个数m、输入层到隐含层的权重ωij、隐含层到输出层的权重ωjk、输入层到隐含层的偏置aj、隐含层到输出层的偏置bk和学习速率为η;初始化激励函数g(x)为

在一个实施例中,根据至少一个参数及预设的训练数据计算神经网络模型的隐含层输出,包括:根据计算神经网络模型的隐含层输出hj。

在一个实施例中,根据隐含层输出计算神经网络模型的输出层输出,包括:根据计算神经网络模型的输出层输出ok。

在一个实施例中,根据数据训练的输出参数更新神经网络模型的权值,包括:将训练数据输入神经网络模型,记录神经网络模型的输出层输出;计算输出层输出与期望输出值之间的误差;根据误差更新神经网络模型的输入层到隐含层的权重。

在一个实施例中,计算输出层输出与期望输出值之间的误差,包括:根据计算输出层输出与期望输出值之间的误差,其中ok为神经网络模型的输出层输出,yk为期望输出值;其中,i=1…n,j=1…l,k=1…m。

在一个实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如下步骤:获取配网设备的历史状态数据;对历史状态数据进行分词处理,得到多个分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练;根据数据训练的输出参数更新神经网络模型的权值;根据更新后的神经网络模型监测配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。

在一个实施例中,在对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理之前,计算机程序被处理器执行时还实现如下步骤:根据预设的停词库,过滤上述多个分词中的停词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。

在一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,计算机程序被处理器执行时还实现如下步骤:查询预设的分词库中是否包含过滤后的分词;若预设的分词库中不包含过滤后的分词,则将过滤后的分词更新到分词库中。

在一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,计算机程序被处理器执行时还实现如下步骤:接收修正指令;根据修正指令修正过滤后的分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。

在一个实施例中,对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对上述多个分词进行文本聚类处理,得到至少一个类别;分别计算每个类别中的关键字;对每个类别中的关键字进行关联分析处理。

在一个实施例中,对每个类别中的关键字进行关联分析处理,包括:计算每个类别中的各关键字之间的支持度。

在一个实施例中,计算每个类别中的各关键字之间的支持度,包括:对每个类别中的任意两个关键字x和y,根据如下公式计算关键字x和关键字y之间的支持度s(x,y):其中,num(xy)为关键字x和关键字y同时出现的次数,num(a)为关键字的总数量。

在一个实施例中,计算每个类别中的各关键字之间的支持度,包括:对每个类别中的任意三个关键字x、y和z,根据如下公式计算关键字x、关键字y和关键字z之间的支持度s(x,y,z):其中,num(xyz)为关键字x、关键字y和关键字z同时出现的次数,num(a)为关键字的总数量。

在一个实施例中,根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练,包括:初始化预设的神经网络模型的至少一个参数;根据至少一个参数及预设的训练数据计算神经网络模型的隐含层输出;根据隐含层输出计算神经网络模型的输出层输出。

在一个实施例中,初始化神经网络模型的至少一个参数,包括:初始化预设的神经网络模型的输入层节点个数为n、隐含层节点个数l、输出层的节点个数m、输入层到隐含层的权重ωij、隐含层到输出层的权重ωik、输入层到隐含层的偏置aj、隐含层到输出层的偏置bk和学习速率为η;初始化激励函数g(x)为

在一个实施例中,根据至少一个参数及预设的训练数据计算神经网络模型的隐含层输出,包括:根据计算神经网络模型的隐含层输出hj。

在一个实施例中,根据隐含层输出计算神经网络模型的输出层输出,包括:根据计算神经网络模型的输出层输出ok。

在一个实施例中,根据数据训练的输出参数更新神经网络模型的权值,包括:将训练数据输入神经网络模型,记录神经网络模型的输出层输出;计算输出层输出与期望输出值之间的误差;根据误差更新神经网络模型的输入层到隐含层的权重。

在一个实施例中,计算输出层输出与期望输出值之间的误差,包括:根据计算输出层输出与期望输出值之间的误差,其中ok为神经网络模型的输出层输出,yk为期望输出值;其中,i=1…n,j=1…l,k=1…m。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1