一种计算机系统及其用户的身份识别方法和装置与流程

文档序号:15312506发布日期:2018-08-31 22:11阅读:244来源:国知局

本发明涉及计算机识别身份设备技术领域,具体为一种计算机系统及其用户的身份识别方法和装置。



背景技术:

身份识别是指系统的用户在进入系统或访问不同保护级别的系统资源时,系统确认该用户的身份是否真实、合法和唯一。身份识别是识别和证实主体身份的过程。它往往是许多应用系统中安全保护的第道防线,也是保证应用系统安全的关键。识别认证方案主要用于实现以下目的:识别认证用户的身份,防止非法用户假合法用户身份占用系统资源、删除或窜改用户存储的数据,降低对用户的识别速度。



技术实现要素:

本发明的目的在于提供一种计算机系统及其用户的身份识别方法和装置,以解决现有的技术缺陷和不能达到的技术要求。

为实现上述目的,本发明提供如下技术方案:一种计算机系统及其用户的身份识别方法和装置,计算机身份识别步骤包括:步骤一:计算机的训练过程;步骤二:对个人身份的测试过程;训练过程包括:正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习四部分组成;训练过程包括:文本预处理、权重计算与特征词降维和个人身份信息识别模型。

优选的,所述电子邮件同时进行训练过程和测试过程,电子邮件信号经过正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习,最后信号传递给个人身份信息识别模型,进而判断出用户的身份信息。

优选的,所述正则信息表达式的信息匹配通过提取输入的协议密码,撰写相对应的正则表达式;正则表达式能够检查串中含有字串,对字串进行替换或者取出;用户通过编写基于正则信息表达式的信息匹配系统,然后将匹配到的数据与计算机内的结果对应,计算机执行相应的操作将数据替换成文本信息。

优选的,所述权重计算与特征词降维对正则表达式匹配出来的电子邮件的文本文档进行一定的预处理;对文档库进行降维处理,将特征维数压缩到与训练样本个数相适应的程度,因此提高鉴别信息的类别数量。

优选的,所述预先分好类的样本构成训练集,为每个类别作出准确的描述,计算机对数据库中的数据进行分类,提高计算机的学习能力和泛化性能,计算机通过个人身份信息识别模型对用户进行判断,从而确定用户的身份信息。

与现有技术相比,本发明的有益效果如下:

采用正则信息表达式的信息匹配来进行个人身份信息的筛选,一方面简单易用,另一方面则能表现出正则信息表达式的信息匹配的匹配速度和效率,进而能够提高对用户的身份的识别能力。

附图说明

图1为本发明一种计算机系统及其用户的身份识别方法和装置结构示意图。

具体实施方式

下面将结合本发明,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供一种技术方案:一种计算机系统及其用户的身份识别方法和装置,计算机身份识别步骤包括:步骤一:计算机的训练过程;步骤二:对个人身份的测试过程;训练过程包括:正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习四部分组成;训练过程包括:文本预处理、权重计算与特征词降维和个人身份信息识别模型。

电子邮件同时进行训练过程和测试过程,电子邮件信号经过正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习,最后信号传递给个人身份信息识别模型,进而判断出用户的身份信息。

正则信息表达式的信息匹配通过提取输入的协议密码,撰写相对应的正则表达式;正则表达式能够检查串中含有字串,对字串进行替换或者取出;用户通过编写基于正则信息表达式的信息匹配系统,然后将匹配到的数据与计算机内的结果对应,计算机执行相应的操作将数据替换成文本信息。

权重计算与特征词降维对正则表达式匹配出来的电子邮件的文本文档进行一定的预处理;对文档库进行降维处理,将特征维数压缩到与训练样本个数相适应的程度,因此提高鉴别信息的类别数量。

预先分好类的样本构成训练集,为每个类别作出准确的描述,计算机对数据库中的数据进行分类,提高计算机的学习能力和泛化性能,计算机通过个人身份信息识别模型对用户进行判断,从而确定用户的身份信息。

本发明一种计算机系统及其用户的身份识别方法和装置,基于正则表达式的信息匹配主要是便于快速地从电子邮件中匹配出包含有个人身份信息的电子邮件的模块;文本预处理则是将非结构化的基于人类自然语言的文本转换为机器可识别的文本;权重计算和特征降维是对分出来的词进行一定的处理,以便进行机器学习;机器学习则是对特征向量进行训练,最终形成个人身份信息识别模型;个人身份信息识别模型对用户进行识别,从而判断用户的身份信息。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。



技术特征:

技术总结
本发明公开了一种计算机系统及其用户的身份识别方法和装置,计算机身份识别步骤包括:步骤一:计算机的训练过程;步骤二:对个人身份的测试过程;训练过程包括:正则信息表达式的信息匹配、文本预处理、权重计算与特征词降维和机器学习四部分组成;训练过程包括:文本预处理、权重计算与特征词降维和个人身份信息识别模型。该一种计算机系统及其用户的身份识别方法和装置,通过采用正则信息表达式的信息匹配来进行个人身份信息的筛选,一方面简单易用,另一方面则能表现出正则信息表达式的信息匹配的匹配速度和效率,进而能够提高对用户的身份的识别能力。

技术研发人员:吕品品
受保护的技术使用者:淄博职业学院
技术研发日:2018.03.03
技术公布日:2018.08.31
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1