实现智能对话系统应用中应用文本数据保护的方法与流程

文档序号：17627026发布日期：2019-05-10 23:46阅读：143来源：国知局

本发明涉及计算及密码学领域以及自然语言处理领域，具体地说是一种实现智能对话系统应用中应用文本数据保护的方法。
背景技术：
：在智能对话系统构建过程中，需要企业开发人员维护大量的对话数据到智能对话系统中，这些数据是智能对话系统构建的基础，也是企业暴露对话服务重要的数据，但是数据的灾备和数据的迁移，对于能导出应用的整体数据是至关重要的，故如何对媒体类型的数据及特殊数据和大文本数据进行加密保护是目前急需解决的技术问题。专利号为cn104601177b的专利文献公开了一种基于base64编码的解码扩展实现方法，包括：接收编码文本数据；按照预设长度对编码文本数据进行分组；将第一个数据组作为当前解码数据组；根据当前解码数据组获取初步解码字节数据组，并对初步解码字节数据组进行解码；对当前解码数据组进行检查，获得分组解码字节数，并用预设非法替换符替换解码结果中的错误数据；根据分组解码字节数更新解码长度，解码长度初始值为0；判断所有的数据组是否都解码完成，是则返回解码长度，解码结束，否则将下一个数据组作为当前解码数据组，根据当前解码数据组获取初步解码字节数据组，继续进行解码。但是该技术方案不能实现对媒体类型的数据及特殊数据和大文本数据进行加密保护。专利号为cn107943763a的专利文献公开了一种大文本数据处理方法，其步骤为：将大文本解析成流；在文件流中建立游标机制；读取文件数据存储到数据库。但是该技术方案不能实现对媒体类型的数据及特殊数据和大文本数据进行加密保护。技术实现要素：本发明的技术任务是提供一种实现智能对话系统应用中应用文本数据保护的方法，来解决如何对媒体类型的数据及特殊数据和大文本数据进行加密保护的问题。本发明的技术任务是按以下方式实现的，一种实现智能对话系统应用中应用文本数据保护的方法，该方法主要是针对非文本数据和大文本数据；针对非文本数据是将非文本数据整合为文本数据存储的方式，将媒体及各种字符整合为文本类型的数据格式，通过在应用中结合对称密钥加密的方式导出并保护非文本数据的应用数据；针对大文本数据是通过整合非对称密钥加密及对称密钥加密和数字签名的方式保护数据。作为优选，所述非文本数据的应用数据的处理方式步骤如下：(一)、进行媒体格式数据的编码，通过base64编码整合到xml文件中；(二)、确保所有数据处理成可以整合到xml文本中的数据时，生成xml文件；(三)、对生成的xml文件使用非对称密钥进行加密，并使用对称密钥中的私钥加密文件，对xml文件进行压缩处理；(四)、解压xml文件时，使用公钥解密文件，使用xml校验文件数据的完整性并验证确保数据中无相关危险字符。更优地，所述xml文件采用xsd格式规范，xsd(xmlschemadefinition)是w3c于2001年5月发布的推荐标准，指出如何形式描述xml文档的元素；xsd是许多xmlschema语言中的一支。xsd是首先分离于xml本身的schema语言，故获取w3c的推荐地位；像所有xmlschema语言一样，xsd用来描述一组规则──一个xml文件必须遵守这些规则，才能根据该schema‘合法(valid)’文件在附件中。更优地，所述base64编码步骤如下：(1)、将每三个字节作为一组，一共是24个二进制位；(2)、将这24个二进制位分为四组，每个组有6个二进制位；(3)、在每组前面加两个00，扩展成32个二进制位，即四个字节；(4)、得到扩展后的每个字节的对应符号，获得base64的编码值。作为优选，所述大文本数据是通过整合非对称密钥加密及对称密钥加密和数字签名的方式保护数据，具体步骤如下：s1、大文本数据采用对称密钥的加密方式加密大文本数据，应用中所有大文本类数据都是用对称密钥加密过的数据；s2、对称密钥采用非对称密钥的私钥进加密的方式进行加密，并用非对称密钥的私钥针对对称密钥数字签名；s3、分发包的过程中生成相应的分发出去包的license.txt，license.txt包含用户名以及过期日期，通过license.txt中的信息生成license.key，完成对大文本数据的加密；其中，license.key一旦生成不允许做任何修改，修改后无法正常解密文件；s4、利用生成的license.key解密大文本数据。license.key为以密文的方式存储对称秘钥和非对称秘钥公钥以及license.txt数字签名的文件，license.txt数字签名及公钥信息在应用中进行处理，获取公钥用以解密加密的对称秘钥，并验证license.txt数字签名校验，利用公钥解密大文本数据并在应用内存中生效，应用中的相关代码采用加密处理。更优地，所述步骤s3中生成license.key过程具体如下：s301、输入license.txt信息；s302、生产license；s303、使用私钥签名license；s304、以密文存储机密对称密钥、非对称密钥的公钥、license数字签名信息；s305、生成license.key。更优地，所述步骤s4中解密大文本数据的具体步骤如下：s401、利用加密文本解析license.key；s402、获取对称密钥、非对称密钥的公钥、license数字签名的信息；s403、解密对称密钥和验证license数字签名；s404、利用对称密钥解密大文本数据；s405、使用解密后的大文本数据。更优地，所述非对称密钥加密过程中产生公钥和私钥，具体算法如下：随意选择两个较大质数p和q，其中，p≠q，计算出n＝pq；根据欧拉函数：计算出r＝(p-1)(q-1)；选择一个小于r的整数e，求得e关于模r的模反元素d；其中，当且仅当e与r互质时，模反元素d才存在；将p和q的记录销毁；得出，(n,e)是公钥，(n,d)是私钥。其中，对于导出应用数据的内容保护采用非对称密钥的方式，非对称加密算法需要两个密钥：公开密钥和私有密钥；公开密钥与私有密钥是一对，如果用公开密钥对数据进行加密，只有用对应的私有密钥才能解密；如果用私有密钥对数据进行加密，那么只有用对应的公开密钥才能解密；因为加密和解密使用的是两个不同的密钥，所以这种算法叫作非对称加密算法；非对称加密算法实现机密信息交换的基本过程是：甲方生成一对密钥并将其中的一把作为公用密钥向其它方公开；得到该公用密钥的乙方使用该密钥对机密信息进行加密后再发送给甲方；甲方再用自己保存的另一把专用密钥对加密后的信息进行解密。更优地，所述对称密钥采用des算法进行加密，des算法是利用56+8奇偶校验位(即，(第8，,1,24,32,40,48,56,64)＝64位)的密钥对以64位为单位的块数据进行加密和解密，运算规则如下：ln＝r(n-1)；其中，采用单钥密码系统的加密方法，同一个密钥可以同时用作信息的加密和解密，这种加密方法称为对称加密，也称为单密钥加密。本发明的实现智能对话系统应用中应用文本数据保护的方法具有以下优点：(一)、本发明对于媒体类型的数据及特殊数据采用base64的方式进行编码，采用非对称秘钥加密后导出应用数据；对于应用本身依赖的大文本数据采用对称秘钥和非对称秘钥组合的方式进行保护，通过对数据的编码压缩减少宽带占用，对于文件加密签名保证数据的安全，对于数据解析校验保证数据的完整性和安全性；(二)、本发明能够有效的保护数据，防止数据泄漏，能保证数据的安全性，防止机密数据被其他人窃取；(三)、本发明主要对于智能对话中的数据进行保护，通过整合不同的流程结合不同的加密算法编码方法等保护文本数据，防止数据被窃取，通过此流程，能有效的保护数据，减小数据泄漏的风险。附图说明下面结合附图对本发明进一步说明。附图1为生产license.key的流程框图；附图2为解密大文本数据的流程框图。具体实施方式参照说明书附图和具体实施例对本发明的实现智能对话系统应用中应用文本数据保护的方法作以下详细地说明。实施例1：本发明的实现智能对话系统应用中应用文本数据保护的方法，该方法主要是针对非文本数据和大文本数据；针对非文本数据是将非文本数据整合为文本数据存储的方式，将媒体及各种字符整合为文本类型的数据格式，通过在应用中结合对称密钥加密的方式导出并保护非文本数据的应用数据；非文本数据的应用数据的处理方式步骤如下：(一)、进行媒体格式数据的编码，通过base64编码整合到xml文件中；(二)、确保所有数据处理成可以整合到xml文本中的数据时，生成xml文件；xml文件采用xsd格式规范，xsd(xmlschemadefinition)是w3c于2001年5月发布的推荐标准，指出如何形式描述xml文档的元素；xsd是许多xmlschema语言中的一支。xsd是首先分离于xml本身的schema语言，故获取w3c的推荐地位；像所有xmlschema语言一样，xsd用来描述一组规则──一个xml文件必须遵守这些规则，才能根据该schema‘合法(valid)’文件在附件中。(三)、对生成的xml文件使用非对称密钥进行加密，并使用对称密钥中的私钥加密文件，对xml文件进行压缩处理；(四)、解压xml文件时，使用公钥解密文件，使用xml校验文件数据的完整性并验证确保数据中无相关危险字符。其中，base64编码步骤如下：(1)、将每三个字节作为一组，一共是24个二进制位；(2)、将这24个二进制位分为四组，每个组有6个二进制位；(3)、在每组前面加两个00，扩展成32个二进制位，即四个字节；(4)、得到扩展后的每个字节的对应符号，获得base64的编码值，如下表所示：0a17r34i51z1b18s35j5202c19t36k5313d20u37l5424e21v38m5535f22w39n5646g23x40o5757h24y41p5868i25z42q5979j26a43r60810k27b44s61911l28c45t62+12m29d46u63/13n30e47v14o31f48w15p32g49x16q33h50y针对大文本数据是通过整合非对称密钥加密及对称密钥加密和数字签名的方式保护数据。大文本数据是通过整合非对称密钥加密及对称密钥加密和数字签名的方式保护数据，具体步骤如下：s1、大文本数据采用对称密钥的加密方式加密大文本数据，应用中所有大文本类数据都是用对称密钥加密过的数据；s2、对称密钥采用非对称密钥的私钥进加密的方式进行加密，并用非对称密钥的私钥针对对称密钥数字签名；s3、分发包的过程中生成相应的分发出去包的license.txt，license.txt包含用户名以及过期日期，通过license.txt中的信息生成license.key，完成对大文本数据的加密；其中，license.key一旦生成不允许做任何修改，修改后无法正常解密文件；如附图1所示，生成license.key过程具体如下：s301、输入license.txt信息；s302、生产license；s303、使用私钥签名license；s304、以密文存储机密对称密钥、非对称密钥的公钥、license数字签名信息；s305、生成license.key。s4、利用生成的license.key解密大文本数据。license.key为以密文的方式存储对称秘钥和非对称秘钥公钥以及license.txt数字签名的文件，license.txt数字签名及公钥信息在应用中进行处理，获取公钥用以解密加密的对称秘钥，并验证license.txt数字签名校验，利用公钥解密大文本数据并在应用内存中生效，应用中的相关代码采用加密处理。如附图2所示，解密大文本数据的具体步骤如下：s401、利用加密文本解析license.key；s402、获取对称密钥、非对称密钥的公钥、license数字签名的信息；s403、解密对称密钥和验证license数字签名；s404、利用对称密钥解密大文本数据；s405、使用解密后的大文本数据。其中，非对称密钥加密过程中产生公钥和私钥，具体算法如下：随意选择两个较大质数p和q，其中，p≠q，计算出n＝pq；根据欧拉函数：计算出r＝(p-1)(q-1)；选择一个小于r的整数e，求得e关于模r的模反元素d；其中，当且仅当e与r互质时，模反元素d才存在；将p和q的记录销毁；得出，(n,e)是公钥，(n,d)是私钥。其中，对称密钥采用des算法进行加密，des算法是利用56+8奇偶校验位(即，(第8，,1,24,32,40,48,56,64)＝64位)的密钥对以64位为单位的块数据进行加密和解密，运算规则如下：ln＝r(n-1)；其中，采用单钥密码系统的加密方法，同一个密钥可以同时用作信息的加密和解密，这种加密方法称为对称加密，也称为单密钥加密。最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李明明;郭运艳;曾光;潘心冰
技术所有人：浪潮软件股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。