一种基于机器学习的原始版权证书识别系统及方法与流程

文档序号:32655059发布日期:2022-12-23 21:16阅读:65来源:国知局
一种基于机器学习的原始版权证书识别系统及方法与流程

1.本发明属于原始版权证书识别技术领域,更具体地说,尤其涉及一种基于机器学习的原始版权证书识别系统。同时,本发明还涉及一种基于机器学习的原始版权证书识别方法。


背景技术:

2.著作权是指软件的开发者或者其他权利人依据有关著作权法律的规定,对于软件作品所享有的各项专有权利;
3.机器学习是计算机系统为了有效地执行特定任务,不使用明确的指令,而依赖模式和推理使用的算法和统计模型的科学研究;
4.当前的原始版权证书识别系统多数是通过手动学习完成证书识别的,即通过人工手动一步一步地操作,对原始版权证书进行识别与验证,此方式人工参与工作时间长,工作人员的劳动强度高,进而导致对原始版权证书识别和验证的时间长、效率低,且降低了证书识别和检验的精准度,因此我们提出一种基于机器学习的原始版权证书识别方法。


技术实现要素:

5.本发明的目的是为了解决现有技术中存在的缺点,采用基于机器学习的原始版权证书识别系统,可自动对原始版权证书进行识别和验证,减少人工识别工作的参与时间,降低了工作人员的劳动强度,进而缩短了原始版权证书识别和验证的时间,提高了识别和验证的效率,且提高了证书识别和检验的精准度,以解决上述背景技术中提出的问题。
6.为实现上述目的,本发明提供如下技术方案:一种基于机器学习的原始版权证书识别系统,包括:
7.数据传输单元,所述数据传输单元用于将服务器中的原始版权证书图片进行传输,所述原始版权证书图片包括原图和副本图片;
8.数据接收单元,所述数据接收单元用于接收数据传输单元发送的原始版权证书图片;
9.数据处理单元,所述数据处理单元用于对接收的原始版权证书图片进行信息处理,即根据证书图片中各个元数据的位置进行区域分割;
10.数据识别单元,所述数据识别单元用于对处理后的原始版权证书图片中的各个元数据区域中的信息进行识别,并提取识别区域中的文字信息,再将提取的文字信息和服务器中该证书的内容进行比对;
11.数据验证单元,所述数据验证单元用于验证证书的真伪,所述数据验证单元包括用于确保客户机和服务器间通信安全的公共协议ssl,所述公共协议ssl采用公开密钥技术,广泛支持各种类型的网络,同时提供三种基本的安全服务,它们都使用公开密钥技术。
12.数据发送单元,所述数据发送单元用于将数据识别单元得到的文字信息和比对结果分别发送至服务器。
13.优选的,所述数据接收单元包括数据分类模块,所述数据分类模块能够对原始版权证书图片做出判断,输出判断结果,即得到原始版权证书图片是副本图片还是原图。
14.优选的,所述元数据是指原始版权证书图片中描述数据属性的信息,所述元数据包括原始版权证书图片中的登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章。
15.优选的,所述数据处理单元中包括区域切分模块,所述区域切分模块用于对上述登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置进行区域分割。
16.优选的,所述数据识别单元包括字符提取单元,所述字符提取单元用于对分割好的登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置内的信息进行文字提取。
17.优选的,所述数据处理单元还包括存储模块和校正模块,所述存储模块用于存储原始版权证书图片,所述存储模块存储有字符编码,所述校正模块将字符提取单元提取的文字信息与字符编码进行对比并校正。
18.优选的,所述数据验证包括如下步骤:
19.步骤一、获取原始版权证书发布的ca公共密钥;
20.步骤二、用ca公共密钥验证证书签名并检查证书有效期或ca吊销列表以查看证书是否过期或已被吊销;
21.步骤三、验证服务器的域,客户机将其与实际上连接到的服务器域名进行比较。如果它们匹配,则服务器一定是真实而不是冒名顶替的服务器;
22.步骤四、若步骤二和步骤三检查无误,则完成ssl连接,若检查有误,则分别重复步骤二和步骤三,直至检查无误,则客户机和服务器继续ssl同步交换中的步骤并建立连接。
23.本发明还提供一种基于机器学习的原始版权证书识别方法,包括如下步骤:
24.s1、将服务器中的原始版权证书图片进行传输,并通过数据分类模块对原始版权证书图片做出判断,输出判断结果,即得到原始版权证书图片是副本图片还是原图;
25.s2、接收数据传输单元发送的原始版权证书图片;
26.s3、对接收的原始版权证书图片进行信息处理,区域切分模块对登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置进行区域分割;
27.s4、字符提取单元对分割好的登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置内的信息进行文字提取,校正模块将字符提取单元提取的文字信息与字符编码进行对比并校正;
28.s5、对原始版权证书记进行验证,首先获取原始版权证书发布的ca公共密钥,并用ca公共密钥验证证书签名并检查证书有效期或ca吊销列表以查看证书是否过期或已被吊销,然后验证服务器的域,客户机将其与实际上连接到的服务器域名进行比较。如果它们匹配,则服务器一定是真实而不是冒名顶替的服务器,最后完成ssl连接;
29.s6、将数据识别单元得到的文字信息和比对结果分别发送至服务器。
30.本发明的技术效果和优点:
31.本发明采用基于机器学习的原始版权证书识别系统,可自动对原始版权证书进行
识别和验证,减少人工识别工作的参与时间,降低了工作人员的劳动强度,进而缩短了原始版权证书识别和验证的时间,提高了识别和验证的效率,且提高了证书识别和检验的精准度。
附图说明
32.图1为本发明的系统框图;
33.图2为本发明的流程框图。
具体实施方式
34.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和具体实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
35.请参阅图1-2,本发明提供了一种基于机器学习的原始版权证书识别系统,包括:
36.数据传输单元,所述数据传输单元用于将服务器中的原始版权证书图片进行传输,所述原始版权证书图片包括原图和副本图片;
37.数据接收单元,所述数据接收单元用于接收数据传输单元发送的原始版权证书图片;
38.数据处理单元,所述数据处理单元用于对接收的原始版权证书图片进行信息处理,即根据证书图片中各个元数据的位置进行区域分割;
39.数据识别单元,所述数据识别单元用于对处理后的原始版权证书图片中的各个元数据区域中的信息进行识别,并提取识别区域中的文字信息,再将提取的文字信息和服务器中该证书的内容进行比对;
40.数据验证单元,所述数据验证单元用于验证证书的真伪,所述数据验证单元包括用于确保客户机和服务器间通信安全的公共协议ssl,所述公共协议ssl采用公开密钥技术,广泛支持各种类型的网络,同时提供三种基本的安全服务,它们都使用公开密钥技术。
41.数据发送单元,所述数据发送单元用于将数据识别单元得到的文字信息和比对结果分别发送至服务器。
42.所述数据接收单元包括数据分类模块,所述数据分类模块能够对原始版权证书图片做出判断,输出判断结果,即得到原始版权证书图片是副本图片还是原图。
43.所述元数据是指原始版权证书图片中描述数据属性的信息,所述元数据包括原始版权证书图片中的登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章。
44.所述数据处理单元中包括区域切分模块,所述区域切分模块用于对上述登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置进行区域分割,即上述区域位置被分割在尺寸不一的方框内。
45.所述数据识别单元包括字符提取单元,所述字符提取单元用于对分割好的登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置内的信息进行文字提取。
46.所述数据处理单元还包括存储模块和校正模块,所述存储模块用于存储原始版权证书图片,所述存储模块存储有字符编码,所述校正模块将字符提取单元提取的文字信息与字符编码进行对比并校正,提高证书识别的准确性。
47.所述数据验证包括如下步骤:
48.步骤一、获取原始版权证书发布的ca公共密钥;
49.步骤二、用ca公共密钥验证证书签名并检查证书有效期或ca吊销列表以查看证书是否过期或已被吊销;
50.步骤三、验证服务器的域,客户机将其与实际上连接到的服务器域名进行比较。如果它们匹配,则服务器一定是真实而不是冒名顶替的服务器;
51.步骤四、若步骤二和步骤三检查无误,则完成ssl连接,若检查有误,则分别重复步骤二和步骤三,直至检查无误,则客户机和服务器继续ssl同步交换中的步骤并建立连接。
52.本发明还提供一种基于机器学习的原始版权证书识别方法,包括如下步骤:
53.s1、将服务器中的原始版权证书图片进行传输,并通过数据分类模块对原始版权证书图片做出判断,输出判断结果,即得到原始版权证书图片是副本图片还是原图;
54.s2、接收数据传输单元发送的原始版权证书图片;
55.s3、对接收的原始版权证书图片进行信息处理,区域切分模块对登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置进行区域分割;
56.s4、字符提取单元对分割好的登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置内的信息进行文字提取,校正模块将字符提取单元提取的文字信息与字符编码进行对比并校正;
57.s5、对原始版权证书记进行验证,首先获取原始版权证书发布的ca公共密钥,并用ca公共密钥验证证书签名并检查证书有效期或ca吊销列表以查看证书是否过期或已被吊销,然后验证服务器的域,客户机将其与实际上连接到的服务器域名进行比较。如果它们匹配,则服务器一定是真实而不是冒名顶替的服务器,最后完成ssl连接;
58.s6、将数据识别单元得到的文字信息和比对结果分别发送至服务器。
59.综上所述,本发明采用基于机器学习的原始版权证书识别系统,将服务器中的原始版权证书图片进行传输,并通过数据分类模块对原始版权证书图片做出判断,输出判断结果,即得到原始版权证书图片是副本图片还是原图;接收数据传输单元发送的原始版权证书图片;对接收的原始版权证书图片进行信息处理,区域切分模块对登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置进行区域分割;字符提取单元对分割好的登记号、作品名称、作者、创作完成时间、作品类别、著作权人、首次发表时间、登记日期和登记机构签章的区域位置内的信息进行文字提取,校正模块将字符提取单元提取的文字信息与字符编码进行对比并校正;对原始版权证书记进行验证,首先获取原始版权证书发布的ca公共密钥,并用ca公共密钥验证证书签名并检查证书有效期或ca吊销列表以查看证书是否过期或已被吊销,然后验证服务器的域,客户机将其与实际上连接到的服务器域名进行比较。如果它们匹配,则服务器一定是真实而不是冒名顶替的服务器,最后完成ssl连接;最后将数据识别单元得到的文字信息和比对结果分别发送至服务器。
60.可自动对原始版权证书进行识别和验证,减少人工识别工作的参与时间,降低了工作人员的劳动强度,进而缩短了原始版权证书识别和验证的时间,提高了识别和验证的效率,且提高了证书识别和检验的精准度。
61.最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1