一种基于面向对象语言处理的档案管理方法与流程

文档序号:26991181发布日期:2021-10-19 21:02阅读:来源:国知局

技术特征:
1.一种基于面向对象语言处理的档案管理方法,其特征在于,包括:获取待处理档案,对待处理档案进行预处理;对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据;基于所述用户交互数据和所述元数据,选择合适的语言查询平台,将所述待处理档案发送至所述合适的语言查询平台。2.如权利要求1所述的一种基于面向对象语言处理的档案管理方法,其特征在于,所述获取待处理档案,对待处理档案进行预处理,包括:获取不同档案类型对应的待处理档案,分别对所述待处理档案进行逐条解析,获取预先选择的档案类型对应的待处理档案;对所述预先选择的档案类型对应的待分析档案进行分析,根据预先配置的指标参数获取分析后的档案中的属性指标;对所述属性指标进行统计,并输出统计结果;所述指标参数包括档案管理人员通常关心的指标,根据系统默认的指标参数获取待处理档案中的档案基本指标和交互属性基本指标;其中,档案基本指标包括档案媒体类型、档案数据体量、档案分布式需求;交互属性基本指标包括档案生成时延、http档案下载速率、ftp档案下载速率、下载时长和丢包率。3.如权利要求2所述的一种基于面向对象语言处理的档案管理方法,其特征在于,所述对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据,还包括:获取用户的阅读档案和档案修改数据,根据所述阅读档案和所述档案修改数据,生成用户的浏览及修改明细信息,根据所述浏览及修改明细信息,生成所述用户行为的样本数据;对所述用户行为的样本数据进行分类聚合,以得到所述样本数据的特征集;从所述特征集包含的特征字段中选取第一预定数量个特征字段,根据选取出的预定数量个特征字段,从所述特征集中获取第二预定数量的特征数据,基于获取到的所述特征数据,通过逻辑回归算法进行模型训练;从所述用户行为的样本数据中获取在预定时间内进行了浏览但并未修改的样本数据,根据获取到的在所述预定时间内进行了浏览但并未修改的样本数据,获得特征字段的值,根据获得的特征字段的值,调用所述逻辑回归模型进行计算,得到分类后待处理样本。4.如权利要求1所述的一种基于面向对象语言处理的档案管理方法,其特征在于,所述基于所述用户交互数据和所述元数据,选择合适的语言查询平台,将所述待处理档案发送至所述合适的语言查询平台,还包括:基于所述用户交互数据和所述元数据,确定所述待处理档案的处理优先级;基于所述待处理档案的处理优先级,确定合适的语言查询平台;所述语言查询平台包括sql语言查询平台、hql语言查询平台、mongodb语言查询平台;所述sql语言查询平台采用结构化查询语言,以二维表形式存储和查询数据;所述hql语言查询平台采用分布式结构,hive构建分布式查询语言;所述mongodb采用spring data框架中的pagingandsortingrepository接口实现在分
页查询。

技术总结
本发明请求保护的一种基于面向对象语言处理的档案管理方法,面向多查询语言平台,通过获取待处理档案,对待处理档案进行预处理,对预处理后的所述待处理档案进行元数据提取,获取所述待处理档案的用户交互数据,基于所述用户交互数据和所述元数据,选择合适的语言查询平台,将所述待处理档案发送至所述合适的语言查询平台。通过确定所述待处理档案的处理优先级,对档案的查询处理进行个性化需求匹配,以及基于客观条件,即当前资源调度情况结合进行数据查询平台的选取和优先级排序,真正做到满足多查询语言平台的用户需求的查询条件以及符合客观资源情况的查询操作。及符合客观资源情况的查询操作。及符合客观资源情况的查询操作。


技术研发人员:周杏 李帅
受保护的技术使用者:中盾创新档案管理(北京)有限公司
技术研发日:2021.06.21
技术公布日:2021/10/18
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1