应用于人工智能的信息优化方法及服务器与流程

文档序号:37020469发布日期:2024-02-09 13:13阅读:22来源:国知局
本发明属于人工智能,具体为应用于人工智能的信息优化方法及服务器。
背景技术
::1、信息优化是指通过一系列策略和技术手段,对信息进行整理、分类、排序、过滤、去重等处理,以提高信息的可读性、可理解性和可用性,从而更好地满足用户的需求,信息优化的主要目的是提高用户体验和提升搜索引擎排名,通过信息优化,网站或应用程序可以提供清晰、简洁、易于理解的信息,使用户能够快速找到所需的信息并提高转化率,同时,信息优化也有助于提高搜索引擎排名,增加网站或应用程序的曝光率和流量,现如今在网页搜索页面进行信息的浏览与查询过程中,信息科技日益发达,由于网页信息的不及时更新,导致了在用户检索信息时,往往出现的信息还是旧的信息,导致用户无法第一时间了解到最新的信息情况,并且更新方式复杂不便,对此,我们提出了应用于人工智能的信息优化方法及服务器。技术实现思路1、针对现有技术的不足,本发明提供了应用于人工智能的信息优化方法及服务器,以解决以上技术问题。2、为实现上述目的,本发明提供如下技术方案:应用于人工智能的信息优化方法,优化步骤为:3、s1、建立出ai检索问答模块,用户通过ai检索问答模块进行信息的提取与ai智能对话;4、s2、智能对话的聊天记录会存储进云端服务器中,在云端服务器中建立出筛选模型,筛选模型采用朴素贝叶斯法进行筛选,将无用的聊天记录筛去,保留下有用的聊天记录;5、s3、将聊天记录信息进行关键词的提取,转存进云端服务器内;6、s4、建立特征匹配算法,将云端服务器内部的信息与聊天记录信息的关键词进行匹配,一致时,将聊天记录信息补充在信息内,对云端服务器内的信息进行不断实时优化更新;7、s5、信息匹配不一致时,将聊天记录信息筛去,不再进行保留;8、s6、在用户下次进行检索问答时,更新出最新优化信息。9、优先地,s1步骤中建立ai检索问答模块的步骤为:10、a1、对网络上的大数据信息进行收集整理,数据收集的渠道包括有网页渠道、媒体社交渠道与新闻渠道,存储在云端服务器中;11、a2、对收集到的信息进行去重处理,筛选掉重复的信息;12、a3、通过数据的特点,选择神经网络模型构建出框架,选择自然语言处理技术进行问题解析与答案生成;13、a4、对模型框架不断的训练优化,并对模型进行评估,保证模型的可靠性;14、a5、测试模型框架能否正常运行,进行数据的部署与调试;15、a2步骤中信息的去重处理步骤为将数据集拆分为小块,每个小块内包括有若干条的数据,对小块中的数据采用哈希函数进行计算,得到对应的哈希值,将哈希值存储在表格中,假设表格中已经存在有哈希值,则表明该数据存在,将重复数值筛去;16、哈希函数的公式为:17、h(m)=h18、其中h(m)为数据m的哈希值,h为哈希函数输出值;19、a3步骤中神经网络模型构建:选择连接层、卷积层、池化层与激活函数对网络层数、每层神经元数量与激活函数确立;20、确立编译模型,对编译模型通过训练数据对模型进行训练,神经网络通过反向传播算法,自动调整权重与偏置,来最小化损失函数;21、对模型进行评估,计算模型的准确率与精度,通过增加层数,增加神经元数量来重新训练模型,将模型不断进行优化调整,来应用到具体环境中进行使用;22、自然语言处理技术包括通过将文本语言转换为机械处理格式,来进行交互处理,通过对语法的分析、句法的分析、语义的分析与文本的挖掘来提取,对问题通过调取数据库信息进行智能解答。23、优先地,s2步骤中朴素贝叶斯法公式为:24、p(ci,x)=fr(ci)*p(ci)25、其中ci为类别,x为特征向量,fr(ci)为特征r下的下属类别ci的概率,26、p(ci)为特征向量ci出现的概率;27、筛选方法通过对数据进行预处理,将处理后的数据进行特征的提取,将数据内不同的特征提取出来,转换为小块类别,使用朴素贝叶斯法将小块类别内的数据进行计算,通过计算的结果进行筛选,将特征不明显或无用的特征除去,将特征明显的数据进行保存,其中特征提取的方法与s3步骤中关键词的提取步骤一致。28、优先地,数据的预处理包括对数据的清洗、数据去重与数据转换,其中数据的清洗步骤为数据分析通过对原始数据源数据进行分析,得出原始数据源中存在的数据问题,选择数据清洗算法,采用基于统计的方法进行数据的清洗,检测重复记录的算法,对两个数据集或者一个合并后的数据集进行检测,检查重复数据,将清洗后符合要求的数据回流到数据源;29、数据去重步骤将要进行去重的数据准备好,包括数据的来源、数据格式与数据质量情况,选择基于字典的字符串去重法,编写相应的去重程序,使用python编程语言编写程序,将编写好的去重程序运行,对数据进行去重处理,对去重后的数据进行验证,将去重后的数据输出。30、优先地,数据转换为通过将清洗与去重后的数据进行提取,确定数据转换的目标格式,通过转换代码,将数据转换为新的格式,并对转换后的数据进行测试,做出相对应的调整,并对转换过程进行记录;31、转换代码通过使用python的pandas库进行读取数据,将数据写入excel文件中;32、转换过程记录通过使用oracle形式来进行数据的记录;33、数据转换将数据的形式转换为文本词向量形式。34、优先地,s3步骤中关键词提取步骤通过将处理后的词向量进行计算,通过使用词频方式进行分析计算,得到词句文本中的重要性,根据词语的重要性来选取排名靠前的词语作为关键词,排名方式通过冒泡排序方式进行排名,并根据实际的应用场景,来对关键词进行优化,提升关键词的关联性;35、词频计算公式为:p=s/a;36、其中p为词频,s为单词在文本中出现的频率,a为文本的总词数;37、公式用以计算单词出现的频率,在进行计算时,需要将文本分解成为单个的词条,使用上述公式进行计算;38、冒泡排序法通过将样本数据按照从大到小的顺序进行排序处理,编写所使用排序法代码,将数值代入代码中进行排序,得出排序结果;39、冒泡排序步骤为:比较相邻的元素,假设第一个比第二个大的话,则进行交换,对每个相邻元素做同样的工作,最后的元素为最大值。40、优先地,s4步骤中特征匹配算法建立步骤为通过对数据中的特征点空间分布,基本特征量,形状与结构特点进行提取,根据以上特征点,对数据的不同特征情况进行比较对比,来定位出特征之间的短暂匹配点,框定出有效的匹配点,去除不准确的匹配点,来最终得到实用的匹配结果,根据特征点设定一组数据的匹配特征符号为(1,2,1,1,1,2,2,1,2),而另一组数据匹配特征符号为(1,2,2,1,1,2,1,2),将特征符号进行对比,来判断此信息是否与云端服务器内的信息相匹配。41、优先地,s4步骤中对信息补充通过在旧信息的内容后面,补充进入筛选后的新信息,进行信息的优化更迭与存储,通过编写数据代码方式,在云端服务器内对信息进行自动扩充与补写。42、优先地,s5步骤中信息匹配不一致时,通过编写数据代码进行去除,使用select语句,使用select语句选择需要的数据,select*from table_name where condition进行去除。43、应用于人工智能的信息优化方法的服务器,服务器包括有:云端服务器与ai检索问答模块,云端服务器内部包括有筛选模型与特征匹配算法,筛选模型用以对无用聊天记录筛去,特征匹配算法用以对信息内的关键词进行匹配。44、与现有技术相比,本发明的有益效果如下:45、本发明通过ai问答的技术,将用户提出的问题通过从云端服务器调取出来,并能够通过与用户进行智能对答,来将对答的聊天记录进行存储,并提取到内部的关键词,与云端服务器内部的信息进行对比,并保留下最新的信息情况,作为云端服务器内信息的最新补充,能够通过与用户的智能对答,自动的摘要到信息的内部,作为补充部分,补充进入云端服务器内,信息优化快速,带来更好的使用前景。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1