旅游目的地中的数据语义关联分析方法及系统与流程

文档序号：11133911阅读：来源：国知局

技术特征：

1.一种旅游目的地中的数据语义关联分析方法，其特征在于，其包括如下步骤：

S1、对采集的用户评论内容的数据进行基于句子的词法分析；并对分析结果按照形容词、名词进行数据归类；

S2、建立批数据入库统计表，数据统计表记录基本处理算法是对每一句评论，建立热词分析；并对一批热词，进行去重、归并以及计数；在计数完毕后，根据时间段内的某个词汇出现的频率做降序排列，以获得热词的分类排序，分类分为名词、形容词；得到最热形容词列表以及最热名词列表；获取用户的点击信息，在为形容词时跳转到步骤S3，在为名词时跳转到步骤S4，在为与名词相关的形容词时，跳转到步骤S5，在为与形容词相关的名词时，跳转到步骤S6；

S3、根据最热形容词列表，进行算法处理，获得并显示与该形容词相关联的名词；

S4、根据最热名词列表，进行算法处理，获得并显示与该名词相关联的形容词；

S5、查找该名词相关的评论内容，并重复对每个评论内容内的所有词汇进行词性和顺序分解，将该名词前面的最接近的形容词放入关联形容词暂存表中，根据关联形容词暂存表获得并显示与该名词关联的形容词的结果；

S6、查找该形容词相关的评论内容，并重复对每个评论内容内的所有词汇进行词性和顺序分解，将该形容词前面的最接近的名词放入关联名词暂存表中，根据关联名词暂存表获得并显示与该形容词关联的名词的结果。

2.如权利要求1所述的旅游目的地中的数据语义关联分析方法，其特征在于，所述步骤S3包括：

S31、返回拥有该形容词的所有评论内容列表；

S32、获得该形容词后的最近的名词，并记录入名词临时表，并记录名词出现次数；

S33、如果一个名词在名词临时表中已经出现，则归并该名词，增加该名词出现次数；

S34、列出该名词临时表中的前预设位的名词；这些名词即为该形容词的关联热词。

3.如权利要求1所述的旅游目的地中的数据语义关联分析方法，其特征在于，所述步骤S4包括：

S41、返回拥有该名词的所有评论内容列表；

S42、获得该名词前的所有形容词，并记录入形容词临时表，并记录形容词出现次数；

S43、如果一个形容词在形容词临时表出现，则归并该形容词，增加该形容词的出现次数；

S44、列出该形容词临时表中的前预设位的形容词；这些形容词即为该名词的关联热词。

4.如权利要求1所述的旅游目的地中的数据语义关联分析方法，其特征在于，所述步骤S5包括：

S51、选定该名词，查找包含该名词的评论内容；

S52、对每个评论内容内的所有词汇进行词性和顺序分解；

S53、对选定名词在评论内容中分解的词性和顺序进行排序，确认该名词前面的最接近的形容词；

S54、将找到的形容词放入关联形容词暂存表，重复步骤S52直到所有包含该名词的评论内容全部处理完毕，某个形容词在关联形容词暂存表中重复出现时，在步骤S55中进行统计排序；

S55、将形容词的关联形容词暂存表中的数据，按照出现次数进行排序；排序结果就是同该名词关联的形容词的结果。

5.如权利要求1所述的旅游目的地中的数据语义关联分析方法，其特征在于，所述步骤S6包括：

S61、选定该形容词，查找包含该形容词的评论内容；

S62、对每个评论内容内的所有词汇进行词性和顺序分解；

S63、对选定形容词在评论内容中分解的词性和顺序进行排序，确认该形容词前面的最接近的名词；

S64、将找到的名词放入关联名词暂存表，重复步骤S62直到所有包含该形容词的评论内容全部处理完毕，某个名词在关联名词暂存表中重复出现时，在步骤S65中进行统计排序；

S65、将名词的关联名词暂存表中的数据，按照出现次数进行排序；排序结果就是同该形容词关联的名词的结果。

6.一种旅游目的地中的数据语义关联分析系统，其特征在于，其包括如下单元：

归类单元，用于对采集的用户评论内容的数据进行基于句子的词法分析；并对分析结果按照形容词、名词进行数据归类；

统计分析跳转单元，用于建立批数据入库统计表，数据统计表记录基本处理算法是对每一句评论，建立热词分析；并对一批热词，进行去重、归并以及计数；在计数完毕后，根据时间段内的某个词汇出现的频率做降序排列，以获得热词的分类排序，分类分为名词、形容词；得到最热形容词列表以及最热名词列表；获取用户的点击信息，在为形容词时跳转到第一处理单元，在为名词时跳转到第二处理单元，在为与名词相关的形容词时，跳转到第三处理单元，在为与形容词相关的名词时，跳转到第四处理单元；

第一处理单元，用于根据最热形容词列表，进行算法处理，获得并显示与该形容词相关联的名词；

第二处理单元，用于根据最热名词列表，进行算法处理，获得并显示与该名词相关联的形容词；

第三处理单元，用于查找该名词相关的评论内容，并重复对每个评论内容内的所有词汇进行词性和顺序分解，将该名词前面的最接近的形容词放入关联形容词暂存表中，根据关联形容词暂存表获得并显示与该名词关联的形容词的结果；

第四处理单元，用于查找该形容词相关的评论内容，并重复对每个评论内容内的所有词汇进行词性和顺序分解，将该形容词前面的最接近的名词放入关联名词暂存表中，根据关联名词暂存表获得并显示与该形容词关联的名词的结果。

7.如权利要求6所述的旅游目的地中的数据语义关联分析系统，其特征在于，所述第一处理单元包括：

第一返回子单元，用于返回拥有该形容词的所有评论内容列表；

第一记录统计子单元，用于获得该形容词后的最近的名词，并记录入名词临时表，并记录名词出现次数；

第一归并子单元，用于在一个名词在名词临时表中已经出现时，则归并该名词，增加该名词出现次数；

第一显示子单元，用于列出该名词临时表中的前预设位的名词；这些名词即为该形容词的关联热词。

8.如权利要求6所述的旅游目的地中的数据语义关联分析系统，其特征在于，所述第二处理单元包括：

第二返回子单元，用于返回拥有该名词的所有评论内容列表；

第二记录统计子单元，用于获得该名词前的所有形容词，并记录入形容词临时表，并记录形容词出现次数；

第二归并子单元，用于在如果一个形容词在形容词临时表出现时，则归并该形容词，增加该形容词的出现次数；

第二显示子单元，用于列出该形容词临时表中的前预设位的形容词；这些形容词即为该名词的关联热词。

9.如权利要求6所述的旅游目的地中的数据语义关联分析系统，其特征在于，所述第三处理单元包括：

第一查找子单元，用于选定该名词，查找包含该名词的评论内容；

第一分解子单元，用于对每个评论内容内的所有词汇进行词性和顺序分解；

第一排序子单元，用于对选定名词在评论内容中分解的词性和顺序进行排序，确认该名词前面的最接近的形容词；

第一重复子单元，用于将找到的形容词放入关联形容词暂存表，重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕，某个形容词在关联形容词暂存表中重复出现时，在第三显示子单元中进行统计排序；

第三显示子单元，用于将形容词的关联形容词暂存表中的数据，按照出现次数进行排序；排序结果就是同该名词关联的形容词的结果。

10.如权利要求6所述的旅游目的地中的数据语义关联分析系统，其特征在于，所述第四处理单元包括：

第二查找子单元，用于选定该形容词，查找包含该形容词的评论内容；

第二分解子单元，用于对每个评论内容内的所有词汇进行词性和顺序分解；

第二排序子单元，用于对选定形容词在评论内容中分解的词性和顺序进行排序，确认该形容词前面的最接近的名词；

第二重复子单元，用于将找到的名词放入关联名词暂存表，重复第二分解子单元直到所有包含该形容词的评论内容全部处理完毕，某个名词在关联名词暂存表中重复出现时，在第四显示子单元进行统计排序；

第四显示子单元，用于将名词的关联名词暂存表中的数据，按照出现次数进行排序；排序结果就是同该形容词关联的名词的结果。

完整全部详细技术资料下载

当前第2页1 2 3