旅游目的地中的数据语义关联分析方法及系统与流程

文档序号:11133911阅读:428来源:国知局
旅游目的地中的数据语义关联分析方法及系统与制造工艺

本发明涉及信息数据处理技术领域,特别涉及一种旅游目的地中的数据语义关联分析方法及系统。



背景技术:

目前,旅游行业有很多信息服务商以及OTA,对外提供了许多景区的评论,门票信息,攻略信息等,形成了旅游方向的网络舆情,但是这些信息目前采用了诸如打标签的方式进行了数据分类。现有技术无法获得这些评论数据中内在的信息关联,从而也无法从中提取出对景区发展有指导意义的数据。



技术实现要素:

有鉴于此,本发明提出一种旅游目的地中的数据语义关联分析方法及系统。

一种旅游目的地中的数据语义关联分析方法,其包括如下步骤:

S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;

S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;

S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;

S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;

S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;

S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。

在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S3包括:

S31、返回拥有该形容词的所有评论内容列表;

S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;

S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;

S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。

在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S4包括:

S41、返回拥有该名词的所有评论内容列表;

S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;

S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;

S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。

在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S5包括:

S51、选定该名词,查找包含该名词的评论内容;

S52、对每个评论内容内的所有词汇进行词性和顺序分解;

S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;

S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;

S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。

在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S6包括:

S61、选定该形容词,查找包含该形容词的评论内容;

S62、对每个评论内容内的所有词汇进行词性和顺序分解;

S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;

S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;

S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。

本发明还提供一种旅游目的地中的数据语义关联分析系统,其包括如下单元:

归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;

统计分析跳转单元,用于建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到第一处理单元,在为名词时跳转到第二处理单元,在为与名词相关的形容词时,跳转到第三处理单元,在为与形容词相关的名词时,跳转到第四处理单元;

第一处理单元,用于根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;

第二处理单元,用于根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;

第三处理单元,用于查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;

第四处理单元,用于查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。

在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第一处理单元包括:

第一返回子单元,用于返回拥有该形容词的所有评论内容列表;

第一记录统计子单元,用于获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;

第一归并子单元,用于在一个名词在名词临时表中已经出现时,则归并该名词,增加该名词出现次数;

第一显示子单元,用于列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。

在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第二处理单元包括:

第二返回子单元,用于返回拥有该名词的所有评论内容列表;

第二记录统计子单元,用于获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;

第二归并子单元,用于在如果一个形容词在形容词临时表出现时,则归并该形容词,增加该形容词的出现次数;

第二显示子单元,用于列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。

在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第三处理单元包括:

第一查找子单元,用于选定该名词,查找包含该名词的评论内容;

第一分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;

第一排序子单元,用于对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;

第一重复子单元,用于将找到的形容词放入关联形容词暂存表,重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在第三显示子单元中进行统计排序;

第三显示子单元,用于将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。

在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第四处理单元包括:

第二查找子单元,用于选定该形容词,查找包含该形容词的评论内容;

第二分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;

第二排序子单元,用于对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;

第二重复子单元,用于将找到的名词放入关联名词暂存表,重复第二分解子单元直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在第四显示子单元进行统计排序;

第四显示子单元,用于将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。

实施本发明提供的旅游目的地中的数据语义关联分析方法及系统与现有技术相比具有以下有益效果:能够通过用户的对于旅游目的地大量网络评论的内容,分析出网络舆情中的最热名词和形容词,并且能够计算和分析出最热的前预设位(比如20位)个名词和形容词关联的热词。从而获得舆情最关注的情感和内容集中在哪些方面。

同时,本发明还提供了计算同某个名词有关联关系的形容词的计算处理,以及同某个名词有关联关系的形容词的计算处理和统计的处理方法,这样用户可以获得和某个名词以及某个形容词之间的对应关联关系。

附图说明

图1是本发明实施例的旅游目的地中的数据语义关联分析系统结构框图。

图2是图1中第一处理单元结构框图;

图3是图1中第二处理单元结构框图;

图4是图1中第三处理单元结构框图;

图5是图1中第四处理单元结构框图。

具体实施方式

一种旅游目的地中的数据语义关联分析方法,其包括如下步骤:

S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;

S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;

S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;

S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;

S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;

S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。

在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S3包括:

S31、返回拥有该形容词的所有评论内容列表;

S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;

S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;

S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。

在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S4包括:

S41、返回拥有该名词的所有评论内容列表;

S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;

S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;

S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。

在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S5包括:

S51、选定该名词,查找包含该名词的评论内容;

S52、对每个评论内容内的所有词汇进行词性和顺序分解;

S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;

S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;

S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。

在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S6包括:

S61、选定该形容词,查找包含该形容词的评论内容;

S62、对每个评论内容内的所有词汇进行词性和顺序分解;

S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;

S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;

S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。

如图1所示,本发明还提供一种旅游目的地中的数据语义关联分析系统,其包括如下单元:

归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;

统计分析跳转单元,用于建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到第一处理单元,在为名词时跳转到第二处理单元,在为与名词相关的形容词时,跳转到第三处理单元,在为与形容词相关的名词时,跳转到第四处理单元;

第一处理单元,用于根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;

第二处理单元,用于根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;

第三处理单元,用于查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;

第四处理单元,用于查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。

如图2所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第一处理单元包括:

第一返回子单元,用于返回拥有该形容词的所有评论内容列表;

第一记录统计子单元,用于获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;

第一归并子单元,用于在一个名词在名词临时表中已经出现时,则归并该名词,增加该名词出现次数;

第一显示子单元,用于列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。

如图3所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第二处理单元包括:

第二返回子单元,用于返回拥有该名词的所有评论内容列表;

第二记录统计子单元,用于获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;

第二归并子单元,用于在如果一个形容词在形容词临时表出现时,则归并该形容词,增加该形容词的出现次数;

第二显示子单元,用于列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。

如图4所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第三处理单元包括:

第一查找子单元,用于选定该名词,查找包含该名词的评论内容;

第一分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;

第一排序子单元,用于对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;

第一重复子单元,用于将找到的形容词放入关联形容词暂存表,重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在第三显示子单元中进行统计排序;

第三显示子单元,用于将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。

如图5所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第四处理单元包括:

第二查找子单元,用于选定该形容词,查找包含该形容词的评论内容;

第二分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;

第二排序子单元,用于对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;

第二重复子单元,用于将找到的名词放入关联名词暂存表,重复第二分解子单元直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在第四显示子单元进行统计排序;

第四显示子单元,用于将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。

实施本发明提供的旅游目的地中的数据语义关联分析方法及系统与现有技术相比具有以下有益效果:能够通过用户的对于旅游目的地大量网络评论的内容,分析出网络舆情中的最热名词和形容词,并且能够计算和分析出最热的前预设位(比如20位)个名词和形容词关联的热词。从而获得舆情最关注的情感和内容集中在哪些方面。

同时,本发明还提供了计算同某个名词有关联关系的形容词的计算处理,以及同某个名词有关联关系的形容词的计算处理和统计的处理方法,这样用户可以获得和某个名词以及某个形容词之间的对应关联关系。

可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技术构思做出其它各种相应的改变与变形,而所有这些改变与变形都应属于本发明权利要求的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1