基于旅游需求模板的景区评价数据分析舆情满意度方法与流程

文档序号:11830416阅读:来源:国知局

技术特征:

1.一种基于旅游需求模板的景区评价数据分析舆情满意度方法,其特征在于主要包括基于旅游需求模板的关键词模板库构建、关键词模板库的扩充和针对景区评价数据的舆情满意度分析计算的三个步骤。

2.根据权利要求1所述的一种基于旅游需求模板的景区评价数据分析舆情满意度方法,其特征在于:所述的旅游需求模板主要由内容大类关键词、内容子类关键词和情感关键词构成,每个内容大类关键词下分属有其对应的内容子类关键词,每个内容子类关键词下分属有其对应的情感关键词。

3.根据权利要求1所述的一种基于旅游需求模板的景区评价数据分析舆情满意度方法,其特征在于:所述关键词模板库的扩充具体是采用以下方式对内容子类关键词和情感关键词进行扩充:

1)在已构建的关键词模板库基础上,通过网络爬虫工具在内容大类关键词所在段落文字附近搜索内容子类关键词,将找到的在已构建关键词模板库中不存在的内容子类关键词作为新的内容子类关键词,并加入到关键词模板库中;

2)在已构建的关键词模板库基础上,通过网络爬虫工具在内容子类关键词所在段落文字附近搜索情感关键词,将找到的在已构建关键词模板库中不存在的情感关键词作为新的情感关键词,新的情感关键词均赋权值后加入到关键词模板库中。

4.根据权利要求3所述的一种基于旅游需求模板的景区评价数据分析舆情满意度方法,其特征在于:所述的网络爬虫工具采用八爪鱼采集器,网络爬虫工具可以是任意一种,不影响本专利的实质内容。

5.根据权利要求1所述的一种基于旅游需求模板的景区评价数据分析舆情满意度方法,其特征在于:所述针对景区评价数据的舆情满意度分析计算具体是:由扩充后的关键词模板库通过网络爬虫工具搜索景区下的文字数据,抽取出内容大类关键词所在段落文字附近的内容子类关键词,再搜索抽取出每个内容子类关键词所在段落文字附近的情感关键词,从而获得所有情感关键词及其每个情感关键词对应的内容子类关键词和内容大类关键词,然后构建景区舆情与满意度的分析模型,通过景区舆情与满意度的分析模型获得以平均满意度值作为该景区的舆情满意度值。

6.根据权利要求5所述的一种基于旅游需求模板的景区评价数据分析舆情满意度方法,其特征在于:所述的景区舆情与满意度的分析模型具体是:

A)先采用以下公式计算获得文字数据中所有评论中的关于某一个内容子类关键词的满意度值:

<mrow> <msub> <mi>Y</mi> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>5</mn> </munderover> <msub> <mi>tS</mi> <mrow> <mi>i</mi> <mi>j</mi> <mo>_</mo> <mi>t</mi> </mrow> </msub> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>5</mn> </munderover> <msub> <mi>S</mi> <mrow> <mi>i</mi> <mi>j</mi> <mo>_</mo> <mi>t</mi> </mrow> </msub> </mrow> </mfrac> </mrow>

其中,表示第i个内容大类关键词下第j个内容子类关键词的平均满意度值,t是分值(1~5),Sij_t表示i个内容大类关键词下第j个内容子类关键词对应分值为t的情感关键词的数量,Bij表示第i个内容大类关键词下第j个内容子类关键词,B{B11,B12,B13…B21,B22,B23…}代表内容子类关键词集合;

B)再采用以下公式计算获得文字数据中一个内容大类关键词的满意度值:

<mrow> <msub> <mi>Y</mi> <msub> <mi>A</mi> <mi>i</mi> </msub> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>W</mi> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </msub> <msub> <mi>Y</mi> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </msub> </mrow>

其中,表示第i个内容大类关键词的满意度值,表示第i个内容大类关键词下第j个内容子类关键词的权值,n表示第i个内容大类关键词下内容子类关键词的数量,A{A1,A2,…,A6}代表内容大类关键词集合;

C)再采用以下公式计算获得该景区的综合满意度值:

<mrow> <mi>Y</mi> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>6</mn> </munderover> <msub> <mi>W</mi> <msub> <mi>A</mi> <mi>i</mi> </msub> </msub> <msub> <mi>Y</mi> <msub> <mi>A</mi> <mi>i</mi> </msub> </msub> </mrow>

其中,Y表示景区的综合满意度值,i表示内容大类关键词的序号,表示第i个内容大类关键词的权值。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1