一种基于大数据的深度挖掘方法与流程

文档序号:33514959发布日期:2023-03-22 05:47阅读:81来源:国知局
一种基于大数据的深度挖掘方法与流程

1.本发明涉及大数据挖掘技术领域,具体为一种基于大数据的深度挖掘方法。


背景技术:

2.问卷调查是指通过制定详细周密的问卷,要求被调查者据此进行回答以收集资料的方法。所谓问卷是一组与研究目标有关的问题,或者说是一份为进行调查而编制的问题表格,又称调查表。它是人们在社会调查研究活动中用来收集资料的一种常用工具。调研人员借助这一工具对社会活动过程进行准确、具体的测定,并应用社会学统计方法进行量的描述和分析,获取所需要的调查资料。
3.随着科技的发展,问卷调查也从纸质问卷逐渐向电子问卷转变。但是目前电子问卷中的问题都是事先固定的,无法对问题进行内部优化调整。而每个用户对不同问题的作答时间不同,只有等所有的用户全部作答完毕,云端处理器才能够对全部问卷进行分析处理,并出具最终结果。一旦某些用户作答过慢,就会导致最终结果延期出具,严重影响调查问卷的效率。


技术实现要素:

4.本发明的目的在于提供一种基于大数据的深度挖掘方法,使其能够在保证问卷质量的前提下,提高问卷效率。
5.本发明具体是这样的:一种基于大数据的深度挖掘方法,包括内部测试阶段和外部输出阶段;
6.所述内部测试阶段包括以下步骤:
7.s1、向内部测试用户输出内部电子问卷,所述内部电子问卷包括多个不同类型的问卷版块,所述问卷版块中的问题包括多个固定问题和多个活动问题;
8.s2、所述内部测试用户对所述问卷版块中的全部问题进行作答;
9.s3、将作答后的所述内部电子问卷输入云端处理器的内部分析单元,所述内部分析单元对每个问卷版块中的活动问题按照内部测试用户的作答时间长短进行排列、并将预设数量的作答时间短的所述活动问题送入储存单元;
10.s4、所述云端处理器对所述储存单元内的所有所述活动问题进行分析处理,将预设数量的重复率最高的所述活动问题送入整理单元;
11.s5、所述云端处理器将全部所述固定问题送入所述整理单元;
12.s6、所述云端处理器对所述整理单元内的所有问题进行分析处理,将同类型的所述固定问题和所述活动问题整理排列、形成问卷版块,得到最终版电子问卷;
13.所述外部输出阶段包括:
14.s7、向所述外部用户输出最终版电子问卷。
15.进一步地,所述问卷版块的类型包括选择题、判断题和简答题。
16.进一步地,还包括统计阶段,所述统计阶段包括以下步骤:
17.s8、将作答后的全部所述最终版电子问卷输入云端处理器的外部分析单元,所述外部分析单元根据作答情况对所述最终版电子问卷内的所有问题赋予对应的作答分值,并将同类型问卷版块内的所有问题的作答分值加在一起得到板块分值;
18.s9、将所有的板块分值加在一起,得到外部用户对电子问卷对象的态度分数。
19.进一步地,在步骤s9中,所述外部分析单元对不同类型的板块分值进行加权处理得到加权分值,所述外部用户对电子问卷对象的态度分数等于不同类型问卷版块的加权分值之和。
20.进一步地,所述加权处理的加权系数由开发者事先设计,并可根据开发者的意愿进行调整。
21.进一步地,所述作答分值由开发者事先设计,并可根据开发者的意愿进行调整。
22.进一步地,所述选择题和所述判断题的作答分值根据外部用户的选择决定,所述问答题的作答分值根据内部审阅专家的打分决定
23.进一步地,所述选择题的作答分值从前至后依次降低,所述判断题中积极作答的作答分值为消极作答的作答分值的两倍
24.进一步地,开发者事先对每个所述问卷版块中的问题进行调整,以使得每个所述问卷版块中的所有问题的题干文字数量差距不超过20%。
25.有益效果:本发明提供的一种基于大数据的深度挖掘方法,在内部测试阶段能够对活动问题进行调整,从而将作答时间短的活动问题选出来,与固定问题一起整理排列,得到最终版的电子问卷,从而提高问卷效率。同时,本技术中的固定问题为开发者事先确定下来的问题,这类问题比较重要,无法调整,因此能够保证问卷质量。
附图说明
26.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
27.图1为本发明的流程示意图。
具体实施方式
28.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
29.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
30.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
31.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
32.在本技术实施例的描述中,需要说明的是,指示方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,或者是本领域技术人员惯常理解的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
33.在本技术实施例的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接连接,也可以通过中间媒介间接连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。
34.请参阅图1,本发明提供一种基于大数据的深度挖掘方法,包括内部测试阶段和外部输出阶段。
35.内部测试阶段包括以下步骤:
36.步骤一、云端处理器向多个内部测试用户输出内部电子问卷。内部电子问卷包括多个不同类型的问卷版块,不同类型的问卷版块内的题型不同。问卷版块中的问题包括多个固定问题和多个活动问题。固定问题是开发者事先确定下来的问题,这类问题比较重要,相互之间无法代替,无法调整,因此能够最低限度地保证问卷质量。活动问题相对而言重要性较低,相互之间可以代替。
37.步骤二、内部测试用户收到内部电子问卷后,对问卷版块中的全部问题进行作答。
38.步骤三、将作答后的内部电子问卷输入云端处理器的内部分析单元,内部分析单元对每个问卷版块中的活动问题按照内部测试用户的作答时间长短进行有序排列、作答时间短的活动问题排在前面,并将预设一定数量的作答时间短的活动问题送入储存单元。
39.步骤四、云端处理器对储存单元内的所有活动问题进行分析处理,分析对比储存单元内的活动问题的重复率,将预设一定数量的重复率最高的活动问题送入整理单元。
40.步骤五、云端处理器将全部固定问题送入整理单元,与整理单元内的活动问题混在一起。
41.步骤六、云端处理器对整理单元内的所有问题进行分析处理,将同类型的固定问题和活动问题整理一一对应地排列在一起、组合形成新的问卷版块,得到最终版电子问卷。
42.外部输出阶段包括:
43.步骤七、云端处理器向外部用户输出最终版电子问卷,供外部用户作答。
44.在一个实施例中,问卷版块的类型包括选择题、判断题和简答题,以完善问卷调查的类型,进一步提高问卷质量。
45.在一个实施例中,还包括统计阶段,统计阶段包括以下步骤:
46.步骤八、外部用户作答完毕后点击提交,这样外部用户作答后的全部最终版电子问卷就会输入云端处理器的外部分析单元,外部分析单元根据外部用户的作答情况对最终版电子问卷内的所有问题赋予对应的作答分值,并将同类型问卷版块内的所有问题的作答分值加在一起得到板块分值。
47.板块分值代表该外部用户在此问卷版块中对对电子问卷对象的态度分数。
48.步骤十、云端处理器将所有的板块分值加在一起,得到该外部用户对电子问卷对象的总体态度分数。总体态度分数的高低能够反映该外部用户对问卷对象的印象,例如当问卷对象是某个产品时,总体态度分数能够反映该外部用户对该产品的印象好坏;当问卷对象是某件事情时,总体态度分数能够反映该外部用户对该事件的看法是积极还是消极。
49.在一个实施例中,在步骤九中,外部分析单元对不同类型的板块分值进行加权处理得到加权分值,外部用户对电子问卷对象的态度分数等于不同类型问卷版块的加权分值之和。
50.外部分析单元能够对不同类型的板块分值赋予不同的加权系数,加权系数能够调节不同类型的板块分值的重要性。
51.在一个实施例中,加权处理的加权系数由开发者事先设计,并可根据开发者的意愿进行调整,方便开发者进行平衡设计。
52.在一个实施例中,作答分值由开发者事先设计,并可根据开发者的意愿进行调整,进一步方便开发者进行平衡设计。
53.在一个实施例中,选择题和判断题的作答分值根据外部用户的选择决定,选择题和判断题为客观题,能够方便云端处理器对作答分值进行快速统计。问答题的作答分值根据内部审阅专家的打分决定,简答题为主观题,为了作答分值更加准确,需要内部审阅专家人工打分。
54.在一个实施例中,选择题的作答分值从前至后依次降低,进一步方便后续云端处理器对作答分值进行快速统计。判断题中积极作答的作答分值为消极作答的作答分值的两倍。
55.在一个实施例中,开发者事先对每个问卷版块中的问题进行调整,以使得每个问卷版块中的所有问题的题干文字数量差距不超过20%,精简题干,减少无效信息,以减少题干长短对外部用户的作答时间产生影响。
56.以上仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1