数据分析系统和数据分析方法

文档序号:6399791阅读:628来源:国知局
专利名称:数据分析系统和数据分析方法
技术领域
本发明涉及数据处理技术领域,具体而言,涉及ー种数据分析系统和ー种数据分析方法。
背景技术
在办公室大屏幕场景、会议室场景、壁挂式多点触控屏场景下,不方便通过传统交互工具(如鼠标、键盘和触控)对软件进行操作,需要能够通过语音对讲的方式来进行企业数据分析和展示。现有的数据分析方案很多,经典的OLAP (On-Line Analytical Processing,联机分析处理)分析方法,是通过连接数据库或多维数据库,将维度(进行数据分析的角度)和度量(待分析的数据实体)以列表和树的形式展示在分析界面上,用户使用鼠标进行拖放点选,提供ー组维度、若干度量和一组过滤条件,来进行ー个多维分析。这种方法存在以下缺陷:1.需要多步点选或拖放操作才能完成一次数据分析;2.操作者必须使用鼠标等传统交互设备,不能进行远程操控;3.选择维度和过滤条件式,往往需要人工从ー个较长的列表中挑选特定的值(t匕如从几十种产品名称中选择某ー个产品),比较费カ费时。因此,需要ー种新的数据分析技术,能够使分析数据的操作简单化,一次操作完成一次分析,并且能够支持远程操控,不限定操作者的位置,还可以支持精准的过滤条件,无需要从已知列表中点选过滤条件。

发明内容
本发明正是基于上述问题,提出了一种数据分析技术,能够使分析数据的操作简单化,一次操作完成一次分析,并且能够支持远程操控,不限定操作者的位置,还可以支持精准的过滤条件,无需要从已知列表中点选过滤条件。有鉴于此,本发明提出了一种数据分析系统,包括終端和服务器,其中,所述终端包括:语音识别单元,用于识别用户对报表的操作语音;语音解析単元,用于对所述语音识别单元识别到的语音数据进行解析,以得到操作条件;语句生成単元,用于根据所述操作条件生成操作语句;第一数据收发単元,用于将所述操作语句发送至所述服务器,并接收所述服务器返回的与所述操作语句相应的分析数据;展现单元,用于对所述分析数据进行展现;以及所述服务器包括:查询单元,用于根据所述操作语句从数据库中查询所述分析数据;第二数据收发単元,用于接收所述操作语句,并将所述分析数据发送至所述终端。在该技术方案中,通过识别和解析用户的语音,能够根据用户语音生成相应的操作语句,使用户可以通过语音直接发出分析数据的指令,从而使分析数据的操作简单化,一次操作即可完成一次分析,并且能够支持远程操控,不限定操作者的位置,方便了用户操作,简化了操作过程。
在上述技术方案中,优选地,所述语音解析単元包括:获取子単元,用于获取所述语音识别单元识别到的语音数据中的关键字;判断子単元,用于判断数据库中是否存在与所述关键字匹配的语法框架,所述获取子単元在所述判断子単元的判断结果为是的情况下,获取与所述关键字相匹配的目标语法框架;组合子単元,用于按照所述目标语法框架将所述关键字进行组合,以得到解析框架;查询子单元,用于根据所述解析框架,在所述语音识别单元识别到的语音数据中查询符合所述解析框架的动态数据,以作为所述操作条件。在该技术方案中,通过语法框架,可以将用户语音中的关键字组合为解析框架,然后通过解析框架,可以分析出用户语音中的动态数据,从而确定所需执行的操作。在上述技术方案中,优选地,所述终端还包括:模糊设置单元,用于根据接收到的模糊设置指令为所述关键字设置相应的模糊匹配词汇,则所述查询子单元还用于根据由所述相应的模糊匹配词汇组成的模糊解析框架,从所述语音识别单元识别到的语音数据中查询符合所述模糊解析框架的动态数据。在该技术方案中,通过设置关键字的模糊匹配词汇,可以灵活的根据用户语音生成解析框架,从而提高解析用户语音的成功率。在上述技术方案中,优选地,所述终端还包括:设置单元,用于根据接收到的设置指令,设置所述语法框架、所述解析框架和/或所述关键字。在该技术方案中,用户可以根据需要编辑语法框架和解析框架。在上述任一技术方案中,优选地,所述语句生成单元还用于终端根据所述操作条件生成切换语句,以及所述展现単元还用于根据所述切换语句切换对所述分析数据的展现形式。在该技术方案中,可以根据用户语音调整对数据的展现形式。本发明还提出了一种数据分析方法,包括:步骤202,終端识别用户对报表的操作语音,并对识别到的语音数据进行解析,以得到操作条件;步骤204,終端根据所述操作条件生成操作语句,并将所述操作语句发送至服务器;步骤206,所述服务器根据所述操作语句从数据库中查询与所述操作语句相应的分析数据,并将所述分析数据发送至所述终端;步骤208,所述终端对所述分析数据进行展现。在该技术方案中,通过识别和解析用户的语音,能够根据用户语音生成相应的操作语句,使用户可以通过语音直接发出分析数据的指令,从而使分析数据的操作简单化,一次操作即可完成一次分析,并且能够支持远程操控,不限定操作者的位置,方便了用户操作,简化了操作过程。在上述技术方案中,优选地,所述步骤202包括:步骤2022,所述终端获取所述识别到的语音数据中的关键字;步骤2024,判断数据库中是否存在与所述关键字匹配的语法框架,若存在,则获取与所述关键字相匹配的目标语法框架;步骤2026,根据由所述关键字组成的目标语法框架将所述关键字进行组合,以得到解析框架;步骤2028,根据所述解析框架,在所述识别到的语音数据中查询符合所述解析框架的动态数据,以作为所述操作条件。在该技术方案中,通过语法框架,可以将用户语音中的关键字组合为解析框架,然后通过解析框架,可以分析出用户语音中的动态数据,从而确定所需执行的操作。在上述技术方案中,优选地,在所述步骤202之前还包括:根据用户设置指令为所述关键字设置相应的模糊匹配词汇,则所述步骤202还包括:根据由所述相应的模糊匹配词汇组成的模糊解析框架,从所述识别到的语音数据中查询符合所述模糊解析框架的动态数据。在该技术方案中,通过设置关键字的模糊匹配词汇,可以灵活的根据用户语音生成解析框架,从而提高解析用户语音的成功率。在上述技术方案中,优选地,还包括:根据接收到的设置指令,设置所述语法框架、所述解析框架和/或所述关键字。在该技术方案中,用户可以根据需要编辑语法框架和解析框架。在上述任一技术方案中,优选地,所述步骤204还包括:所述终端根据所述操作条件生成切换语句,以及所述步骤208还包括:根据所述切换语句切换对所述分析数据的展现形式。在该技术方案中,可以根据用户语音调整对数据的展现形式。通过以上技术方案,能够使分析数据的操作简单化,一次操作完成一次分析,并且能够支持远程操控,不限定操作者的位置,还可以支持精准的过滤条件,无需要从已知列表中点选过滤条件。


图1示出了根据本发明的实施例的数据分析系统的框图;图2示出了根据本发明的实施例的数据分析方法的流程图;图3示出了根据本发明的实施例的数据分析方法的具体流程图。
具体实施例方式为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式
对本发明进行进一歩的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互組合。在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。术语解释:维度:用于分析数据的角度,比如产品分类、时间区段、地理位置等。度量:通过一定维度来分析的数据实体,比如销售额、利润等。过滤条件:将多个分析维度中的某ー个维度,限定为特定的值,以此为条件来,按其它的维度来来查看度量。比如将时间维度限定为特定年份,然后通过地理维度来查看销售额。数据立方体:ニ维表格的多维扩展,不局限于三个维度。用于从多个维度来分析数据,比如产品维度、时间维度、地理维度等。数据仓库:决策支持系统和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题,其特征在于面向主题、集成性、稳定性和时变性。多维数据库:在MOLAP中使用的数据源,包含了从多个维度进行分类和聚合的度量数据,也称多维立方体。MDX:Mult1-Dimensional Expressions,多维表达式,是一种编程语言语法,支持多维对象与数据的定义和操作。图1示出了根据本发明的实施例的数据分析系统的框图。如图1所示,根据本发明的实施例的数据分析系统100包括:終端102和服务器104,其中,終端102包括:语音识别单元1020,用于识别用户对报表的操作语音;语音解析単元1022,用于对语音识别单元1020识别到的语音数据进行解析,以得到操作条件;语句生成単元1024,用于根据操作条件生成操作语句;第一数据收发単元1026,用于将操作语句发送至服务器,并接收服务器返回的与操作语句相应的分析数据;展现单元1027,用于对分析数据进行展现;以及服务器104包括:查询单元1040,用于根据操作语句从数据库中查询分析数据;第二数据收发単元1042,用于接收操作语句,并将分析数据发送至終端。通过识别和解析用户的语音,能够根据用户语音生成相应的操作语句,使用户可以通过语音直接发出分析数据的指令,从而使分析数据的操作简单化,一次操作即可完成一次分析,并且能够支持远程操控,不限定操作者的位置,方便了用户操作,简化了操作过程。优选地,语音解析単元1022包括:获取子単元10222,用于获取语音识别单元1020识别到的语音数据中的关键字;判断子単元10224,用于判断数据库中是否存在与关键字匹配的语法框架,获取子単元10222在判断子単元10224的判断结果为是的情况下,获取与关键字相匹配的目标语法框架;组合子単元10226,用于按照目标语法框架将关键字进行组合,以得到解析框架;查询子单元10228,用于根据解析框架,在语音识别单元识别到的语音数据中查询符合解析框架的动态数据,以作为操作条件。通过语法框架,可以将用户语音中的关键字组合为解析框架,然后通过解析框架,可以分析出用户语音中的动态数据,从而确定所需执行的操作。优选地,終端102还包括:模糊设置单元1028,用于根据接收到的模糊设置指令为关键字设置相应的模糊匹配词汇,则查询子单元10228还用于根据由相应的模糊匹配词汇组成的模糊解析框架,从语音识别单元1020识别到的语音数据中查询符合模糊解析框架的动态数据。通过设置关键字的模糊匹配词汇,可以灵活的根据用户语音生成解析框架,从而提高解析用户语音的成功率。优选地,終端102还包括:设置单元1029,用于根据接收到的设置指令,设置语法框架、解析框架和/或关键字。用户可以根据需要编辑语法框架和解析框架,以及构成框架的关键字。优选地,语句生成単元1024还用于終端根据操作条件生成切换语句,以及展现单元1027还用于根据切换语句切换对分析数据的展现形式。可以根据用户语音调整对数据的展现形式。图2示出了根据本发明的实施例的数据分析方法的流程图。如图2所示,根据本发明的实施例的数据分析方法包括:步骤202,终端识别用户对报表的操作语音,并对识别到的语音数据进行解析,以得到操作条件;步骤204,終端根据操作条件生成操作语句,并将操作语句发送至服务器;步骤206,服务器根据操作语句从数据库中查询与操作语句相应的分析数据,并将分析数据发送至所述终端;步骤208,終端对分析数据进行展现。通过识别和解析用户的语音,能够根据用户语音生成相应的操作语句,使用户可以通过语音直接发出分析数据的指令,从而使分析数据的操作简单化,一次操作即可完成一次分析,并且能够支持远程操控,不限定操作者的位置,方便了用户操作,简化了操作过程。优选地,步骤202包括:步骤2022,终端获取识别到的语音数据中的关键字;步骤2024,判断数据库中是否存在与关键字匹配的语法框架,若存在,则获取与关键字相匹配的目标语法框架;步骤2026,根据由关键字组成的目标语法框架将关键字进行组合,以得到解析框架;步骤2028,根据解析框架,在识别到的语音数据中查询符合解析框架的动态数据,以作为操作条件。通过语法框架,可以将用户语音中的关键字组合为解析框架,然后通过解析框架,可以分析出用户语音中的动态数据,从而确定所需执行的操作。优选地,在步骤202之前还包括:根据用户设置指令为关键字设置相应的模糊匹配词汇,则步骤202还包括:根据由相应的模糊匹配词汇组成的模糊解析框架,从识别到的语音数据中查询符合模糊解析框架的动态数据。通过设置关键字的模糊匹配词汇,可以灵活的根据用户语音生成解析框架,从而提高解析用户语音的成功率。优选地,还包括:根据接收到的设置指令,编辑语法框架、解析框架和/或关键字。用户可以根据需要编辑语法框架和解析框架,以及构成框架的关键字。优选地,步骤204还包括:終端根据操作条件生成切换语句,以及步骤208还包括:根据切换语句切换对分析数据的展现形式。可以根据用户语音调整对数据的展现形式。图3示出了根据本发明的实施例的数据分析方法的具体流程图。如图3所示,根据本发明的实施例的数据分析方法具体包括:步骤302,通过预置特定的语法规则,引导语音识别引擎进行语句识别;步骤304,将识别后的结果,进行结构化分析,即将一句话拆分成有意义的几个短语,分别从中解析出做多维数据分析必要的“维度”、“度量”和“过滤条件”等要素;步骤306,根据上述要素构建多为数据分析业界标准的MDX查询语句(类似于SQL但专用于多维度数据分析);步骤308,将MDX查询语句发送到服务器端的多维分析立方体,由服务器返回ー个多维数据集;步骤310,最終将该多维数据集以图表(柱形图、折线图等等)的形式在屏幕上进行展示,以达到多维数据分析的目的。如何预置语法规则,是通过语音进行多维报表分析的关键和难点。首先对多维报表分析所需要的语法元素进行梳理,归结出要构建ー个正确有用的数据分析,需要提供以下要素:a)分析维度;b)分析度量;c)过滤条件,这三者都来源于数据库或多维数据库,且都可以是多重的。比如可以分别从订购时间和货主地区来查看销售额(多重维度),可以同时查看销售额和利润(多重度量),可以限定要查看某一年某一地区的销售额(多重过滤条件)。
要在一句自然语音中,一次性识别上述三个语义要素,需要构建出灵活、自然和精确的语法规则,并满足高识别率的要求。根据现有语音识别技术中的SRGS (Speech Recognition GrammarSpecification)标准,可以定义任意的语法规则。通过做出适应于数据分析需要的专有语法分析树,用预定关键字和动态数据项结合的方式,来初始化语音识别引擎。比如设定“按”和“查看”为关键字,存在形式为“介词+名词+动词+名词”的语法框架A,那么将“按”和“查看”添加至相应的位置,可以形成“按[维度]查看[过滤条件]的[度量]”的解析框架,然后根据该解析框架从多维数据库中提取动态数据项,填充到解析框架的括号中的位置,来构建一个对应于某一多维数据库的“分析语言”。当用户按照上述语言的词汇和语法来说出语音指令,就可以通过树状语法分析和模式匹配,解析出语音指令中“维度”、“度量”和“过滤条件”等要素,为后续构建MDX查询语句做好准备。当然,关键字、语法框架和解析框架都是可以根据用户设置重新生成的,比如在数据库中设置形式为“动词+介词+时间+介词+时间+名词”语法框架B和上述语法框架A,那么当检测到关键字为“查询”和“从……到”的时候,则将这组关键词与语法框架B和上述语法框架A匹配,则可以判定该组关键词与语法框架B相匹配,从而将该组关键词添加至语法框架B,形成“查询从[维度]到[维度]的[度量]”的解析框架。设置的关键字可以包括“按”、“查看”、“钻取”、“切换”、“返回”等等,这些关键字不是孤立的,他们依附于更有逻辑性的语法树结构。可以这只关键字的模糊匹配词汇,比如设置关键字“查看”的模糊匹配词汇为“查询”、“显示”和“获取”,关键字“按”的模糊词汇为“按照”、“以”,那么当识别出一组关键字为“以”和“查询”时,这组关键字实际上与“按”和“查看”等效,依然可以判定其与上述语法框架A相匹配,操作者可以按照自身的习惯,定义特定的模糊匹配支持。语法结构包括查询语法、数据钻取语法、图形展示切换语法,以及各种命令语法
坐寸ο`具体地,在服务器104中已设置完成一个销售分析立方体,包含多种分析维度、维层次和度量。典型的维度(层次)包括“地区”、“城市”、“产品类别”、“产品名称”、“时间”等,典型的度量包括“销售金额”和“运货费”。用户对终端102说出“按地区查看2011年饼干的销售金额”,终端102对上述语音进行识别和解析后,可以得到以下四个元素:I)维度:地区2)度量:销售金额3)过滤条件1:2011年(通过时间维过滤)4)过滤条件2:饼干(通过产品名称维过滤)有了这些必要的元素,就能构建出一个完整的多维分析查询语句(MDX),将该多维数据查询语句发送到服务器,查出一个两列的数据表,并最终以柱形图的形式,展示在程序中。在进行一次多维查询后,可以基于现有的查询进行下钻分析(即在维度的层次中进行分解,去查看更细粒度的数据)。也可以通过语音命令,来切换数据的最终展示形式,比如使展现形式从柱形图切换到饼图等。
通过结合语音识别引擎和MDX查询标准的使用,只需一步操作就能完成一个多维数据分析,不再需要通过多个步骤,分别提供维度、度量和过滤条件等信息。用户可以直接将精确的查询条件说出来,与现有方案的从一个列表中进行筛选有很大改善,不再需要从众多候选项中滚动查看和拣选所需的过滤条件,比如不需要从上百个产品名称列表中找到“饼干”后用鼠标点选,而是直接说出“饼干” 二字,由计算机帮助进行过滤条件的识别。而且通过软件设计为人机语音对话界面,允许远程操控和多人互动。以上结合附图详细说明了本发明的技术方案,考虑到相关技术中,用户进行数据分析操作时,需要多步点选或拖放操作才能完成一次数据分析,而且操作者必须使用鼠标等传统交互设备,不能进行远程操控,当选择维度和过滤条件式时,往往需要人工从一个较长的列表中挑选特定的值,比较费力费时。通过本发明的技术方案,能够使分析数据的操作简单化,一次操作完成一次分析,并且能够支持远程操控,不限定操作者的位置,还可以支持精准的过滤条件,无需要从已知列表中点选过滤条件。在本发明中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种数据分析系统,其特征在于,包括終端和服务器,其中,所述终端包括: 语音识别单元,用于识别用户对报表的操作语音; 语音解析単元,用于对所述语音识别单元识别到的语音数据进行解析,以得到操作条件; 语句生成単元,用于根据所述操作条件生成操作语句; 第一数据收发単元,用于将所述操作语句发送至所述服务器,并接收所述服务器返回的与所述操作语句相应的分析数据; 展现单元,用于对所述分析数据进行展现;以及 所述服务器包括: 查询单元,用于根据所述操作语句从数据库中查询所述分析数据; 第二数据收发単元,用于接收所述操作语句,并将所述分析数据发送至所述终端。
2.根据权利要求1所述的数据分析系统,其特征在于,所述语音解析単元包括: 获取子単元,用于获取所述语音识别单元识别到的语音数据中的关键字; 判断子単元,用于判断数据库中是否存在与所述关键字匹配的语法框架,所述获取子単元在所述判断子単元的判断结果为是的情况下,获取与所述关键字相匹配的目标语法框架; 组合子単元,用于按照所述目标语法框架将所述关键字进行组合,以得到解析框架;查询子単元,用于根据所述解析框架,在所述语音识别单元识别到的语音数据中查询符合所述解析框架的动态 数据,以作为所述操作条件。
3.根据权利要求2所述的数据分析系统,其特征在于,所述终端还包括: 模糊设置单元,用于根据接收到的模糊设置指令为所述关键字设置相应的模糊匹配词汇,则所述查询子单元还用于根据由所述相应的模糊匹配词汇组成的模糊解析框架,从所述语音识别单元识别到的语音数据中查询符合所述模糊解析框架的动态数据。
4.根据权利要求2所述的数据分析系统,其特征在于,所述终端还包括: 设置单元,用于根据接收到的设置指令,设置所述语法框架、所述解析框架和/或所述关键字。
5.根据权利要求1至4中任一项所述的数据分析系统,其特征在于,所述语句生成単元还用于終端根据所述操作条件生成切换语句,以及所述展现単元还用于根据所述切换语句切換对所述分析数据的展现形式。
6.一种数据分析方法,其特征在于,包括: 步骤202,終端识别用户对报表的操作语音,并对识别到的语音数据进行解析,以得到操作条件; 步骤204,終端根据所述操作条件生成操作语句,并将所述操作语句发送至服务器;步骤206,所述服务器根据所述操作语句从数据库中查询与所述操作语句相应的分析数据,并将所述分析数据发送至所述终端; 步骤208,所述终端对所述分析数据进行展现。
7.根据权利要求6所述的数据分析方法,其特征在于,所述步骤202包括: 步骤2022,所述终端获取所述识别到的语音数据中的关键字; 步骤2024,判断数据库中是否存在与所述关键字匹配的语法框架,若存在,则获取与所述关键字相匹配的目标语法框架; 步骤2026,根据由所述关键字组成的目标语法框架将所述关键字进行组合,以得到解析框架; 步骤2028,根据所述解析框架,在所述识别到的语音数据中查询符合所述解析框架的动态数据,以作为所述操作条件。
8.根据权利要求7所述的数据分析方法,其特征在于,在所述步骤202之前还包括:根据用户设置指令为所述关键字设置相应的模糊匹配词汇,则所述步骤202还包括:根据由所述相应的模糊匹配词汇组成的模糊解析框架,从所述识别到的语音数据中查询符合所述模糊解析框架的动态数据。
9.根据权利要求7所述的数据分析方法,其特征在于,还包括:根据接收到的设置指令,设置所述语法框架、所述解析框架和/或所述关键字。
10.根据权利要求6至9中任一项所述的数据分析方法,其特征在于,所述步骤204还包括:所述终端根据所述操作条件生成切换语句,以及所述步骤208还包括:根据所述切換语句切换对所述分析数据 的展现形式。
全文摘要
本发明提供了一种数据分析系统,包括终端和服务器,其中,终端包括语音识别单元,识别用户对报表的操作语音;语音解析单元,对语音识别单元识别到的语音数据进行解析得到操作条件;语句生成单元,根据操作条件生成操作语句;第一数据收发单元,将操作语句发送至服务器,接收服务器返回的相应的分析数据;展现单元,对分析数据进行展现;服务器包括查询单元,根据操作语句查询分析数据;第二数据收发单元,接收操作语句,将分析数据发送至终端。本发明还提出了一种数据分析方法。通过本发明的技术方案,能够使分析数据的操作简单化,并且能够支持远程操控,还可以支持精准的过滤条件,无需要从已知列表中点选过滤条件。
文档编号G06F17/30GK103116649SQ20131006295
公开日2013年5月22日 申请日期2013年2月28日 优先权日2013年2月28日
发明者王辉, 何英华, 景韵 申请人:用友软件股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1