数据获取装置和获取方法与流程

文档序号：12806187阅读：219来源：国知局

本发明属于信息处理技术领域，尤其涉及一种数据获取装置，以及一种数据获取方法。

背景技术：

随着基于云的大数据技术和可穿戴智能电子产品技术的发展，为提升传统的管理方法提供了许多的可能性。比如，针对营销业务人员的管理，可以通过配备可穿戴式智能大数据采集终端设备，通过数据采集，大数据分析，获得许多传统方法无法获取的有价值信息。例如，业务人员和客户沟通的技巧评估、业务人员为客户传达信息的要素点分析、客户潜在需求分析、业务人员业绩评估要素分析等。将传统的粗放式管理转化为更客观的数据化精细化管理，是建立高效精益化管理的必要技术保证。

在相关技术中，公开了一种客服语音智能搜索和分析系统及方法，其主要专注于对录音文件、音频文件分析处理的方法，例如，如何从录音文件、音频文件数字化，基于vad段和特征提取技术区分语音对话角色实现场景分割，将结果已文本文件输出，完成语音转写过程，然后进行索引，检索等分析。

技术实现要素：

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本发明需要提出一种数据获取装置，该装置，为提升传统的管理方法提供技术可行性，为将传统的粗放式管理转换为更加客观的数据化精细话管理提供数据基础。

本发明还提出一种数据获取方法。

为了解决上述问题，本发明一方面提出一种数据获取装置，该装置包括：语音采集模块，用于采集语音信息；传感器模块，用于采集所述语音信息所对应的语音发出者的行为状态信息；控制模块，所述控制模块根据时间顺序以标记语言格式分别对所述语音信息和所述行为状态信息进行标记处理，并将标记处理之后的信息根据对应的所述语音发出者进行保存。

本发明实施例的数据获取装置，通过传感器模块采集语音发出者的行为状态信息，进而控制模块根据时间顺序以标记语言格式分别对语音信息和该行为状态信息进行标记处理，从而使得语音信息与行为状态信息关联，并对应目标人员保存数据，通过关联更多的数据可以获得更加客观的结果，为更加客观化精细化的管理提供数据基础和技术可行性。

为了解决上述问题，本发明另一方面提出一种数据获取方法，该方法包括以下步骤：采集语音信息；采集所述语音信息对应的语音发出者的行为状态信息；根据时间顺序以标记语言格式分别对所述语音信息和所述行为状态信息进行标记处理，并将标记处理之后的信息根据对应的所述语音发出者进行保存。

本发明实施例的数据获取方法，通过采集语音发出者的行为状态信息，进而根据时间顺序以标记语言格式分别对语音信息和行为状态信息进行标记处理，使得语音信息和行为状态信息相关联，可以获得更加客观的结果，为更加客观化精细化的管理提供数据基础和技术可行性。

附图说明

图1是根据本发明的一个实施例的数据获取装置的功能框图；

图2是根据本发明的另一个实施例的数据获取装置的功能框图；以及

图3是根据本发明的一个实施例的数据获取方法的流程图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

针对通过数据采集和大数据分析实现更加客观的数据化精细化管理的实现，虽然在相关技术中提出从录音文件、音频文件数字化，基于vad(voiceactivitydetection，语音活动检测)段和特征提取技术区分语音对话角色实现场景分割，将结果以文本文件输出，完成语音转写过程，然后进行索引，检索等分析。但是，并没有提到如何获得此类音频文件，只是针对音频信息提取获得数据进一步的挖掘，并没有更进一步地关联语音角色的地理特征信息例如行为轨迹等，或者人体行为信息例如静止、走动等。换句话说，相关技术对语音信息的发出者本身的一些关联信息关注的比较少，因而在某些领域，采用采集到的数据对相关人员进行更加客观化精细化管理有待进一步完善。

在本发明实施例中，正是考虑到语音信息的发出者本身的关联信息，而提出一种数据获取装置和采集方法。

下面对本发明实施例的数据获取装置进行说明。图1是根据本发明的一个实施例的数据获取装置的框图。如图1所示，该装置100包括语音采集模块20、传感器模块 30和控制模块40。

其中，语音采集模块20用于采集语音信息，例如采集目标人员的语音数据、开始时间、时长、声音强度等；传感器模块30用于采集语音信息所对应的语音发出者的行为状态信息，例如，采集语音发出者的行为活动轨迹、形态例如走路、坐着或者站着，也就是说，在采集语音信息的同时，获得语音发出者的其他相关信息，采集更多的信息进行分析，可以获得更加客观的结果。

控制模块40根据时间顺序以标记语言格式分别对语音信息和行为状态信息进行标记处理，并将标记处理之后的信息根据对应的语音发出者进行保存。其中，标记语言，是一种将文本以及文本相关的其他信息结合起来，展现出关于文档结构和数据处理细节的电脑文字编码，与文本相关的其他信息(例如包括文本的结构和表示信息等)与原来的文本结合在一起，但是使用标记进行标识。具体地，控制模块40获取某人员在某段时间的语音信息和对应该段时间的行为状态信息，并对语音信息和行为状态信息进行标记处理。例如，标记语音信息，以及增加该被标记语音信息的额外信息例如开始时间、时长、声音强度；以及，标记该语音信息发出者的各种行为状态，并增加各个行为状态信息对应的额外信息例如对于活动轨迹进行标记，并增加活动轨迹的额外信息例如坐标数据和时间等。

通过以标记语言格式分别对语音信息和行为状态信息进行标记处理，将语音信息和行为状态信息进行关联，从而通过标记以结构化的格式存储数据，可以更好地表现目标人员的很多数据关系，更加准确高效地搜索相关数据内容。也就是说，本发明实施例的装置100，关联语音发出者的更多的特征信息，通过采集此类语音数据和语音发出者的行为状态信息，控制模块40进行标记处理，进而通过算法可以测算出目标人员的行为习惯、工作状态、工作绩效等。

本发明实施例的数据获取装置100，通过传感器模块30采集语音发出者的行为状态信息，进而控制模块40根据时间顺序以标记语言格式分别对语音信息和该行为状态信息进行信息标记处理，通过关联更多的信息，可以获得更加客观的结果，为将传统的粗放式管理转换为更加客观化精细化的管理提供数据基础和技术可行性。

具体地，在本发明的实施例中，控制模块40以可扩展标记语言(xml,extensiblemarkuplanguage)格式分别对语音信息和行为状态信息进行标记处理。通过相关技术可知，可扩展标记语言，是标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言，它的标签没有被预定义，需要自行定义标签，其被设计为具有自我描述性。因此，采用xml可以自定义标签，并为被标记内容附加一些额外的信息。

具体地，采用xml格式进行标记处理时，控制模块40分别对语音信息和行为状态信息标记对应的标签，以及分别标记语音信息和行为状态信息对应的标签的嵌套子元素，其中，嵌套子元素包括时间信息。例如，语音信息标记为音频信息标签，该音频信息标签对应的嵌套子元素包括录音开始、识别结束，时长，声强。

其中，传感器模块30可以包括但不限于重力传感器、加速度传感器、磁力传感器和gps(globalpositioningsystem，全球定位系统)接收模块中的一种或多种。即在采集语音信息的同时，采集语音信息对应的语音发出者的行为状态信息例如通过重力传感器或者加速度传感器或者磁力传感器记录语音发出者的运动状态，或者通过gps接收模块获得语音发出者的运动轨迹，通过采集该类数据，控制模块40可以根据相关算法测算出该语音发出者的工作状态。可以理解的是，一般地，传感器模块30需要佩戴于语音发出者的身上以获得相应的行为状态信息。

采用xml格式进行标记处理，其中，行为状态信息对应的标签和该标签的嵌套子元素包括以下任意一种或多种：重力传感器采集的信息标记为重力信息标签，重力信息标签对应的嵌套子元素包括重力和时间；加速度传感采集的信息标记为加速度信息标签，加速度信息标签对应的嵌套子元素包括加速度和时间；磁力传感器采集的信息标记为磁力信息标签，磁力信息标签对应的嵌套子元素包括磁力数据和时间；gps接收模块采集的信息标记为gps信息标签，gps信息标签对应的嵌套子元素包括坐标数据和时间。

控制模块40将经过标记处理后的数据进行保存，以便进一步处理，也可以传输到云平台上，供进一步数据挖掘。通过根据前述过程进行数据采集，可以获得许多传统方法无法获取的有价值的信息，进而可以对采集的大数据进行进一步分析和挖掘，例如业务人员和客户沟通的技巧评估、业务人员为客户传达信息的要素点分析、客户潜在需求分析、业务人员业绩评估要素分析等，从而可以将传统的粗放式管理转化为客观的数据化精细话管理。

即语音信息和行为状态信息进行关联并以结构化的大数据进行存储，为后续的数据挖掘和分析提供数据基础，以及为高效地搜索有用信息提供基础。

如图2所示，通过供电模块为数据获取装置100提供电源和进行供电管理，供电模块包括电源单元11和电源管理单元12，电源单元11为数据获取装置100提供电源，电源管理单元12对数据获取装置100的供电进行管理。

如图2所示，该数据获取装置100还包括唤醒模块50，唤醒模块50用于接收数据采集事件的唤醒指令，在唤醒模块50未接收到该唤醒指令时，电源管理单元12关闭除了唤醒模块50以外模块的供电，从而可以降低功耗，节约电能。

可以理解的是，在不工作时，数据获取装置100除了唤醒部分电路处于待机状态之后，其他电路部分处于休眠状态。当唤醒模块50接收到唤醒指令时，与数据采集事件相关的模块被唤醒，开始工作。

具体地，在本发明的一个实施例中，唤醒指令可以包括语音唤醒模式和/或运动唤醒模式。即可以通过特定语音符合给出指令，或者，通过特定运动行为例如设定为装置100上下运动三下唤醒启动电路。唤醒模块50接收到唤醒指令之后，进而处于休眠状态的与数据采集事件相关的模块被唤醒，例如，语音采集模块20开始录音，传感器模块30开始采集该语音发出者的行为状态信息，进而控制模块40进行分析。即采用双模唤醒技术实现人员交流时的录音开始、识别结束，并给出时长，并测量声强等。

如图2所示，该数据获取装置100还可以包括单独的存储模块60，存储模块60用于存储语音信息和语音发出者的行为状态信息，即存储语音采集模块20采集的语音信息以及相应的当前传感器的各个输出信息。

如图2所示，该数据获取装置100还包括数据传输模块70例如蓝牙模块、wifi模块、移动数据模块等，数据传输模块70用于将语音信息和语音发出者的行为状态信息传输至云服务器，具体地，控制模块40中的数据上传算法将收集的数据通过数据传输模块70上传到大数据云服务器上，以进行进一步的数据分析。

本发明实施例的数据获取装置100为可穿戴式装置。

具体地，当人员佩戴该装置100时，唤醒模块50可以配置为语音唤醒模式、运动唤醒模式之一，电源管理单元12可以关闭与唤醒事件无关的模块，节约电能消耗，达到长时间工作的目的。当发生唤醒触发事件时，唤醒模块50通知电源管理单元12，启动该装置100的所有模块工作。此时，语音采集模块20开始采集当前佩戴人员的声音，传感器模块30采集当前佩戴者即语音发出者的行为状态信息，控制模块40中的语音分析算法工作，分析当前语音的信息，包括开始时间、时长、声强、该声音是谁的声音等；控制模块40中的欲动控制算法根据传感器模块30提供的数据分析当前装置100佩带者的各种状态以及运动轨迹。另外，存储模块60存储相应的语音信息以及各个传感器的各种输出信息。控制模块40中的数据上传算法将收集的数据通过数据传输模块70传输到大数据云服务器上，以进一步分析。

概括地说，本发明实施例的数据获取装置100，可以进行大数据采集，带来更好的效率，节能省电，增加使用时间，提升社会效益。

基于上述方面实施例的数据获取装置的说明，下面参照附图描述根据本发明实施例提出的数据获取方法。

图3是根据本发明的一个实施例的数据获取方法的流程图。如图3所示，该方法包括以下步骤：

s1，采集语音信息。

s2，采集语音信息对应的语音发出者的行为状态信息。

s3，根据时间顺序以标记语言格式分别对语音信息和行为状态信息进行标记处理，并将标记处理之后的信息根据对应的语音发出者进行保存。

本发明实施例的数据获取方法，通过采集语音发出者的行为状态信息，进而根据时间顺序以标记语言格式分别对语音信息和该行为状态信息进行标记处理，并对应目标人员保存数据，可以获得更加客观的结果，为更加客观化精细化的管理提供数据基础和技术可行性。

在本发明的实施例中，采用可扩展标记语言对语音信息和行为状态信息进行标记处理，根据时间顺序分别对语音信息和行为状态信息进行信息组织标记处理，具体包括：分别对语音信息和行为状态信息标记对应的标签；分别标记语音信息和行为状态信息对应的标签的嵌套子元素，其中，嵌套子元素包括时间信息。

在本发明的实施例中，采集语音信息对应的语音发出者的行为状态信息，包括：采集语音信息对应的语音发出者的重力信息、加速度信息、磁力信息和gps信息中的一种或者多种。

采用xml格式进行标记时，其中，语音信息标记为音频信息标签，音频信息标签对应的嵌套子元素包括录音开始、识别结束，时长，声强；行为状态信息对应的标签和对应的标签的嵌套子元素包括以下任意一种或多种：重力信息标记为重力信息标签，重力信息标签对应的嵌套子元素包括重力和时间；加速度信息标记为加速度信息标签，加速度信息标签对应的嵌套子元素包括加速度和时间；磁力信息标记为磁力信息标签，磁力信息标签对应的嵌套子元素包括磁力数据和时间；gps信息标记为gps信息标签，gps信息标签对应的嵌套子元素包括坐标数据和时间。

在采集语音信息之前，上述方法还包括：接收数据采集事件的唤醒指令，其中，在未接收到唤醒指令之前，数据获取装置中除了与唤醒事件相关的模块以外的模块均处于休眠状态；进而，根据唤醒指令唤醒数据获取装置中与该数据采集事件相关的模块，换句话说，在不工作时，与数据采集事件相关的模块处于休眠状态，从而可以降低数据获取装置的能耗，节约电能，延长使用时间。

需要说明的是，在本说明书的描述中，流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：范卫军
技术所有人：比亚迪股份有限公司
我是此专利的发明人

上一篇：一种麦克风模组的制作方法与工艺
上一篇：一种胃蛋白酶包衣片的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。