直播用数据处理方法及装置与流程

文档序号：31704242发布日期：2022-10-01 10:06阅读：122来源：国知局

1.本公开涉及数据处理技术领域，具体涉及到一种直播用处理方法及装置。

背景技术：

2.相关技术中，直播过程中直播员通常需要对用户的提问进行回答，而该问题通常是大量的、问题的种类也非常多，仅依靠主播的知识进行答复的方式，受限于主播的知识量，存在问题无法被答复的问题，以及答复效率低的问题。

技术实现要素：

3.本公开的主要目的在于提供一种直播用数据处理方法及装置。
4.为了实现上述目的，根据本公开的第一方面，提供了一种直播用数据处理方法，包括：在获取到直播平台中直播视频的视频流后，确定视频流中的各个被直播对象，以确定各个被直播对象所对应的子知识库；对视频流进行画面截取，并对截取的画面进行文本识别，以提取识别的文本中的问题段；基于问题段指示的被直播对象切换子知识库，以从子知识库中确定所述问题段对应的答案。
5.可选地，在提取所述问题段后，所述方法还包括：当接收到用于确定目标问题的触发请求后，对输入的语音信息进行语义识别，确定语音信息指示的目标问题段；从目标问题段所对应的子知识库中，确定所述问题段对应的答案。
6.可选地，方法还包括：当接收到用于确定目标问题的触发请求后，接收问题段中被选中的目标问题段；从目标问题段所对应的子知识库中，确定所述目标问题段对应的答案。
7.可选地，方法还包括：如果从子知识库中无法确定问题段对应的答案，则从公共知识库中确定所述问题段对应的答案；和/或，如果所述公共知识库中无法确定所述问题段对应的答案，将与问题段相关度最高的前n位作为结果。
8.可选地，所述方法还包括：接收输入的与所述问题段匹配的答案，基于所述问题段、与匹配的答案更新相应的子知识库中。
9.可选地，方法还包括：基于问题段、以及公共知识库确定的答案，更新子知识库。
10.可选地于，所述方法还包括：基于输入的问答对文本，更新子知识库。
11.根据本公开的第二方面，提供了一种直播用数据处理装置，包括：子知识库建立单元，被配置成在获取到直播平台中直播视频的视频流后，确定视频流中的各个被直播对象，以确定各个被直播对象所对应的子知识库；文本提取单元，被配置成对视频流进行画面截取，并对截取的画面进行文本识别，以提取识别的文本中的问题段；答案确定单元，被配置成基于问题段指示的被直播对象切换子知识库，以从子知识库中确定所述问题段对应的答案。
12.根据本公开的第三方面，提供了一种计算机可读存储介质，存储有计算机指令，所述计算机指令用于使所述计算机执行第一方面任意一项实现方式所述的直播用数据处理方法。
13.根据本公开的第四方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器执行第一方面任意一项实现方式所述的直播用数据处理方法。
14.在本公开实施例直播用数据处理方法及装置中，包括：在获取到直播平台中直播视频的视频流后，确定视频流中的各个被直播对象，以确定各个被直播对象所对应的子知识库；对视频流进行画面截取，并对截取的画面进行文本识别，以提取识别的文本中的问题段；基于问题段指示的被直播对象切换子知识库，以从子知识库中确定所述问题段对应的答案。通过实现实时直播中问题的自动化回复，提高了答复效率；同时通过实现子知识库的切换，提高了问题与答案的匹配度；进而解决了相关技术中无法自动确定直播过程中问题的答案，且答案与问题匹配度不高的问题。
附图说明
15.为了更清楚地说明本公开具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
16.图1是根据本公开实施例的直播用数据处理方法流程图；
17.图2是根据本公开实施例的直播用数据处理方法应用示意图；
18.图3是根据本公开实施例的电子设备的示意图。
具体实施方式
19.为了使本技术领域的人员更好地理解本公开方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。
20.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
21.需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
22.实现本方法的执行主体可以是一个独立的直播机，通过该直播机可以与直播平台的服务器进行交互，实现通过该直播机在直播平台上进行直播，该直播机可以与数据库建立通信连接，具体地，可以与多个子知识库之间进行连接，也可以从公共知识库，如云数据库建立连接。通过本实施的直播机可以实现知识库之间连接的切换，该直播机还可以具有
语音输入设备，以接收输入的语音信号，该直播机还可以与输入设备连接，实现文字的输入。
23.根据本公开实施例，提供了一种直播用数据处理方法，如图1所示，该方法包括如下的步骤101至步骤103：
24.步骤101：在获取到直播平台中直播视频的视频流后，确定视频流中的各个被直播对象，以确定各个被直播对象所对应的子知识库。
25.在本实施例中，直播平台可以是用于实现实时直播的系统，直播平台的种类可以是多样的，在此不做限定。直播用户可以通过直播平台进行直播，得到视频流。由于直播视频可以是对所推广的对象(如产品)进行讲解，而本实施例可以针对各个被直播过程推广的对象建立子知识库，即私有知识库。
26.步骤102：对视频流进行画面截取，并对截取的画面进行文本识别，以提取识别的文本中的问题段。
27.在本实施例中，可以自动地对视频流中的画面进行截取，在截取画面后可以通过ocr对画面中的文本进行识别，并对识别后进行文本提取，确定问题段。参考图2，图2中，观看直播的用户可以在直播过程中进行提问，提问方式可以是文字输入的方式，而后问题可以呈现在直播平台的视频画面中，通过屏幕画面截取以及通过ocr识别的方式进行文字选取以确定问题段。
28.步骤103：基于问题段指示的被直播对象切换子知识库，以从子知识库中确定所述问题段对应的答案。
29.在本实施例中，由于每个问题段是针对一个被推广对象提出的，而每个被推广对象相关的知识可以存储在子知识库中，因此在确定问题段后，进行子知识库的切换，在切换时可以是自动切换的方式，也可以是直播人员通过交互界面触发切换组件，进行子知识库的切换。在确定子知识库后，从该子知识库中检索答案，并将答案通过交互界面展示给直播人员。
30.进一步地，在实现自动切换方式时，可以是基于问题段中可用于表明被推广对象的关键词确定对应的子知识库。然而该方式所获得的答案，其与问题相关度不能完全100％准确，因此本实施例优选是通过人工动态切换的方式实现。直播人员在直播过程中，对于任一问题可以通过交互界面中的切换控件实现子知识库之间的切换，通过该方式实现了实施、准确、快速的知识库切换，从而能够保证问题与答案完全匹配。
31.本实施例中，通过设置子知识库，每个被推广的对象相关的知识可对应一个子知识库，通过实现动态切换子知识库确定问题的答案，能够保证问题与答案的匹配度，并且提高答案的生成效率。
32.作为本实施例一种可选的实现方式，方法还包括：当接收到用于确定目标问题的触发请求后，对输入的语音信息进行语义识别，确定语音信息指示的目标问题段；从目标问题段所对应的子知识库中，确定所述问题段对应的答案。
33.在本可选的实现方式中，当语音输入条件被触发后，可以接收通过语音输入的方式录入的目标问题段，而后基于该问题段在子知识库中进行答案检索。
34.示例性地，参考图2，通过点击输入或者特定语音唤醒词，进入问题录入模式，直播人员可以通过录入自己的语音信号，将用户的问题以语音的形式录入，在接收到录入语音
后进行语义识别，确定目标问题段。基于该目标问题段可以从其子知识库中确定答案。
35.作为本实施例一种可选的实现方式，方法还包括：当接收到用于确定目标问题的触发请求后，接收问题段中被选中的目标问题段；从目标问题段所对应的子知识库中，确定所述目标问题段对应的答案。
36.在本可选的实现方式中，直播人员可以通过点击文字串的方式实现问题的输入，并在接收到该输入后，在相应的子知识库中确定答案。
37.作为本实施例一种可选的实现方式，方法还包括：如果从子知识库中无法确定问题段对应的答案，则从公共知识库中确定所述问题段对应的答案；和/或，如果所述公共知识库中无法确定所述问题段对应的答案，将与问题段相关度最高的前n位作为结果。
38.在本可选的实现方式中，如果子知识库没有相关答案，那么从公共知识库中检索，检索到答案后更新子知识库。如果公共知识库也无法确定答案时，输出相关度比较高的答案，并以相关度进行排序，向直播人员展示，由直播人员确定。
39.本可选的实现方式通过知识库分组分层(分多个子知识库、以及公共知识库)，进而提高问题与答案相关度，并且能够防止答案混乱。
40.进一步地，由于直播过程中，问题的种类是繁多的，而大多问题可以作为知识库的更新基础，因此本实施例的子数据库可以动态更新。作为本实施例一种可选的实现方式，方法还包括：接收输入的与所述问题段匹配的答案，基于所述问题段、与匹配的答案更新相应的子知识库中。
41.在本可选的实现方式中，子知识库可以被更新，参考图2，操作人员可以实时根据用户的提问输入问题的答案，问题段和输入的答案可以直接更新至相应的子数据库中，同时也可以直接通过交互界面展示，以使直播人员进行查看。进一步地，该更新步骤也可以是在子知识库中无法检索到匹配答案后，可以接收操作人员的输入的答案。本实施例不对输入的时间做限定。
42.进一步地，参考图2，直播人员可以直接录入或者语音输入答案，并将答案作为知识更新至子知识库中。
43.作为本实施例一种可选的实现方式，方法还包括：基于问题段、以及公共知识库确定的答案，更新子知识库。
44.在本可选的实现方式中，当子知识库无法确定问题段对应的答案后，且在公共知识库确定答案后，可以将公共知识库确定的答案与相应的问题段进行对应存储，实现子知识库知识的更新。
45.作为本实施例一种可选的实现方式，所述方法还包括：基于输入的问答对文本，更新子知识库。
46.在本可选的实现方式中，在子知识库更新时，还可以通过直接输入问答对的方式实现，参考图2，图2中输入问答文本和对话文本，并基于nlp算法处理后将问答对存储至私有直播知识库，实现子知识库的更新。
47.进一步地，操作人员也可以对问题和答案编辑后，直接录入子知识库实现更新，提高子知识库的知识量。
48.通过自然语言处理nlp算法，把已有的问答文本作为材料，也可以生成私有直播知识库的部分知识。通过该方式可快速扩充子知识库的知识，进而能够基于实时提出的问题
检索出更匹配的答案，提高了匹配率。
49.本实施例通过实现实时直播中问题的自动化回复，提高了答复效率；同时通过实现子知识库的切换，提高了问题与答案的匹配度；进而解决了相关技术中无法自动确定直播过程中问题的答案，且答案与问题匹配度不高的问题。通过多种方式实现子知识库的更新，能够保证各个知识库中的知识储备量，从而有助于进一步提升问题与答案的相关度。
50.本实施例基于语音识别技术、语义理解技术、光学字符识别技术和自适应搜索技术，对直播知识库进行动态更新，从而对直播过程中的问题回答提供灵活的辅助。方案支持动态更新直播知识库，知识库分组分层(分多个私有直播知识库、公共知识库)提高相关度的准确性，通过灵活交互模式辅助直播人员快速找到答案。
51.需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。
52.根据本公开实施例，还提供了一种用于实施上述直播用数据处理方法的装置，该装置包括：子知识库建立单元，被配置成在获取到直播平台中直播视频的视频流后，确定视频流中的各个被直播对象，以确定各个被直播对象所对应的子知识库；文本提取单元，被配置成对视频流进行画面截取，并对截取的画面进行文本识别，以提取识别的文本中的问题段；答案确定单元，被配置成基于问题段指示的被直播对象切换子知识库，以从子知识库中确定所述问题段对应的答案。
53.作为本实施例一种可选的实现方式，在提取所述问题段后，所述方法还包括：当接收到用于确定目标问题的触发请求后，对输入的语音信息进行语义识别，确定语音信息指示的目标问题段；从目标问题段所对应的子知识库中，确定所述问题段对应的答案。
54.作为本实施例一种可选的实现方式，在提取所述问题段后，所述方法还包括：当接收到用于确定目标问题的触发请求后，接收问题段中被选中的目标问题段；从目标问题段所对应的子知识库中，确定所述目标问题段对应的答案。
55.作为本实施例一种可选的实现方式，装置还包括：如果从子知识库中无法确定问题段对应的答案，则从公共知识库中确定所述问题段对应的答案；和/或，如果所述公共知识库中无法确定所述问题段对应的答案，将与问题段相关度最高的前n位作为结果。
56.作为本实施例一种可选的实现方式，装置还包括：接收输入的与所述问题段匹配的答案，基于所述问题段、与匹配的答案更新相应的子知识库中。
57.作为本实施例一种可选的实现方式，装置还包括：基于问题段、以及公共知识库确定的答案，更新子知识库。
58.作为本实施例一种可选的实现方式，装置还包括：基于输入的问答对文本，更新子知识库。
59.本实施例通过实现实时直播中问题的自动化回复，提高了答复效率；同时通过实现子知识库的切换，提高了问题与答案的匹配度；进而解决了相关技术中无法自动确定直播过程中问题的答案，且答案与问题匹配度不高的问题。通过多种方式实现子知识库的更新，能够保证各个知识库中的知识储备量，从而有助于进一步提升问题与答案的相关度。
60.本公开实施例提供了一种电子设备，如图3所示，该电子设备包括一个或多个处理器31以及存储器32，图3中以一个处理器31为例。
61.该控制器还可以包括：输入装置33和输出装置34。
62.处理器31、存储器32、输入装置33和输出装置34可以通过总线或者其他方式连接，图3中以通过总线连接为例。
63.处理器31可以为中央处理器(centralprocessingunit，cpu)。处理器31还可以为其他通用处理器、数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现场可编程门阵列(field-programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
64.存储器32作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本公开实施例中的控制方法对应的程序指令/模块。处理器31通过运行存储在存储器32中的非暂态软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例的直播用数据处理方法。
65.存储器32可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外，存储器32可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器32可选包括相对于处理器31远程设置的存储器，这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
66.输入装置33可接收输入的数字或字符信息，以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置34可包括显示屏等显示设备。
67.一个或者多个模块存储在存储器32中，当被一个或者多个处理器31执行时，执行如图1所示的方法。
68.本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各电机控制方法的实施例的流程。其中，存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory，rom)、随机存储记忆体(randomaccessmemory，ram)、快闪存储器(flashmemory)、硬盘(harddiskdrive，缩写：hdd)或固态硬盘(solid-statedrive，ssd)等；存储介质还可以包括上述种类的存储器的组合。
69.虽然结合附图描述了本公开的实施方式，但是本领域技术人员可以在不脱离本公开的精神和范围的情况下作出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高栈年陈涛万凯辉赵文阳
技术所有人：苏州萝卜电子科技有限公司
我是此专利的发明人

上一篇：RocketMQ监控方法及装置、存储介质及电子设备与流程
上一篇：一种农业种植用深入式施肥箱的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。