多媒体数据处理方法及系统、装置、非易失性存储介质与流程

文档序号:33399929发布日期:2023-03-08 15:57阅读:53来源:国知局
多媒体数据处理方法及系统、装置、非易失性存储介质与流程

1.本技术涉及音视频通信技术领域,具体而言,涉及一种多媒体数据处理方法及系统、装置、非易失性存储介质。


背景技术:

2.音视频系统即语音系统,视频系统。在语音的基础上可分为一对一语音,组播对讲,语音会议等。视频又分为一对一视频通话,视频会议,视频广播,视频直播等。这些音视频业务又细分为不同的功能单元。如针对视频监控,有视频录制和视频查看的功能点。针对语音通话,有通话建立和保持挂断的功能点。有的音视频系统还要求有信息的交互等功能。这些信息技术为广大用户提供了优质的体验,提升了用户的交流能力。针对音视频业务,用户可以在不同时间点进行不同功能的触发,但是这一过程没有实体对音视频数据制作流程进行保存。
3.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本技术实施例提供了一种多媒体数据处理方法及系统、装置、非易失性存储介质,以至少解决由于现有技术中基于固定模板对多媒体数据进行处理造成的处理多媒体数据的灵活度较低的技术问题。
5.根据本技术实施例的一个方面,提供了一种多媒体数据处理方法,包括:接收多媒体源数据,并确定多媒体源数据对应的多个工程文件,其中,每个工程文件至少对应一个功能单元,功能单元用于对多媒体源数据进行不同的处理方式;确定多个工程文件对应的多个功能单元中每个功能单元对应的多个子功能单元,并确定子功能单元的输入参数信息、输出参数信息和子功能单元特征信息;根据子功能单元的输入参数信息、输出参数信息和子功能单元特征信息确定子功能单元之间的关联关系;根据关联关系对子功能单元进行组合,生成组合结果。
6.可选地,根据子功能单元的输入参数信息、输出参数信息和子功能单元特征信息确定子功能单元之间的关联关系,包括:根据第一子功能单元的输入参数信息和子功能单元特征信息确定第一子功能单元的输出参数信息;将第一子功能单元的输出参数信息确定为第二子功能单元的输入参数信息,根据第二子功能单元的输入参数信息和子功能单元特征信息确定第二子功能单元的输出参数信息。
7.可选地,输入参数信息和输出参数信息的数量为一个或者多个。
8.可选地,生成组合结果之后,方法还包括:将组合结果存储为目标格式的文件。
9.可选地,根据关联关系对子功能单元进行组合,生成组合结果,包括:接收对子功能单元进行拖拽的目标指令;响应于目标指令,按照关联关系对子功能单元进行组合,生成组合结果,并在工程画板中展示组合结果。
10.可选地,功能单元包括以下至少之一:语音功能单元、对讲功能单元和视频功能单
元;在功能单元为语音功能单元的情况下,子功能单元包括以下至少之一:语音登陆单元、语音拨号单元、语音接听处理单元、语音会话过滤单元、语音通话单元和语音挂断单元。
11.根据本技术实施例的再一方面,还提供了一种多媒体数据处理系统,包括:服务器和客户端,其中,服务器包括:信令服务器、媒体服务器和状态服务器,其中,信令服务器,与媒体服务器、状态服务器和客户端连接,用于向客户端发送多媒体源数据,以及向状态服务器发送历史操作信息;媒体服务器,与信令服务器、状态服务器和客户端连接,用于录制和保存多媒体源数据;状态服务器,与信令服务器、媒体服务器和客户端连接,用于对状态服务器发送的历史操作信息进行处理,并保存处理后的历史操作信息;客户端,用于执行以上的多媒体数据处理方法。
12.根据本技术实施例的再一方面,还提供了一种非易失性存储介质,存储介质包括存储的程序,其中,程序运行时控制存储介质所在的设备执行以上的多媒体数据处理方法。
13.根据本技术实施例的再一方面,还提供了一种电子设备,包括:存储器和处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行以上的多媒体数据处理方法。
14.在本技术实施例中,采用接收多媒体源数据,并确定多媒体源数据对应的多个工程文件,其中,每个工程文件至少对应一个功能单元,功能单元用于对多媒体源数据进行不同的处理方式;确定多个工程文件对应的多个功能单元中每个功能单元对应的多个子功能单元,并确定子功能单元的输入参数信息、输出参数信息和子功能单元特征信息;根据子功能单元的输入参数信息、输出参数信息和子功能单元特征信息确定子功能单元之间的关联关系;根据关联关系对子功能单元进行组合,生成组合结果的方式,通过根据功能单元的输入参数信息、输出参数信息和功能单元信息确定功能单元之间的关联关系对功能单元进行组合,达到了自由组合功能单元的目的,从而实现了灵活处理多媒体数据的技术效果,进而解决了由于现有技术中基于固定模板对多媒体数据进行处理造成的处理多媒体数据的灵活度较低技术问题。
附图说明
15.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
16.图1是根据本技术实施例的一种多媒体数据处理方法的流程图;
17.图2是根据本技术实施例的一种多媒体数据处理系统的结构图;
18.图3是根据本技术实施例的一种多媒体数据处理装置的结构图;
19.图4是根据本技术实施例提供的一种多媒体数据处理方法的计算机终端(或电子设备)的硬件结构框图。
具体实施方式
20.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范
围。
21.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
22.根据本技术实施例,提供了一种多媒体数据处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
23.图1是根据本技术实施例的一种多媒体数据处理方法的流程图,如图1所示,该方法包括如下步骤:
24.步骤s102,接收多媒体源数据,并确定多媒体源数据对应的多个工程文件,其中,每个工程文件至少对应一个功能单元,功能单元用于对多媒体源数据进行不同的处理方式。
25.多媒体源数据包括文本、图形、图像和声音等,多媒体源数据对应多个工程文件,工程文件是保存多媒体源数据流程工程的载体,既涉及到保存,又涉及到加载,每个工程文件至少对应一个功能单元,功能单元包括以下至少之一:语音功能单元、对讲功能单元和视频功能单元。
26.步骤s104,确定多个工程文件对应的多个功能单元中每个功能单元对应的多个子功能单元,并确定子功能单元的输入参数信息、输出参数信息和子功能单元特征信息。
27.根据本技术的另一个可选的实施例,输入参数信息包括输入源和输入消息,其中,输入源用于规定功能单元的输入数据属性结构,输入消息用于针对某种异步消息做出相应动作。输出参数信息包括输出源和输出消息,其中,输出源为执行功能单元后,生成数据的结构,输出消息为针对不同功能单元执行后,生产的异步消息。子功能单元特征信息为针对不同功能单元,执行功能时所需的数据信息。
28.步骤s106,根据子功能单元的输入参数信息、输出参数信息和子功能单元特征信息确定子功能单元之间的关联关系。
29.在本技术的一些可选的实施例,功能单元分为两部分,一部分是输入和一部分是输出,有的功能单元比较复杂,可能涉及多个输入部分,上一个功能单元的输出部分可以作为下一个功能单元的输入部分。
30.步骤s108,根据关联关系对子功能单元进行组合,生成组合结果。
31.每个功能单元的输入和输出部分可以用线连接形成一个串行结构,由点连线,进而形成一个固定的多媒体数据的流程工程。
32.在一个可选的实施例中,语音功能单元包括语音登录单元、语音拨号单元、语音接听处理单元、语音会话过滤单元、语音通话单元和语音挂断单元,以下为语音功能单元的说明:
33.1.语音登录单元
34.输入源-》账号对象(包括,账号,密码,服务器地址等信息);
35.输出源-》语音账号对象(包括账号,密码,语音服务连接状态);
36.输出消息(来电)-》接收其他用户呼叫的事件,携带会话对象;
37.输出消息(会话建立)-》携带会话对象。
38.2.语音拨号单元
39.输入消息-》语音登录成功消息;
40.输入源-》语音账号对象(包括账号,密码,语音服务连接状态);
41.单元信息-》呼叫号码;
42.输出源-》会话id,对端号码等信息;
43.输出消息(接听)-》会话建立,携带会话对象信息;
44.输出消息(拒接)-》呼叫号码拒接事件。
45.3.语音接听处理单元
46.输入消息-》来电消息,携带会话id,会话信息
47.单元信息-》是否接听
48.4.语音会话过滤单元
49.4.1会话id过滤器;
50.输入消息-》会话建立消息;
51.输入源-》会话id;
52.输出消息-》会话建立消息(根据会话id进行过滤)。
53.4.2对端号码过滤器
54.输入消息-》会话建立消息;
55.单元信息-》对端号码;
56.输出消息-》会话建立消息(根据对端号码进行过滤)。
57.5.语音通话单元
58.输入消息-》会话建立消息;
59.单元信息-》讲话设备信息设置:
60.5.1媒体文件位置;
61.5.2语音采集设备(麦克风信息);
62.听讲信息设置:
63.5.3保存为语音文件;
64.5.4语音播放设备(扬声器信息);
65.输出源-》语音会话对象(会话id,会话状态,对端号码,本端号码);
66.输出消息(通话结束)-》对端挂断语音,通话结束。
67.6.语音挂断单元
68.输入源-》语音会话对象(会话状态);
69.输出消息(通话结束)-》通话结束,对端接收到挂断请求;
70.输出消息(挂断失败)-》对端没有接收到挂断请求。
71.根据上述步骤,通过根据功能单元的输入参数信息、输出参数信息和功能单元信
息确定功能单元之间的关联关系,根据关联关系对功能单元进行组合,达到了自由组合功能单元的目的,从而实现了灵活处理多媒体数据的技术效果。
72.根据本技术的一个可选的实施例,根据子功能单元的输入参数信息、输出参数信息和子功能单元特征信息确定子功能单元之间的关联关系,包括以下步骤:根据第一子功能单元的输入参数信息和子功能单元特征信息确定第一子功能单元的输出参数信息;将第一子功能单元的输出参数信息确定为第二子功能单元的输入参数信息,根据第二子功能单元的输入参数信息和子功能单元特征信息确定第二子功能单元的输出参数信息。
73.在本技术的一些可选的实施例,输入参数信息和输出参数信息的数量为一个或者多个。
74.功能单元分为两部分,一部分是输入和一部分是输出,有的功能单元比较复杂,可能涉及多个输入部分,上一个功能单元的输出部分可以作为下一个功能单元的输入部分,每个功能单元的输入和输出部分可以用线连接形成一个串行结构,由点连线,形成一个固定的音视频流程工程。
75.在本技术的一些可选的实施例中,生成组合结果之后,还需要:将组合结果存储为目标格式的文件。
76.本实施例使用可扩展标记语言(extensible markup language,xml)进行工程文件的保存,xml是可扩展标记语言,能够有效的描述工程中各个功能单元的定义,以及描述各个功能单元连接线。可扩展标记语言为标准通用标记语言的子集,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。xml是标准通用标记语言可扩展性良好,内容与形式分离,遵循严格的语法要求,保值性良好等优点。在计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。
77.在一个可选的实施例中,根据关联关系对子功能单元进行组合,生成组合结果,可以通过以下方法实现:接收对子功能单元进行拖拽的目标指令;响应于目标指令,按照关联关系对子功能单元进行组合,生成组合结果,并在工程画板中展示组合结果。
78.根据本技术的另一个可选的实施例,功能单元包括以下至少之一:语音功能单元、对讲功能单元和视频功能单元;在功能单元为语音功能单元的情况下,子功能单元包括以下至少之一:语音登陆单元、语音拨号单元、语音接听处理单元、语音会话过滤单元、语音通话单元和语音挂断单元。
79.现有的音视频系统的音视频流程发起,是通过用户手动操作进行。本技术实现了流程过程的抽象,能够把音视频系统中的功能流程制作为工程文件。从而实现音视频流程的实例化存储。针对存储的工程文件可实现流程的快速触发,应用于应急预案,音视频系统中。
80.图2是根据本技术实施例的一种多媒体数据处理系统的结构图,如图2所示,该系统包括:服务器202和客户端204,其中,
81.服务器202包括:信令服务器2021、媒体服务器2022和状态服务器2023,其中,
82.信令服务器2021,与媒体服务器2022、状态服务器2023和客户端204连接,用于向客户端204发送多媒体源数据,以及向状态服务器2023发送历史操作信息;
83.媒体服务器2022,与信令服务器2021、状态服务器2023和客户端204连接,用于录制和保存多媒体源数据;
84.状态服务器2023,与信令服务器2021、媒体服务器2022和客户端204连接,用于对状态服务器2023发送的历史操作信息进行处理,并保存处理后的历史操作信息;
85.客户端204,用于执行多媒体数据处理方法。
86.根据本技术的一个可选的实施例,客户端包括移动终端客户端、计算机工程编辑器和计算机控制台,其中,移动终端客户端,与信令服务器、媒体服务器和状态服务器交互,用于生成多媒体源数据;计算机工程编辑器,与信令服务器、媒体服务器和状态服务器交互,用于处理多媒体源数据对应的多个功能单元,生成和展示处理结果;计算机控制台,与信令服务器、媒体服务器和状态服务器交互,用于加载和展示处理结果。
87.计算机控制台为pc端的客户端,计算机控制台可以加载工程编辑器制作的工程文件,可以与服务器进行交互,进行语音,视频,信息,工单,对讲,位置信息查看等功能的展现。
88.工程编辑器与软件开发工具包连接,其中,软件开发工具包封装了基础功能的实现,支持语音,对讲,视频,信息等功能。封装后的基础功能模块可以被工程编辑器,计算机控制台等客户端加载使用。工程编辑器把功能单元进行ui的封装,抽象出输入参数信息、输出参数信息和子功能单元特征信息等,并并把功能单元实现的功能以可视化ui单元的形式,展示在工具箱中。工程编辑器接收对子功能单元进行拖拽的目标指令,响应于目标指令,按照关联关系对子功能单元进行组合,生成组合结果,并在工程画板中展示组合结果。
89.图3是根据本技术实施例的一种多媒体数据处理装置的结构图,如图3所示,该装置包括:
90.第一确定模块30,用于接收多媒体源数据,并确定多媒体源数据对应的多个工程文件,其中,每个工程文件至少对应一个功能单元,功能单元用于对多媒体源数据进行不同的处理方式;
91.第二确定模块32,用于确定多个工程文件对应的多个功能单元中每个功能单元对应的多个子功能单元,并确定子功能单元的输入参数信息、输出参数信息和子功能单元特征信息;
92.第三确定模块34,用于根据子功能单元的输入参数信息、输出参数信息和子功能单元特征信息确定子功能单元之间的关联关系;
93.组合模块36,用于根据关联关系对子功能单元进行组合,生成组合结果。
94.需要说明的是,上述图3中的各个模块可以是程序模块(例如是实现某种特定功能的程序指令集合),也可以是硬件模块,对于后者,其可以表现为以下形式,但不限于此:上述各个模块的表现形式均为一个处理器,或者,上述各个模块的功能通过一个处理器实现。
95.图4示出了一种用于实现多媒体数据处理方法的计算机终端(或移动设备)的硬件结构框图。如图4所示,计算机终端40(或移动设备40)可以包括一个或多个(图中采用402a、402b,
……
,402n来示出)处理器402(处理器402可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器404、以及用于通信功能的传输模块406。除此以外,还可以包括:显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为bus总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技
术人员可以理解,图4所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端40还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。
96.应当注意到的是上述一个或多个处理器402和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端40(或移动设备)中的其他元件中的任意一个内。如本技术实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
97.存储器404可用于存储应用软件的软件程序以及模块,如本技术实施例中的多媒体数据处理方法对应的程序指令/数据存储装置,处理器402通过运行存储在存储器404内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的多媒体数据处理方法。存储器404可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器404可进一步包括相对于处理器402远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端40。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
98.传输模块406用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端40的通信供应商提供的无线网络。在一个实例中,传输模块406包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块406可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
99.显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与计算机终端40(或移动设备)的用户界面进行交互。
100.此处需要说明的是,在一些可选实施例中,上述图4所示的计算机设备(或电子设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图4仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或电子设备)中的部件的类型。
101.需要说明的是,图4所示的电子设备用于执行图1所示的多媒体数据处理方法,因此上述命令的执行方法中的相关解释说明也适用于该电子设备,此处不再赘述。
102.本技术实施例还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,程序运行时控制存储介质所在的设备执行以上的多媒体数据处理方法。
103.非易失性存储介质执行以下功能的程序:接收多媒体源数据,并确定多媒体源数据对应的多个工程文件,其中,每个工程文件至少对应一个功能单元,功能单元用于对多媒体源数据进行不同的处理方式;确定多个工程文件对应的多个功能单元中每个功能单元对应的多个子功能单元,并确定子功能单元的输入参数信息、输出参数信息和子功能单元特征信息;根据子功能单元的输入参数信息、输出参数信息和子功能单元特征信息确定子功能单元之间的关联关系;根据关联关系对子功能单元进行组合,生成组合结果。
104.本技术实施例还提供了一种电子设备,包括:存储器和处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行以上的多媒体数据处理方法。
105.处理器用于运行执行以下功能的程序:接收多媒体源数据,并确定多媒体源数据
对应的多个工程文件,其中,每个工程文件至少对应一个功能单元,功能单元用于对多媒体源数据进行不同的处理方式;确定多个工程文件对应的多个功能单元中每个功能单元对应的多个子功能单元,并确定子功能单元的输入参数信息、输出参数信息和子功能单元特征信息;根据子功能单元的输入参数信息、输出参数信息和子功能单元特征信息确定子功能单元之间的关联关系;根据关联关系对子功能单元进行组合,生成组合结果。
106.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
107.在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
108.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
109.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
110.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
111.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
112.以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1