一种文字信息的语音转换方法、装置、存储介质及设备与流程

文档序号:33550439发布日期:2023-03-22 10:35阅读:52来源:国知局
一种文字信息的语音转换方法、装置、存储介质及设备与流程

1.本技术涉及信息处理领域,尤其涉及一种文字信息的语音转换方法、装置、存储介质及设备。


背景技术:

2.随着监控技术已经广泛使用,大多数家庭都配备监控摄像头以及时查看家人(例如老人、小孩等)的现状。
3.目前,监控技术通过语音控制台进行语音输入,远端摄像头进行语音输出的方式,达到传递消息的目的,由于语音输入对周围环境具有要求,当环境嘈杂时,语音收听效果不佳,导致传递的消息可能存在误差。
4.因此,如何提升传递消息的准确率,成为本领域亟需解决的问题。


技术实现要素:

5.本技术提供了一种文字信息的语音转换方法、装置、存储介质及设备,目的在于提升传递消息的准确率。
6.为了实现上述目的,本技术提供了以下技术方案:
7.一种文字信息的语音转换方法,应用于云服务端,包括:
8.当接收到控制台发送的文字信息、发送方信息以及接收方信息时,从所述接收方信息中获取摄像头的标识;所述发送方信息至少包括控制台的标识;
9.从数据库中获取与所述控制台的标识对应的摄像头的标识,并标记为目标摄像头的标识;所述数据库预先存储目标关联关系信息;所述目标关联关系信息指示控制台、摄像头以及语音类型之间的关联关系;所述目标关联关系信息至少包括所述控制台的标识、摄像头的标识、语音类型的标识;
10.当所述目标摄像头的标识与所述摄像头的标识一致时,从语音数据库中,获取与所述摄像头的标识、且与所述控制台的标识对应的语音类型的标识;
11.从语音类型库中获取与所述语音类型的标识对应的语音类型,并标识为目标语音类型;
12.根据所述目标语音类型对所述文字信息进行转换,得到语音数据;
13.调用第三接口将所述语音数据发送至摄像头,以使所述摄像头播放所述语音数据。
14.可选的,预先将目标关联关系信息存储至数据库的过程,包括:
15.当接收到所述控制台发送的目标关联关系信息时,将所述目标关联关系信息存储至所述数据库中;所述目标关联关系信息为所述控制台语音类型添加至关联关系信息中得到;所述关联关系信息为所述控制台通过预设信息与摄像头建立关联关系得到。
16.可选的,所述从数据库中获取与所述控制台的标识对应的摄像头的标识,并标记为目标摄像头的标识之后,还包括:
17.当所述目标摄像头的标识与所述摄像头的标识不一致时,向所述控制台发送所述文字信息转换失败的提示信息,以使所述控制台通过预设界面向用户展示所述文字信息转换失败的提示信息。
18.可选的,还包括:
19.调用第二接口将所述语音数据发送至所述控制台,以使所述控制台通过预设界面向用户展示所述文字信息和所述语音数据。
20.一种文字信息的语音转换装置,包括:
21.第一获取单元,用于当接收到控制台发送的文字信息、发送方信息以及接收方信息时,从所述接收方信息中获取摄像头的标识;所述发送方信息至少包括控制台的标识;
22.标记单元,用于从数据库中获取与所述控制台的标识对应的摄像头的标识,并标记为目标摄像头的标识;所述数据库预先存储目标关联关系信息;所述目标关联关系信息指示控制台、摄像头以及语音类型之间的关联关系;所述目标关联关系信息至少包括所述控制台的标识、摄像头的标识、语音类型的标识;
23.第二获取单元,用于当所述目标摄像头的标识与所述摄像头的标识一致时,从语音数据库中,获取与所述摄像头的标识、且与所述控制台的标识对应的语音类型的标识;
24.第三获取单元,用于从语音类型库中获取与所述语音类型的标识对应的语音类型,并标识为目标语音类型;
25.转换单元,用于根据所述目标语音类型对所述文字信息进行转换,得到语音数据;
26.发送单元,用于调用第三接口将所述语音数据发送至摄像头,以使所述摄像头播放所述语音数据。
27.可选的,标记单元具体用于:
28.当接收到所述控制台发送的目标关联关系信息时,将所述目标关联关系信息存储至所述数据库中;所述目标关联关系信息为所述控制台语音类型添加至关联关系信息中得到;所述关联关系信息为所述控制台通过预设信息与摄像头建立关联关系得到。
29.可选的,还包括:
30.当所述目标摄像头的标识与所述摄像头的标识不一致时,向所述控制台发送所述文字信息转换失败的提示信息,以使所述控制台通过预设界面向用户展示所述文字信息转换失败的提示信息。
31.可选的,还包括:
32.调用第二接口将所述语音数据发送至所述控制台,以使所述控制台通过预设界面向用户展示所述文字信息和所述语音数据。
33.一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,所述程序被处理器运行时执行所述的文字信息的语音转换方法。
34.一种文字信息的语音转换设备,包括:处理器、存储器和总线;所述处理器与所述存储器通过所述总线连接;
35.所述存储器用于存储程序,所述处理器用于运行程序,其中,所述程序被处理器运行时执行所述的文字信息的语音转换方法。
36.本技术提供的技术方案,接收到控制台发送的文字信息、发送方信息、接收方信息时,从接收方信息中获取摄像头的标识;从数据库获取与控制台的标识对应的摄像头的标
识,标记为目标摄像头的标识;当目标摄像头的标识与摄像头的标识一致时,从数据库中获取与摄像头的标识、且与控制台的标识对应的语音类型的标识;从语音类型库获取与语音类型的标识对应的语音类型,并标识为目标语音类型;根据目标语音类型对文字信息进行转换,得到语音数据;调用第三接口将语音数据发送至摄像头,以使摄像头播放语音数据,与现有技术相比,用户输入的是文字信息,不存在周围环境的干扰,因此,提升了传递消息的准确率。
附图说明
37.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
38.图1a为本技术实施例提供的一种文字转换语音平台的架构示意图;
39.图1b为本技术实施例提供的一种文字信息的语音转换方法的交互流程示意图;
40.图2为本技术实施例提供的一种文字信息的语音转换方法的流程图;
41.图3为本技术实施例提供的一种文字信息的语音转换装置的架构示意图。
具体实施方式
42.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
43.如图1a所示,为本技术实施例提供的一种文字转换语音平台的架构示意图,包括:
44.控制台100、云服务端200以及摄像头300,其中,控制台100、云服务端200以及摄像头300之间的信息交互过程,如图1b所示,包括如下步骤:
45.s101:控制台通过预设信息与摄像头建立关联关系,得到关联关系信息。
46.其中,关联关系信息至少包括控制台的标识、摄像头的标识,预设信息包括但不限于为:设备号、网络。
47.需要说明的是,控制台通过预设信息与摄像头建立关联关系的具体实现方式,为本领域人员公知的常识,这里不再赘述。
48.s102:当接收到用户发送的建立信息时,控制台将语音类型添加至关联关系信息中,得到目标关联关系信息。
49.其中,建立信息至少包括语音类型,建立信息指示控制台、摄像头以及语音类型建立关联关系的信息,语音类型包括但不限于为:新闻主播类、动画人物类,目标关联关系信息至少包括语音类型的标识。
50.具体的,假设控制台包括控制台1、控制台2、摄像头包括摄像头1、摄像头2、语音类型包括语音类型1、语音类型2,当接收到用户发送的建立信息时,控制台将语音类型添加至关联关系信息,得到的目标关联关系信息如表1所示。
51.表1
52.控制台标识摄像头标识语音类型控制台1摄像头2语音类型1控制台2摄像头1语音类型2
53.需要说明的是,上述表1所示的内容仅仅用于举例说明。
54.s103:控制台将目标关联关系信息发送至云服务端。
55.需要说明的是,控制台在设置摄像头的语音类型后,建立语音类型、控制台以及摄像头的关联关系,调用云服务端接口a将语音类型、控制台以及摄像头的关联关系发送给云服务端。
56.s104:在接收到目标关联关系信息后,云服务端将目标关联关系信息存储至数据库中。
57.需要说明的是,当接收到控制台发送的目标关联关系信息后,云服务端将关联关系信息存储至数据库中,以便后续获取摄像头与控制台之间的关系(即控制台与摄像头具有关联关系、控制台与摄像头不具有关联关系)。
58.s105:当接收到用户输入的文字信息时,控制台调用第一接口将文字信息、发送方信息以及接收方信息发送至云服务端。
59.其中,发送方信息至少包括控制台的标识,第一接口指示云服务端接口b,发送方信息包括但不限于为:sendfrom,接收方信息包括但不限于为:sendto。
60.需要说明的是,控制台调用第一接口将文字信息、发送方信息以及接收方信息发送至云服务端,为后续转换成语音数据提供数据。
61.s106:在接收到文字信息、发送方信息以及接收方信息后,云服务端从接收方信息中获取摄像头的标识。
62.需要说明的是,云服务端从接收方信息获取摄像头的标识,以便后续对接收方信息(即摄像头)进行校验,进而确认摄像头和控制台是否具有关联关系。
63.s107:云服务端从数据库中获取与控制台的标识对应的摄像头的标识,并标记为目标摄像头的标识。
64.s108:云服务端判断目标摄像头的标识与摄像头的标识是否一致。
65.若目标摄像头的标识与摄像头的标识一致,则执行s109,否则执行s110。
66.具体的,假设目标摄像头的标识为1001-001,摄像头的标识为1001-001,云服务端判断目标摄像头的标识1001-001与摄像头的标识1001-001是否一致,显然目标摄像头的标识1001-001与摄像头的标识1001-001一致,为此,继续执行s109。
67.具体的,假设目标摄像头的标识为1001-002,摄像头的标识为1001-001,云服务端判断目标摄像头的标识1001-002与摄像头的标识1001-001是否一致,显然,目标摄像头的标识1001-002与摄像头的标识1001-001不一致,为此,继续执行s110。
68.s109:云服务端从数据库中,获取与摄像头的标识、且与控制台的标识对应的语音类型的标识。
69.执行s109之后,继续执行s112。
70.s110:云服务端向控制台发送文字信息转换失败的提示信息。
71.需要说明的是,当目标摄像头的标识与摄像头的标识不一致时,说明信息传输过程中可能出现问题,导致后续语音数据发送至与控制台不具有对应关系的摄像头,因此,为
了规避这种问题,云服务端需要向控制台发送文字信息转换失败的提示信息。
72.s111:当接收到文字信息转换失败的提示信息后,控制台通过预设界面向用户展示文字信息转换失败的提示信息。
73.s112:云服务端从语音类型库中获取与语音类型的标识对应的语音类型,并标识为目标语音类型。
74.s113:云服务端根据目标语音类型对文字信息进行转换,得到语音数据。
75.其中,利用文语转换技术(即tts技术),根据目标语音类型对文字信息进行转换。
76.需要说明的是,利用文语转换技术,根据目标语音类型对文字信息进行转换的具体实现方式,为本领域人员公知的常识,这里不再赘述。
77.具体的,假设目标语音类型为新闻主播类,云服务端根据目标语音类型对文字信息进行转换,得到的语音数据为新闻主播类型的语音数据。
78.需要说明的是,根据目标语音类型对文字信息进行转换,得到的语音数据能够更好的适应各类人群(例如老人喜欢新闻主播类,小孩喜欢动画人物类),增加了趣味性以及互动多元性。
79.s114:云服务端调用第二接口,将语音数据发送至控制台。
80.其中,第二接口指示云服务端接口c。
81.s115:在接收到语音数据后,控制台通过预设界面向用户展示文字信息和语音数据。
82.需要说明的是,控制台通过预设界面向用户展示文字信息和语音数据,用户能够查看到自身所发送的文字信息,以及语音数据,用户可以通过播放语音数据检查语音数据所表达的内容,是否与文字信息所示的内容一致,从而确认信息是否传递成功。
83.s116:云服务端调用第三接口,将语音数据发送至摄像头。
84.其中,第三接口指示云服务端接口d。
85.s117:在接收到语音数据后,摄像头通过预设方式播放语音数据。
86.其中,预设方式为摄像头的音箱。
87.综上所述,当目标摄像头的标识与摄像头的标识一致时,云服务端从数据库中,获取与摄像头的标识、且与控制台的标识对应的语音类型的标识,云服务端从语音类型库中获取与语音类型的标识对应的语音类型,并标识为目标语音类型,云服务端根据目标语音类型对文字信息进行转换,得到语音数据,云服务端调用第三接口,将语音数据发送至摄像头,在接收到语音数据后,摄像头通过预设方式播放语音数据,与现有技术相比,用户输入的是文字信息,不存在周围环境的干扰,因此,提升了传递消息的准确率。
88.如图2所示,为本技术实施例提供的一种文字信息的语音转换方法的流程图,包括:
89.s201:当接收到控制台发送的文字信息、发送方信息以及接收方信息时,从接收方信息中获取摄像头的标识。
90.其中,发送方信息至少包括控制台的标识。
91.s202:从数据库中获取与控制台的标识对应的摄像头的标识,并标记为目标摄像头的标识。
92.其中,数据库预先存储目标关联关系信息;目标关联关系信息指示控制台、摄像头
以及语音类型之间的关联关系;目标关联关系信息至少包括控制台的标识、摄像头的标识、语音类型的标识。
93.s203:当目标摄像头的标识与摄像头的标识一致时,从语音数据库中,获取与摄像头的标识、且与控制台的标识对应的语音类型的标识。
94.s204:从语音类型库中获取与语音类型的标识对应的语音类型,并标识为目标语音类型。
95.s205:根据目标语音类型对文字信息进行转换,得到语音数据。
96.s206:调用第三接口将语音数据发送至摄像头,以使摄像头播放语音数据。
97.综上所述,当目标摄像头的标识与摄像头的标识一致时,云服务端从数据库中,获取与摄像头的标识、且与控制台的标识对应的语音类型的标识,云服务端从语音类型库中获取与语音类型的标识对应的语音类型,并标识为目标语音类型,云服务端根据目标语音类型对文字信息进行转换,得到语音数据,云服务端调用第三接口,将语音数据发送至摄像头,在接收到语音数据后,摄像头通过预设方式播放语音数据,与现有技术相比,用户输入的是文字信息,不存在周围环境的干扰,因此,提升了传递消息的准确率。
98.如图3所示,为本技术实施例提供的一种文字信息的语音转换装置的架构示意图,包括:
99.第一获取单元100,用于当接收到控制台发送的文字信息、发送方信息以及接收方信息时,从接收方信息中获取摄像头的标识;发送方信息至少包括控制台的标识。
100.标记单元200,用于从数据库中获取与控制台的标识对应的摄像头的标识,并标记为目标摄像头的标识;数据库预先存储目标关联关系信息;目标关联关系信息指示控制台、摄像头以及语音类型之间的关联关系;目标关联关系信息至少包括控制台的标识、摄像头的标识、语音类型的标识。
101.标记单元200具体用于:当接收到控制台发送的目标关联关系信息时,将目标关联关系信息存储至数据库中;目标关联关系信息为控制台语音类型添加至关联关系信息中得到;关联关系信息为控制台通过预设信息与摄像头建立关联关系得到。
102.标记单元200,还用于当目标摄像头的标识与摄像头的标识不一致时,向控制台发送文字信息转换失败的提示信息,以使控制台通过预设界面向用户展示文字信息转换失败的提示信息。
103.第二获取单元300,用于当目标摄像头的标识与摄像头的标识一致时,从语音数据库中,获取与摄像头的标识、且与控制台的标识对应的语音类型的标识。
104.第三获取单元400,用于从语音类型库中获取与语音类型的标识对应的语音类型,并标识为目标语音类型。
105.转换单元500,用于根据目标语音类型对文字信息进行转换,得到语音数据。
106.发送单元600,用于调用第三接口将语音数据发送至摄像头,以使摄像头播放语音数据。
107.发送单元600,还用于调用第二接口将语音数据发送至控制台,以使控制台通过预设界面向用户展示文字信息和语音数据。
108.综上所述,当目标摄像头的标识与摄像头的标识一致时,云服务端从数据库中,获取与摄像头的标识、且与控制台的标识对应的语音类型的标识,云服务端从语音类型库中
获取与语音类型的标识对应的语音类型,并标识为目标语音类型,云服务端根据目标语音类型对文字信息进行转换,得到语音数据,云服务端调用第三接口,将语音数据发送至摄像头,在接收到语音数据后,摄像头通过预设方式播放语音数据,与现有技术相比,用户输入的是文字信息,不存在周围环境的干扰,因此,提升了传递消息的准确率。
109.本技术还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,程序执行上述本技术提供的文字信息的语音转换方法。
110.本技术还提供了一种文字信息的语音转换设备,包括:处理器、存储器和总线。处理器与存储器通过总线连接,存储器用于存储程序,处理器用于运行程序,其中,程序运行时执行上述本技术提供的文字信息的语音转换方法,包括如下步骤:
111.当接收到控制台发送的文字信息、发送方信息以及接收方信息时,从所述接收方信息中获取摄像头的标识;所述发送方信息至少包括控制台的标识;
112.从数据库中获取与所述控制台的标识对应的摄像头的标识,并标记为目标摄像头的标识;所述数据库预先存储目标关联关系信息;所述目标关联关系信息指示控制台、摄像头以及语音类型之间的关联关系;所述目标关联关系信息至少包括所述控制台的标识、摄像头的标识、语音类型的标识;
113.当所述目标摄像头的标识与所述摄像头的标识一致时,从语音数据库中,获取与所述摄像头的标识、且与所述控制台的标识对应的语音类型的标识;
114.从语音类型库中获取与所述语音类型的标识对应的语音类型,并标识为目标语音类型;
115.根据所述目标语音类型对所述文字信息进行转换,得到语音数据;
116.调用第三接口将所述语音数据发送至摄像头,以使所述摄像头播放所述语音数据。
117.可选的,预先将关联关系信息存储至数据库的过程,包括:
118.当接收到所述控制台发送的目标关联关系信息时,将所述目标关联关系信息存储至所述数据库中;所述目标关联关系信息为所述控制台语音类型添加至关联关系信息中得到;所述关联关系信息为所述控制台通过预设信息与摄像头建立关联关系得到。
119.可选的,所述从数据库中获取与所述控制台的标识对应的摄像头的标识,并标记为目标摄像头的标识之后,还包括:
120.当所述目标摄像头的标识与所述摄像头的标识不一致时,向所述控制台发送所述文字信息转换失败的提示信息,以使所述控制台通过预设界面向用户展示所述文字信息转换失败的提示信息。
121.可选的,还包括:
122.调用第二接口将所述语音数据发送至所述控制台,以使所述控制台通过预设界面向用户展示所述文字信息和所述语音数据。
123.本技术实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本技术实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本技术各个实施例所述方法的全部或部
分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
124.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
125.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1