语音消息发送方法、电子设备及介质与流程

文档序号：20211236发布日期：2020-03-31 11:03阅读：185来源：国知局

本申请涉及互联网技术领域，具体涉及一种语音消息发送方法及装置、一种电子设备以及一种计算机可读介质。

背景技术：

随着计算机技术和互联网技术的高速发展，以及手机等移动终端的普及，即时通讯应用已逐渐成为人们交流、沟通的主要工具，利用即时通讯应用，人们可以互相发送文字、图片、视频、语音等多样化的即时通讯消息，使得沟通方式越来越快捷且丰富多彩。

其中，在通过语音消息进行沟通时，一种通用的实施方式是，用户长按即时通讯应用中的语音录入按键，并在长按期间录入语音消息，用户松开手指后，立即触发将录入的语音消息发送给通讯对象。

但是，由于环境噪音、麦克被遮挡、手指与触摸屏接触不良或录入过程中突发杂音等原因，经常会导致录入的语音消息效果较差而无法满足用户的期望，而根据现有实施方式，只有在发送后，用户才能了解语音消息的录入效果，并在效果不好的情况下重新录入和发送，一方面影响沟通效率，另一方面将效果较差的语音消息发送给聊天对象也会给用户造成负面影响，降低用户的使用体验。另外，现有的实施方式录入的语音消息比较单调，难以给通讯对象留下深刻的印象或引起通讯对象的兴趣，不能满足用户多样化的语音消息沟通需求。

技术实现要素：

本申请的目的是提供一种语音消息发送方法、一种电子设备以及一种计算机可读介质。

本申请第一方面提供一种语音消息发送方法，包括：

在即时通讯场景中，响应于语音录入触发操作，录制语音消息；

对所述语音消息进行外放，和/或，对所述语音消息进行预处理；

响应于消息发送触发操作，向所述即时通讯场景中的通讯对象发送所述语音消息或预处理后的语音消息。

本申请第二方面提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器运行所述计算机程序时执行以实现本申请第一方面所述的方法。

本申请第三方面提供一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。

本申请第一方面提供的语音消息发送方法，在即时通讯场景中，响应于语音录入触发操作，录制语音消息，然后，对所述语音消息进行外放，和/或，对所述语音消息进行预处理；再响应于消息发送触发操作，向所述即时通讯场景中的通讯对象发送所述语音消息或预处理后的语音消息。本申请方法在录制语音消息后，可以不必立即将该语音消息发送给通讯对象，而是可以对所述语音消息进行外放，从而使用户在发送该语音消息前对该语音消息进行预听或者预览，使用户更早地了解该语音消息的效果，并在效果不好时可以取消发送并重新录入，一方面可以提高沟通效率，另一方面可以避免将效果较差的语音消息发送给聊天对象，提升用户使用体验；此外，在录制语音消息后还可以对所述语音消息进行预处理，以改善所述语音消息的效果或者增加趣味性内容等，使得在将预处理后的语音消息发送给通讯对象后，可以给通讯对象留下深刻的印象并引起通讯对象的兴趣，从而能够满足用户多样化、趣味化的语音消息沟通需求。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本申请的一些实施方式所提供的一种语音消息发送方法的流程图；

图2(a)-(c)示出了本申请的一些实施方式所提供的多种触发界面的示意图；

图3(a)-(c)示出了本申请的一些实施方式所提供的多种音频编辑界面的示意图；

图4示出了本申请的一些具体实施方式所提供的一种语音消息发送方法的流程图；

图5示出了本申请的一些实施方式所提供的一种语音消息发送装置的示意图；

图6示出了本申请的一些实施方式所提供的一种电子设备的示意图；

图7示出了本申请的一些实施方式所提供的一种计算机可读存储介质的示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。

另外，术语“第一”和“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请实施例提供一种语音消息发送方法及装置、一种电子设备以及一种计算机可读介质，下面结合附图进行示例性说明。

请参考图1，其示出了本申请的一些实施方式所提供的一种语音消息发送方法的流程图，如图1所示，所述语音消息发送方法，可以包括以下步骤：

步骤s101：在即时通讯场景中，响应于语音录入触发操作，录制语音消息。

其中，所述即时通讯场景可以是指基于互联网的即时通讯场景，其可以基于即时通讯应用(例如微信、qq、钉钉等)实现，其中，所述即时通讯应用可以包括任意具有即时通讯功能的应用。

其中，所述语音录入触发操作，可以是针对触控屏的基于触控输入的触发操作，例如，请参考图2(a)，所述语音录入触发操作可以是对即时通讯应用中语音录入按键的点击操作(比如，点击一次开始录音，再点击一次结束录音)、长按操作(长按期间进行录音)等，本申请实施例不做限定。

此外，所述语音录入触发操作，也可以是针对语音交互设备(例如智能音箱、开启智能语音助手的智能手机等)的基于语音输入的触发操作，例如，用户向智能语音说出“开始录音”，即可触发智能音箱开始录制语音消息，又如，智能手机通过智能语音助手播放即时通讯应用中的通讯对象发来的通讯消息后，询问用户“是否进行回复”，用户回答“是”，也可以触发智能手机开始录制语音消息，上述“开始录音”、“是”的语音输入即可作为语音录入触发操作，以上均为本申请实施例的变更实施方式，均在本申请的保护范围之内。

步骤s102：对所述语音消息进行外放，和/或，对所述语音消息进行预处理。

其中，所述外放可以是指使所述语音消息对用户可感知的任意处理方式，例如，所述外放可以包括音频播放，以通过语音实现外放；又如，所述外放可以包括转文字后显示，以通过文字进行外放，本申请实施例不做限定。

所述预处理可以包括音频编辑和/或添加配图，本申请实施例不做限定。

本申请实施方式，在录制完语音消息后，可以自动对所述语音消息进行外放；或者按照预设的预处理程序或者上一次使用的预处理程序自动对所述语音消息进行预处理；此外，上述外放和预处理也可以交叉执行，例如，在每一次预处理后可以对处理后的语音消息进行外放。

通过对所述语音消息自动进行外放，可以无需用户执行附加操作即可快速使用户了解所述语音消息的内容和效果；通过对所述语音消息自动进行预处理，可以无需用户执行附加操作即可自动改善所述语音消息的效果或者增加趣味性内容；可有效提高消息处理及发送效率，避免使通讯对象等待时间过长的问题，满足即时通讯场景下对消息的实时性要求。

此外，本步骤s102也可以根据用户输入的触发操作而执行，以更高的灵活性满足用户自主处理和多样化的需求。与上述语音录入触发操作类似的，本步骤s102中的所述触发操作，可以是针对触控屏的基于触控输入的触发操作，也可以是针对语音交互设备(例如智能音箱、开启智能语音助手的智能手机等)的基于语音输入的触发操作，本申请实施例不做限定。

例如，在一些实施方式中，所述触发操作是针对触控屏的基于触控输入的触发操作，可以包括针对操作标识的触控操作，所述方法还可以包括：

在录制所述语音消息时或在检测到所述语音消息录制完成后，显示至少一个操作标识，其中，每个所述操作标识对应一种外放方式或一种预处理方式；

上述步骤s102，可以包括：

响应于针对所述操作标识的触控操作，对所述语音消息进行外放，和/或，对所述语音消息进行预处理。

例如，请参考图2(b)、图2(c)，在录制所述语音消息时或在检测到所述语音消息录制完成后，可以在语音消息的录入界面显示“编辑”、“配图”、“转文字后显示”、“播放”等操作标识，其中，“编辑”对应预处理方式“语音播放”、“配图”对应预处理方式“添加配图”、“转文字后显示”对应外放方式“转文字后显示”、“播放”对应外放方式“语音播放”，参考图2(b)，用户在说完语音内容后，向上滑动手指即可结束录制，将手指滑动至其中一个操作标识处，即可触发按照该操作标识对应的外放方式或预处理方式，对所述语音消息进行外放或预处理。又如，参考图2(c)，用户在说完语音内容后，再点击一次语音录入按键即可结束录制，然后，点击其中一个操作标识，即可触发按照该操作标识对应的外放方式或预处理方式，对所述语音消息进行外放或预处理，以上均为本申请实施例的变更实施方式，均在本申请的保护范围之内。

本实施方式，通过显示操作标识，可以提供更加形象化、易于操作的人机交互界面，从而可以使用户更加方便、准确地触发对所述语音消息进行预处理。

在另一些实施方式中，所述触发操作是针对触控屏的基于触控输入的触发操作，可以包括手势触发操作，上述步骤s102，可以包括：

响应于检测到的手势触发操作，对所述语音消息进行外放，和/或，对所述语音消息进行预处理，其中，每种所述手势触发操作对应一种外放方式或一种预处理方式。

例如，所述手势触发操作可以包括“向左上方滑动手指”、“向右上方滑动手指”、“画圈”、“画英文字母”等，不同的手势触发操作可以对应不同的外放方式或预处理方式，此处不再赘述。

本实施方式，可以通过手势触发操作的方式触发对所述语音消息进行预处理，由于手势触发操作具有操作简单、速度快的优点，可以快速触发外放或预处理，有助于提升用户使用体验。

在另一些实施方式中，所述预处理触发操作可以是基于语音输入的触发操作，所述方法还可以包括：

在录制所述语音消息时或在检测到所述语音消息录制完成后，播放语音提示信息，所述语音提示信息用于提示用户对所述语音消息进行外放，和/或，对所述语音消息进行预处理；

上述步骤s102，可以包括：

响应于用户针对所述语音提示信息输入的语音控制指令，对所述语音消息进行外放，和/或，对所述语音消息进行预处理，其中，所述语音控制指令用于指示对所述语音消息进行外放，和/或，对所述语音消息进行预处理。

例如，用户在说完语音内容后，继续说“结束”、“over”等语音指令，即可结束录制，语音交互设备可以通过播放语音提示信息提示用户是否对录制的语音消息进行处理，用户回答“是”，语音交互设备可以进一步说出各种预处理方式供用户选择，用户继续回答“播放”，即可触发语音交互设备播放该语音消息，若用户对该语音消息不满意，可以说出“取消发送”的语音指令以指示语音交互设备取消发送该语音消息，若用户对该语音消息满意，可以说出“可以发送”的语音指令以指示语音交互设备调用即时通讯应用向通讯对象发送该语音消息。

在一些变更示例中，语音交互设备在结束录制后，可以直接提醒用户“是否试听后再发送”，若用户回答“是”，即可触发语音交互设备播放该语音消息，若用户对该语音消息不满意，可以说出“取消发送”的语音指令以指示语音交互设备取消发送该语音消息，若用户对该语音消息满意，可以说出“可以发送”的语音指令以指示语音交互设备调用即时通讯应用向通讯对象发送该语音消息。

通过上述实施方式，可以针对语音交互设备实现语音消息的外放和预处理，方便、快捷、高效，可有效提升用户使用语音交互设备进行即时通讯的使用体验。

需要说明的是，在一些实施方式中，触发本步骤s102执行的触发操作可以有多个可选，例如第一触发操作、第二触发操作、第三触发操作、第四触发操作等，每个触发操作可以对应于一种外放方式或一种预处理方式，不同的触发操作可以对应不同的外放方式或预处理方式，下面结合实施方式进行说明，下述实施方式可以参考图2(b)、图2(c)及上述示例性说明进行理解。

在一些实施方式中，所述对所述语音消息进行外放，可以包括：

播放所述语音消息。

在具体实施时，可以响应于第一触发操作，播放所述语音消息。

例如，请参考图2(b)，所述第一触发操作可以是由所述语音录入按键的位置向上滑动至操作标识“播放”的触控操作，从而可以触发播放所述语音消息。

又如，请参考图2(c)，所述第一触发操作也可以是点击操作标识“播放”的触控操作，从而也可以触发播放所述语音消息。

通过本实施方式，可以在发送该语音消息前对该语音消息进行播放，以使用户对该语音消息进行试听或预听，使用户更早地了解该语音消息的效果，在效果好时可以进一步点击发送功能标识，以触发发送该语音消息，在效果不好时可以点击取消发送功能标识以取消发送该语音消息，从而一方面可以提高沟通效率，另一方面可以避免将效果较差的语音消息发送给聊天对象，避免发送效果较差的语音消息给用户带来的负面影响，提升用户使用体验。

在另一些实施方式中，所述对所述语音消息进行外放，可以包括：

将所述语音消息转换为文字信息后进行展示。

在具体实施时，可以响应于第二触发操作，将所述语音消息转换为文字信息后进行展示。

例如，请参考图2(b)，所述第二触发操作可以是由所述语音录入按键的位置向上滑动至操作标识“转文字后显示”的触控操作，从而可以触发将所述语音消息转换为文字信息后进行显示，以便于用户预览消息内容。

又如，请参考图2(c)，所述第二触发操作也可以是点击操作标识“转文字后显示”的触控操作，从而也可以触发将所述语音消息转换为文字信息后进行显示，以便于用户预览消息内容。

此外，将所述语音消息转换为文字信息，可以采用现有技术提供的任意语音转文字技术实现，例如调用现有的语音转文字引擎实现，本申请实施例不做限定。

通过本实施方式，可以在发送语音消息前，将所述语音消息转换为文字信息后进行显示，以便于用户预览消息内容，使用户更早地了解该语音消息的效果，尽早发现说错话、口误等问题。

此外，考虑到播放语音消息时，语音消息的录制时长有多长，用户就需要听多长时间，一方面，信息传递效率较低，另一方面，对于较长的语音消息，例如超过40秒、1分钟的语音消息，用户往往没有耐心听完，因此，通过本实施方式，可以将时长较长的语音消息转为文字信息后进行展示，由于视觉信息传递效率远大于听觉信息传递效率，例如，1分钟的语音消息转换为文字信息后，用户大约只需要10秒就可以看完，因此，通过本实施方式，还可以更好地帮助用户实现对时长较长的语音消息的预览。

在另一些实施方式，所述对所述语音消息进行外放，可以包括：

播放所述语音消息，并将所述语音消息转换为文字信息后进行展示。

通过本实施方式，可以通过文字与语音相结合的方式向用户外放所述语音消息的内容，可以使用户通过视觉和听觉结合而更加快速、准确、全面地了解所述语音消息的内容和效果，效率更高。

在又一些实施方式中，所述对所述语音消息进行预处理，可以包括：对所述语音消息进行音频编辑；

在具体实施时，可以响应于响应于第三触发操作，对所述语音消息进行音频编辑。

例如，请参考图2(b)，所述第三触发操作可以是由所述语音录入按键的位置向上滑动至操作标识“编辑”的触控操作，从而可以触发对所述语音消息进行编辑。

又如，请参考图2(c)，所述第三触发操作也可以是点击操作标识“编辑”的触控操作，从而也可以触发对所述语音消息进行编辑。

其中，对所述语音消息进行音频编辑，可以调用现有技术提供的任意音频编辑引擎或引擎编辑软件实现，本申请实施例不做限定

通过本实施方式，可以在发送语音消息前，对所述语音消息进行编辑，以改善所述语音消息的效果或者增加趣味性内容，在将预处理后的语音消息发送给通讯对象后，可以给通讯对象留下深刻的印象并引起通讯对象的兴趣，从而能够满足用户多样化、趣味化的语音消息沟通需求。

其中，所述语音编辑可以包括但不限于：调整音量、调整语速、消除噪音、变声、剪裁等处理。其中，所述变声，是指通过改变所述语音消息中的音色、音调等信息，将用户的声音变更为其他对象的声音，例如，变为某一明星的声音、某一动漫角色的声音、某一游戏角色的声音、某一种方言等，本实施方式可以利用现有技术提供的任意变声技术或变声软件实现，本申请实施例不做限定，其均在本申请的保护范围之内。

通过调整音量，可以解决所述语音消息录入音量过小的问题；通过调整语速，可以解决语速过快导致所述语音消息不易听清的问题，或者解决语速过慢影响通讯对象收听兴趣的问题；通过消除噪音，可以解决环境噪音导致的语音消息不清楚的问题；通过变声，可以增加所述语音消息的趣味性，有助于提高通讯对象的收听及交流兴趣；通过剪裁，可以剪掉所述语音消息中不必要的、或者错误的负面内容，有助于消除所述语音消息中的负面内容，避免将不必要的语音内容误发给通讯对象。

在前述实施方式的基础上，在一些变更实施方式中，所述对所述语音消息进行音频编辑，可以包括：

显示多个音频编辑图标，其中，每个所述音频编辑图标对应一种音频编辑模板；

根据用户对所述音频编辑图标的选择操作，确定所述用户选择的目标音频编辑图标；

调用与所述目标音频编辑图标对应的音频编辑模板对所述语音消息进行编辑。

本实施方式，可以预先将编辑处理程序进行模板化，从而生成音频编辑模板，利用音频编辑模板，只需要用户进行简单的选择操作，即可自动完成复杂的音频编辑处理，具有操作简单、高效，趣味性强等优点。

在一些变更实施方式中，所述音频编辑模板可以包括但不限于：音量调整模板、语速调整模板或语音变声模板中的至少一者。

例如，请参考图3(a)-图3(c)，其示出了本申请的一些实施方式所提供的多种音频编辑界面的示意图，其中，图3(a)和图3(b)中，对语音变声程序和语速调整程序都进行了模板化处理，从而生成语音变声模板和语速调整模板，在用户选择后，即可根据用户选择的音频编辑模板自动对所述语音消息进行变声处理，简单、高效、且趣味性强。

此外，在一些实施方式中，在音频编辑界面，还提供了多种功能按键，例如图3(a)中的“试听”、“发送”、“还原”、“取消编辑”、“取消发送”等，以便于用户更加方便、快速的触发相应的操作。

例如，在编辑完成后，用户还可以通过点击“试听”按键试听处理后的语音消息，若对编辑效果满意，可以点击“发送”按键，以触发步骤s103；若对编辑效果不满意，可以点击“还原”按键，还原所述语音消息的初始状态，以便于重新编辑或者直接发送；此外，用户还可以根据实际需求点击“取消编辑”按键以退出当前编辑，即可回到如图2(b)所示的界面，方便用户进一步选择其他的预处理方式进行预处理，可有效提高可操作性，满足用户多样化的处理需求，提升用户使用体验；另外，用户还可以随时点击“取消发送”按键，已取消对该语音消息的编辑和发送，回到如图2(a)所示的界面，方便用户重新录入语音消息。

此外，请参考图3(c)，对音量调整程序进行模板化处理后，生成的音量调整模板还可以供用户自主调整音量调整参数，满足用户更加精细化、自由度更高的音频编辑需求。

在本申请实施例的另一些实施方式中，所述对所述语音消息进行预处理，可以包括：对所述语音消息添加配图；

在具体实施时，可以响应于第四触发操作，对所述语音消息添加配图。

例如，请参考图2(b)，所述第四触发操作可以是由所述语音录入按键的位置向上滑动至操作标识“配图”的触控操作，从而可以触发对所述语音消息添加配图。

又如，请参考图2(c)，所述第四触发操作也可以是点击操作标识“配图”的触控操作，从而也可以触发对所述语音消息添加配图。

通过本实施方式，可以在发送语音消息前，对所述语音消息添加配图，从而丰富所述语音消息的展示方式和展示效果，采用音画并茂的方式改善所述语音消息的效果或者增加趣味性内容，在将添加配图后的语音消息发送给通讯对象后，可以给通讯对象留下深刻的印象并引起通讯对象的兴趣，从而能够满足用户多样化、趣味化的语音消息沟通需求。

其中，对所述语音消息添加配图，可以是选择一张图片随所述语音消息一并发送给通讯对象，也可以根据选择的图片和所述语音消息合成影音消息，本申请实施例不做限定。

例如，在一些实施方式中，所述对所述语音消息添加配图，可以包括：

显示至少一个备选图片；

根据用户对所述备选图片的选择操作，确定所述用户选择的目标图片；

根据所述目标图片和所述语音消息，生成影音消息；

所述向所述即时通讯场景中的通讯对象发送所述语音消息或预处理后的语音消息，可以包括：

向所述即时通讯场景中的通讯对象发送所述影音消息。

本实施方式，可以参考图3(a)，在添加配图处理界面显示多个备选图片供用户选择，并根据用户选择的目标图片和所述语音消息，合成影音消息。其中根据图片文件和音频文件生成影音文件，可以采用现有技术提供的任意影音编辑技术或影音编辑软件实现，本申请实施例不做限定。

通过本实施方式，可以由用户自主选择合适的目标图片以生成影音消息发送给通讯对象，从而可以根据用户的实际需求丰富所述语音消息的展示方式和展示效果，改善所述语音消息的效果或者增加趣味性内容，从而能够满足用户多样化、趣味化的语音消息沟通需求。

在上述实施方式的基础上，在一些变更实施方式中，所述显示至少一个备选图片之前，还包括：

根据所述语音消息，确定用户的情绪信息；

从预设的图片库中选择与所述情绪信息相匹配的至少一个备选图片。

其中，根据用户的语音消息分析用户的情绪，可以采用现有技术提供的任意基于语音的情绪分析技术实现，本申请实施例不做限定。

通过本实施方式，可以自动根据用户的当前情绪，为用户推荐更能够准确表达用户当前情绪的图片，从而使得生成的所述影音消息还可以以影像的形式生动、形象地传递用户的当前情绪，进而改善语音交流效果，增加交流的趣味性，更好的满足用户多样化、趣味化的语音消息沟通需求。

需要说明的是，所述目标图片或所述备选图片，可以是静态图片，也可以是动态图片，本申请实施例不做限定。

例如，在一些变更实施方式中，所述目标图片是动态图片；

所述根据所述目标图片和所述语音消息，生成影音消息之前，还包括：

根据所述语音消息的语速，调整所述目标图片的帧率；

所述根据所述目标图片和所述语音消息，生成影音消息，包括：

根据调整帧率后的所述目标图片和所述语音消息，生成影音消息。

通过本实施方式，可以根据所述语音消息的语速，调整所述目标图片的帧率，使动态图片中动态对象的动作频率与用户的语速相匹配，从而可以有效提升所述影音消息的播放效果和趣味性，进一步满足用户多样化、趣味化的语音消息沟通需求。

在另一些变更实施方式中，所述对所述语音消息进行预处理，可以包括：

对所述语音消息进行音频编辑，以及对所述语音消息添加配图。

本实施方式，可以将音频编辑与添加配图相结合，以对所述语音消息进行预处理，从而使预处理后的语音消息具有更好的效果或更具趣味性，具体实施方式可以参照前述实施例说明进行理解，此处不再赘述。

在本申请实施例的一些变更实施方式中，上述步骤s102，可以包括：

响应于检测到所述语音消息录制完成，对所述语音消息进行外放，以及，显示至少一个操作标识，其中，每个所述操作标识对应一种预处理方式；

响应于针对所述操作标识的触控操作，采用所述操作标识对应的预处理方式对所述语音消息进行预处理。

例如，用户长按“语音录入按键”录制语音消息，松开手指后，不会触发立即发送该语音消息，而是触发自动对该语音消息进行外放，以便于用户了解该语音消息的内容和效果，同时，显示至少一个操作标识，以便于用户根据外放效果随时选择对所述语音消息进行音频编辑和/或添加配图，其中，用户在外放期间或外放结束后，也可以直接步点击发送功能标识以触发发送该语音消息，或者点击取消发送功能标识以取消发送该语音消息。

本实施方式，可以在检测到语音消息录制完成后，无需用户的手动操作即可自动对所述语音消息进行外放，并显示操作标识供用户确定是否对所述语音消息进行编辑，既可以满足用户快速了解语音消息内容和效果的需求，也可以满足用户对所述语音消息进行编辑或添加配图以改善该语音消息的效果或增加趣味性的需求，且从逻辑上更符合用户的使用习惯，可有效提升用户使用体验。

需要说明的是，上述实施方式可以由用户自行选择是否执行，例如，可以在即时通讯应用中设置“语音预览”选项，当用户勾选该选项后，即可自动执行上述实施方式，在语音消息录制完成后不直接发送，而是自动进行外放，同时显示上述操作标识以供用户随时触发对所述语音消息进行预处理。此外，对应于上述“语音预览”选项，还可以设置“预览后立即发送”选项，用户勾选该选项后，在对上述语音消息外放完成后，可以自动触发发送该语音消息，从而在语音消息录制完成后，无需人工参与即可自动执行外放、发送等步骤，更加方便、快捷，另外，勾选该选项后，在进行外放时，可以显示上述操作标识，也可以不显示上述操作标识，本申请实施例不做限定。

通过上述实施方式，可以由用户自主选择语音消息录制后的处理方式，更好地满足用户自定义语音消息处理方式的需求。

步骤s103：响应于消息发送触发操作，向所述即时通讯场景中的通讯对象发送所述语音消息或预处理后的语音消息。

本申请实施方式，在对语音消息外放或预处理完成后，用户可以进一步执行消息发送触发操作，以触发发送所述语音消息或预处理后的语音消息。容易理解的是，在步骤s102只对所述语音消息进行外放的情况下，语音消息的内容没有发生改变，相应的，本步骤s103可以发送所述语音消息；而在步骤s102包含对所述语音消息进行预处理的情况下，语音消息的内容发生了改变，相应的，本步骤s103发送预处理后的语音消息。

与上述语音录入触发操作和预处理触发操作类似的，所述消息发送触发操作，可以是针对触控屏的基于触控输入的触发操作，也可以是针对语音交互设备(例如智能音箱、开启智能语音助手的智能手机等)的基于语音输入的触发操作，本申请实施例不做限定，具体可参照前述示例性说明进行理解，此处不再赘述。

本申请实施例提供的所述语音消息发送方法，至少可以取得以下有益效果：在录制语音消息后，可以不必立即将该语音消息发送给通讯对象，而是可以对所述语音消息进行外放，从而使用户在发送该语音消息前对该语音消息进行预听或者预览，使用户更早地了解该语音消息的效果，并在效果不好时可以取消发送并重新录入，一方面可以提高沟通效率，另一方面可以避免将效果较差的语音消息发送给聊天对象，提升用户使用体验；此外，在录制语音消息后还可以对所述语音消息进行预处理，以改善所述语音消息的效果或者增加趣味性内容等，使得在将预处理后的语音消息发送给通讯对象后，可以给通讯对象留下深刻的印象并引起通讯对象的兴趣，从而能够满足用户多样化、趣味化的语音消息沟通需求。

需要说明的是，本申请实施例并不限于在即时通讯应用中实施，例如，随着人工智能技术的发展，智能音箱、手机等电子设备可以配置有智能语音助手(一种基于人工智能技术实现的语音交互程序，例如iphone手机中配置的“siri”、华为手机中配置的“小艺”等)，从而成为语音交互设备，用户可以直接与智能语音助手进行对话，然后利用智能语音助手调用即时通讯应用与通讯对象进行交流，其也可以实现本申请实施例的目的，基于上述语音交互设备实现的语音消息发送方法，也在本申请的保护范围之内。

在本申请实施例的一些变更实施方式中，上述步骤s102之前，还可以包括：

若检测到针对所述语音消息的消息发送触发操作，则向所述即时通讯场景中的通讯对象发送所述语音消息。

请参考图2(b)，若用户在执行步骤s102之前，触发了消息发送触发操作，例如点击了图2(b)中的发送功能标识，则表示用户不需要对该语音消息进行外放或预处理，因此，可以直接触发向所述即时通讯场景中的通讯对象发送所述语音消息。

通过本实施方式，可以确保用户自由地、根据实际需求选择是否对所述语音消息进行预处理后再进行发送，满足用户多样化的语音消息发送需求。

为了更好地对本申请实施例进行说明，下面结合具体的实施例进行说明如下：

请参考图4，其示出了本申请的一些具体实施方式所提供的一种语音消息发送方法的流程图，图4所示的语音消息发送方法可以参照图1对应的上述实施例说明进行理解，部分内容不再赘述，上述图1对应的实施例的说明也可以参照图4进行理解。

如图4所示，所述语音消息发送方法可以包括以下步骤：

用户按住即时通讯应用中的语音输入按键，可以录入语音消息，即时通讯工具录制语音消息；

若用户在录入过程中松开手指，则直接发送该语音消息。

若用户向上滑动手指，则结束语音消息的录制，并根据用户的触发操作，判断用户选择语音播放、转文字后显示、音频编辑或添加配图功能；

若用户选择选择语音播放功能或转文字后显示，则触发播放语音消息，或者将语音消息转文字后显示，以供用户进行预听或预览。若用户对所述语音消息满意，则可以执行消息发送触发操作以触发发送该语音消息；若用户对所述语音消息不满意，则可以执行取消发送触发操作(例如点击取消发送功能标识)以取消发送该语音消息。

若用户选择音频编辑功能，则加载多个音频编辑模板供用户选择，并根据用户的选择操作确定用户选择的音频编辑模板，然后，利用用户选择的音频编辑模板直接对所述语音消息进行编辑，编辑完成后，可以进行试听，若用户对编辑效果满意，则可以执行消息发送触发操作以触发发送编辑后的语音消息；若用户对所述语音消息不满意，则可以执行取消发送触发操作以取消发送该语音消息。

若用户选择添加配图功能，则显示多个备选图片供用户选择，并根据用户的选择操作确定用户选择的目标图片，然后，利用目标图片和所述语音消息进行合成，生成影音消息，之后，可以进行预览，若用户对该影音消息满意，则可以执行消息发送触发操作以触发发送该影音消息；若用户对该影音消息不满意，则可以执行取消发送触发操作以取消发送并重新录制语音消息。

通过本实施方式，至少可以取得以下有益效果：

在录制语音消息后，可以不必立即将该语音消息发送给通讯对象，而是可以根据用户的触发操作，对所述语音消息进行外放或预处理后再发送给通讯对象，由于外放方式包括语音播放或转文字后显示，因此，通过对所述语音消息进行语音播放或转文字后显示，能够使用户在发送该语音消息前对该语音消息进行预听或者预览，从而使用户更早地了解该语音消息的效果，并在效果不好时可以取消发送并重新录入，一方面可以提高沟通效率，另一方面可以避免将效果较差的语音消息发送给聊天对象，提升用户使用体验；此外，由于预处理方式包括音频编辑或添加配图，因此，对所述语音消息进行预处理后，可以改善所述语音消息的效果或者增加趣味性内容，在将预处理后的语音消息发送给通讯对象后，可以给通讯对象留下深刻的印象并引起通讯对象的兴趣，从而能够满足用户多样化、趣味化的语音消息沟通需求。

在上述的实施例中，提供了一种语音消息发送方法，与之相对应的，本申请还提供一种语音消息发送装置。本申请实施例提供的语音消息发送装置可以实施上述语音消息发送方法，该语音消息发送装置可以通过软件、硬件或软硬结合的方式来实现。例如，该语音消息发送装置可以包括集成的或分开的功能模块或单元来执行上述各方法中的对应步骤。请参考图5，其示出了本申请的一些实施方式所提供的一种语音消息发送装置的示意图。由于装置实施例基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

如图5所示，所述语音消息发送装置10可以包括：

语音消息录入模块101，用于在即时通讯场景中，响应于语音录入触发操作，录制语音消息；

外放或预处理模块102，用于对所述语音消息进行外放，和/或，对所述语音消息进行预处理；

语音消息发送模块103，用于响应于消息发送触发操作，向所述即时通讯场景中的通讯对象发送所述语音消息或预处理后的语音消息。

在本申请实施例的一些变更实施方式中，所述外放或预处理模块102，包括：

语音播放单元，用于播放所述语音消息；和/或，

语音转文字单元，用于将所述语音消息转换为文字信息后进行展示。

在本申请实施例的一些变更实施方式中，所述外放或预处理模块102，包括：

音频编辑单元，用于对所述语音消息进行音频编辑；和/或，

配图添加单元，用于对所述语音消息添加配图。

在本申请实施例的一些变更实施方式中，所述外放或预处理模块102，包括：音频编辑单元；

所述音频编辑单元，包括：

图标显示子单元，用于显示多个音频编辑图标，其中，每个所述音频编辑图标对应一种音频编辑模板；

图标选择子单元，用于根据用户对所述音频编辑图标的选择操作，确定所述用户选择的目标音频编辑图标；

模板化处理子单元，用于调用与所述目标音频编辑图标对应的音频编辑模板对所述语音消息进行编辑。

在本申请实施例的一些变更实施方式中，所述音频编辑模板包括：音量调整模板、语速调整模板或语音变声模板中的至少一者。

在本申请实施例的一些变更实施方式中，所述外放或预处理模块102，包括：配图添加单元；

所述配图添加单元，包括：

备选图片显示子单元，用于显示至少一个备选图片；

目标图片选择子单元，用于根据用户对所述备选图片的选择操作，确定所述用户选择的目标图片；

影音消息生成子单元，用于根据所述目标图片和所述语音消息，生成影音消息；

所述语音消息发送模块103，包括：

影音消息发送单元，用于向所述即时通讯场景中的通讯对象发送所述影音消息。

在本申请实施例的一些变更实施方式中，所述配图添加单元，还包括：

用户情绪确定子单元，用于根据所述语音消息，确定用户的情绪信息；

备选图片选择子单元，用于从预设的图片库中选择与所述情绪信息相匹配的至少一个备选图片。

在本申请实施例的一些变更实施方式中，所述目标图片是动态图片；

所述配图添加单元，还包括：

帧率调整子单元，用于根据所述语音消息的语速，调整所述目标图片的帧率；

所述影音消息生成子单元，包括：

调整帧率消息生成子单元，用于根据调整帧率后的所述目标图片和所述语音消息，生成影音消息。

在本申请实施例的一些变更实施方式中，所述装置10还包括：

操作标识显示模块，用于在录制所述语音消息时或在检测到所述语音消息录制完成后，显示至少一个操作标识；

所述外放或预处理模块102，包括：

标识触发单元，用于响应于针对所述操作标识的触发操作，对所述语音消息进行外放，和/或，对所述语音消息进行预处理。

在本申请实施例的一些变更实施方式中，所述外放或预处理模块102，包括：

手势触发单元，用于响应于检测到的手势触发操作，对所述语音消息进行外放，和/或，对所述语音消息进行预处理。

在本申请实施例的一些变更实施方式中，所述装置10还包括：

语音提示信息播放模块，用于在录制所述语音消息时或在检测到所述语音消息录制完成后，播放语音提示信息，所述语音提示信息用于提示用户是否对所述语音消息进行外放，和/或，对所述语音消息进行预处理；

所述外放或预处理模块102，包括：

语音触发单元，用于响应于用户针对所述语音提示信息输入的语音控制指令，对所述语音消息进行外放，和/或，对所述语音消息进行预处理；其中，所述语音控制指令用于指示对所述语音消息进行外放，和/或，对所述语音消息进行预处理。

在本申请实施例的一些变更实施方式中，所述外放或预处理模块102，包括：

自动外放单元，用于响应于检测到所述语音消息录制完成，对所述语音消息进行外放，以及，显示至少一个操作标识，其中，每个所述操作标识对应一种预处理方式；

预处理单元，用于响应于针对所述操作标识的触控操作，采用所述操作标识对应的预处理方式对所述语音消息进行预处理。

在本申请实施例的一些变更实施方式中，所述装置10，还包括：

语音消息发送模块，用于若检测到针对所述语音消息的消息发送触发操作，则向所述即时通讯场景中的通讯对象发送所述语音消息。

本申请实施例提供的语音消息发送装置10，与本申请前述实施例提供的语音消息发送方法出于相同的发明构思，具有相同的有益效果。

本申请实施方式还提供一种与前述实施方式所提供的语音消息发送方法对应的电子设备，所述电子设备可以是任意具有语音处理能力的电子设备，例如手机、笔记本电脑、平板电脑、台式机电脑、智能手表、智能音箱等，以执行上述语音消息发送方法。

请参考图6，其示出了本申请的一些实施方式所提供的一种电子设备的示意图。如图6所示，所述电子设备20包括：处理器200，存储器201，总线202和通信接口203，所述处理器200、通信接口203和存储器201通过总线202连接；所述存储器201中存储有可在所述处理器200上运行的计算机程序，所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的语音消息发送方法。

其中，存储器201可能包含高速随机存取存储器(ram：randomaccessmemory)，也可能还包括非不稳定的存储器(non-volatilememory)，例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网、广域网、本地网、城域网等。

总线202可以是isa总线、pci总线或eisa总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中，存储器201用于存储程序，所述处理器200在接收到执行指令后，执行所述程序，前述本申请实施例任一实施方式揭示的所述语音消息发送方法可以应用于处理器200中，或者由处理器200实现。

处理器200可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器，包括中央处理器(centralprocessingunit，简称cpu)、网络处理器(networkprocessor，简称np)等；还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201，处理器200读取存储器201中的信息，结合其硬件完成上述方法的步骤。

本申请实施例提供的电子设备与本申请实施例提供的语音消息发送方法出于相同的发明构思，具有与其采用、运行或实现的方法相同的有益效果。

本申请实施方式还提供一种与前述实施方式所提供的语音消息发送方法对应的计算机可读介质，请参考图7，其示出的计算机可读存储介质为光盘30，其上存储有计算机程序(即程序产品)，所述计算机程序在被处理器运行时，会执行前述任意实施方式所提供的语音消息发送方法。

需要说明的是，所述计算机可读存储介质的例子还可以包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他光学、磁性存储介质，在此不再一一赘述。

本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的语音消息发送方法出于相同的发明构思，具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。

需要说明的是，附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围，其均应涵盖在本申请的权利要求和说明书的范围当中。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：潘红
技术所有人：上海盛付通电子支付服务有限公司
我是此专利的发明人

上一篇：一种照明光导纤维丝的宽频载波偏心双透镜的穿管器的制作方法
上一篇：一种智能焊台的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。