会话消息处理方法、装置、计算机设备及可读存储介质与流程

文档序号:22685353发布日期:2020-10-28 12:51阅读:140来源:国知局
会话消息处理方法、装置、计算机设备及可读存储介质与流程

本申请涉及计算机技术领域,特别涉及一种会话消息处理方法、装置、计算机设备及可读存储介质。



背景技术:

随着计算机和网络的不断发展,各类社交软件层出不穷,例如,通讯软件。人们可以通过通讯软件来进行交流,从而可以消除距离对交流的影响,大家也越来越习惯通过通讯软件来进行交流。在使用通讯软件时,人们之间能够通过发送多种形式的会话消息,如语音消息、文本消息等,来进行交流。在交流过程中,用户还能够通过发送表情,来强化自己要表达的情绪,并增加交流的趣味性。

目前在对表情进行发送时,终端能够基于用户输入的文本消息,来为用户推荐与该文本消息匹配的表情,用户从推荐的表情中选择自己要发送的表情,终端响应于用户的选择操作,来对被选中的表情进行发送。

在上述实现过程中,只能基于用户输入的文本消息进行表情推荐,因而用户还需要输入文字才能看到要推荐的表情,操作繁琐,从而导致人机交互效率较低,用户体验较差。



技术实现要素:

本申请提供了一种会话消息处理方法、装置、计算机设备及可读存储介质,能够提高会话过程中的人机交互效率,从而提高用户体验。该技术方案如下:

一方面,提供了一种会话消息处理方法,该方法包括:

响应于接收到目标会话的任一参与用户的输入语音消息,对该输入语音消息进行识别,得到该输入语音消息对应的文本标签;

根据该输入语音消息对应的文本标签,确定与该文本标签匹配的至少一个表情图片,作为与该输入语音消息匹配的至少一个表情图片;

将该至少一个表情图片发送至该参与用户的终端。

在一种可能的实现方式中,该根据该输入语音消息对应的文本标签,确定与该文本标签匹配的至少一个表情图片包括:

在表情标签库中,确定与该输入语音信息对应的文本标签的相似度满足预设条件的至少一个表情标签;

将该至少一个表情标签对应的至少一个表情图片,确定为与该文本标签匹配的至少一个表情图片。

在一种可能的实现方式中,该方法还包括:

基于该播放信息,通过目标编码器,对该输入语音消息与该任一表情图片进行编码,得到用于发送的目标消息,该目标编码器用于对输入语音消息与表情图片共同进行编码,该目标消息包括编码后的输入语音消息和任一表情图片。

一方面,提供了一种会话消息处理方法,该方法包括:

获取目标会话的输入语音消息;

获取与该输入语音消息匹配的至少一个表情图片;

显示待选择的该至少一个表情图片;

响应于对该至少一个表情图片中任一表情图片的选择操作,将该任一表情图片和该输入语音消息发送至该目标会话。

在一种可能的实现方式中,该在该语音输入区域的子区域中,以缩略图的形式显示待选择的该至少一个表情图片之后,该方法还包括:

响应于对该至少一个表情图片的缩略图中任一缩略图的选择操作,获取该任一缩略图对应的表情图片。

在一种可能的实现方式中,该表情图片为动态表情图片。

一方面,提供了一种会话消息处理装置,其特征在于,该装置包括:

识别模块,用于响应于接收到目标会话的任一参与用户的输入语音消息,对该输入语音消息进行识别,得到该输入语音消息对应的文本标签;

图片确定模块,用于根据该输入语音消息对应的文本标签,确定与该文本标签匹配的至少一个表情图片,作为与该输入语音消息匹配的至少一个表情图片;

图片发送模块,用于将该至少一个表情图片发送至该参与用户的终端。

在一种可能的实现方式中,该识别模块,用于对该输入语音消息进行语音识别,得到该输入语音消息对应的文本内容,对该文本内容进行语义识别,得到该文本内容对应的文本标签,作为该输入语音消息对应的文本标签。

在一种可能的实现方式中,该图片确定模块,用于在表情标签库中,确定与该输入语音信息对应的文本标签的相似度满足预设条件的至少一个表情标签,将该至少一个表情标签对应的至少一个表情图片,确定为与该文本标签匹配的至少一个表情图片。

在一种可能的实现方式中,该装置还包括:

接收模块,用于接收该参与用户的终端,基于对该至少一个表情图片中任一表情图片的选择操作发送的该任一表情图片;

信息确定模块,用于根据该输入语音消息的时长,确定该任一表情图片的播放信息,该播放信息用于表示该任一表情图片的播放次数和播放速度。

在一种可能的实现方式中,该装置还包括:

该信息确定模块,还用于根据该输入语音消息的时长,确定该至少一个表情图片的播放信息,该播放信息用于表示该至少一个表情图片的播放次数和播放速度;

信息发送模块,用于将该至少一个表情图片和该至少一个表情图片的播放信息发送至该参与用户的终端。

在一种可能的实现方式中,该信息确定模块包括次数确定模块和速度确定模块;

该次数确定模块,用于根据该输入语音消息的时长,结合该表情图片播放一次所需的播放时长,确定该表情图片在该输入语音消息的时长内的播放次数,该速度确定模块,用于基于该播放次数,确定该表情图片的播放速度。

在一种可能的实现方式中,该次数确定模块,用于确定该输入语音消息的时长与该表情图片播放一次所需的播放时长的比值,若该比值为整数值,则将该比值确定为该表情图片在该输入语音消息的时长内的播放次数,若该比值不是整数值,则对该比值进行取整,将取整后的比值确定为该表情图片在该输入语音消息的时长内的播放次数。

在一种可能的实现方式中,该装置还包括:

编码模块,用于基于该播放信息,通过目标编码器,对该输入语音消息与该任一表情图片进行编码,得到用于发送的目标消息,该目标编码器用于对输入语音消息与表情图片共同进行编码,该目标消息包括编码后的输入语音消息和任一表情图片。

一方面,提供了一种会话消息处理装置,该装置包括:

消息获取模块,用于获取目标会话的输入语音消息;

第一图片获取模块,用于获取与该输入语音消息匹配的至少一个表情图片;

第一显示模块,用于显示待选择的该至少一个表情图片;

发送模块,用于响应于对该至少一个表情图片中任一表情图片的选择操作,将该任一表情图片和该输入语音消息发送至该目标会话。

在一种可能的实现方式中,该第一图片获取模块,用于将该输入语音消息发送给服务器,接收该服务器发送的与该输入语音消息的文本标签匹配的至少一个表情图片;或,对该输入语音消息进行识别,得到与该输入语音消息匹配的至少一个表情图片。

在一种可能的实现方式中,该目标会话对应的界面包括语音输入区域;

该第一显示模块,用于在该语音输入区域的子区域中,以缩略图的形式显示待选择的该至少一个表情图片。

在一种可能的实现方式中,该装置还包括:

第二图片获取模块,用于响应于对该至少一个表情图片的缩略图中任一缩略图的选择操作,获取该任一缩略图对应的表情图片。

在一种可能的实现方式中,该目标会话对应的界面包括会话显示区域;

该装置还包括:

第二显示模块,用于在该会话显示区域,对该任一表情图片和该输入语音消息进行显示。

在一种可能的实现方式中,该第二显示模块,用于在该会话显示区域的目标位置,对该输入语音消息进行显示,基于该输入语音消息对应的目标位置,显示目标动画,该目标动画用于表示该任一表情图片从被该输入语音消息遮挡到显现以及从显现到再次被该输入语音消息遮挡的显示效果。

在一种可能的实现方式中,该表情图片为动态表情图片。

一方面,提供了一种计算机设备,该计算机设备包括一个或多个处理器和一个或多个存储器,该一个或多个存储器中存储有至少一条程序代码,该程序代码由该一个或多个处理器加载并执行以实现该会话消息处理方法所执行的操作。

一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该计算机设备执行该会话消息处理方法所执行的操作。

本申请提供的方案,通过在接收到目标会话的任一参与用户的输入语音消息时,对输入语音消息进行识别,以便得到可以表达所输入的语音消息的语义倾向的文本标签,从而得到至少一个将语义倾向可视化表达的表情图片,作为推荐给用户的表情图片,进而将获取到的至少一个表情图片发送给参与用户终端,实现基于用户录入的语音消息的表情推荐,参与用户输入语音消息后即能通过终端看到推荐的表情图片,无需用户输入文字,简化操作过程,提高人机交互效率,从而提高用户体验。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还能够根据这些附图获得其他的附图。

图1是本申请实施例提供的一种会话消息处理方法的实施环境示意图;

图2是本申请实施例提供的一种会话消息处理方法的流程图;

图3是本申请实施例提供的一种会话消息处理方法的流程图;

图4是本申请实施例提供的一种会话消息处理方法的流程图;

图5是本申请实施例提供的一种目标会话的界面示意图;

图6是本申请实施例提供的一种录制过程中目标会话的界面示意图;

图7是本申请实施例提供的一种推荐表情图片的方法流程图;

图8是本申请实施例提供的一种显示表情图片的界面示意图;

图9是本申请实施例提供的一种确定表情图片播放信息的方法示意图;

图10是本申请实施例提供的一种各类消息的编码数值范围示意图;

图11是本申请实施例提供的一种目标编码器的编码数值范围示意图;

图12是本申请实施例提供的一种输入语音消息和动态表情图片的处理过程示意图;

图13是本申请实施例提供的一种动态表情显示方法的示意图;

图14是本申请实施例提供的一种动态表情显示方法的示意图;

图15是本申请实施例提供的一种动态表情显示方法的示意图;

图16是本申请实施例提供的一种动态表情显示方法的示意图;

图17是本申请实施例提供的一种会话消息处理装置的结构示意图;

图18是本申请实施例提供的一种会话消息处理装置的结构示意图;

图19是本申请实施例提供的一种终端的结构示意图;

图20是本申请实施例提供的一种终端的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

图1是本申请实施例提供的一种会话消息处理方法的实施环境示意图,参见图1,该实施环境包括:终端101和服务器102。

终端101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能电视等,但并不局限于此。终端101以及服务器102能够通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。终端101上可以安装有各类社交软件,如即时通讯软件、论坛类软件等。用户能够通过社交软件与其他参与用户进行交流,终端101能够对会话界面进行显示,用户能够在会话界面输入文本、语音或文字等,来与其他参与用户进行交流。用户能够通过触发会话界面的录音按钮,来触发语音输入请求,终端101能够响应于该语音输入请求,通过麦克风组件来录制用户的语音,并生成相应的输入语音消息,进而将该输入语音消息发送给服务器102,以便服务器102将该输入语音消息发送给其他参与用户的终端。可选地,该麦克风组件内置或外接于终端101均可,本申请在此不做限制。用户还能够在会话界面的输入框中输入要发送的文字,输入完成后,触发发送按钮,终端101响应于用户的触发操作,获取用户输入的文本消息,并将该文本消息发送给服务器102,由服务器102将该文本消息发送给其他参与用户的终端。终端101可以关联有多个表情图片,如用户以往使用过的或下载的表情图片。可选地,终端101在获取到用户输入的文本消息后,可以获取与该文本消息匹配的至少一个表情图片,如动态图像互换格式(graphicsinterchangeformat,gif)表情图片、静态gif表情图片、绘文字(emoji)表情等,并对该至少一个表情图片进行显示,用户可以从显示的这至少一个表情图片中选择一个,终端101响应于用户的选择操作,用被选中的表情图片替代获取到的文本消息,将被选中的表情图片发送给服务器102,由服务器102将该表情图片发送给其他参与用户的终端。此外,用户还能够通过触发会话界面的表情展示按钮,终端101能够响应于用户的触发操作,获取表情图片,并在会话界面对获取到的表情图片进行展示,用户从中选择一个表情图片来进行发送,终端101能够响应于用户的选择操作,将被选中的表情图片发送给服务器102,由服务器102将该表情图片发送给其他参与用户的终端。可选地,用户还可以通过触发会话界面的下载表情按钮,来触发下载表情请求,通过该下载表情请求来获取服务器102中存储的表情图片。

终端101可以泛指多个终端中的一个,本实施例以终端101来举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端仅为一个,或者上述终端为几十个或几百个,或者更多数量,本申请实施例对终端的数量和设备类型不加以限定。

服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdeliverynetwork,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器102以及终端101能够通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。服务器102能够接收终端101发送的语音消息、文本消息、表情消息等,进而将接收到消息发送给各个参与用户的终端。服务器102能够关联有一个表情图片数据库,用于存储多种类型的表情图片,如动态gif表情图片、静态gif表情图片、emoji表情等。服务器102能够响应于终端101发送的下载表情请求,获取该下载表情请求所携带的表情标识对应的表情图片,进而将该表情图片发送给终端101。可选地,上述服务器的数量可以更多或更少,本申请实施例对此不加以限定。当然,服务器102还可以包括其他功能服务器,以便提供更全面且多样化的服务。

图2是本申请实施例提供的一种会话消息处理方法的流程图,参见图2,该方法包括:

201、终端获取目标会话的输入语音消息。

需要说明的是,可选地,该目标会话为任意两个用户之间的会话,或者,该目标会话为任意多个用户之间的会话,该任意两个或多个用户均能够通过各自的终端来进行语音消息的输入。用户能够通过触发该目标会话对应的界面中的录制按钮,来触发语音输入请求,终端能够响应于该语音输入请求,通过麦克风组件来对用户的语音进行录制,以获取到用户基于该目标会话的输入语音消息。

其中,可选地,该麦克风组件外置于终端,或者,该麦克风组件内接于终端,本申请实施例对此不加以限定。

202、终端获取与该输入语音消息匹配的至少一个表情图片。

需要说明的是,该表情图片为动态表情图片,如gif动态表情图片。可选地,该表情图片还可以为其他类型,本申请实施例对此不加以限定。终端在获取到输入语音消息后,可以将该输入语音消息发送给服务器,由服务器来获取与输入语音消息匹配的至少一个表情图片,终端接收服务器发送的至少一个表情图片,即可获取到与该输入语音消息匹配的至少一个表情图片。

203、终端显示待选择的该至少一个表情图片。

通过对待选择的至少一个表情图片进行显示,以便用户能够从显示的这至少一个表情图片中进行选择,来确定自己想要发送的表情图片。

204、终端响应于对该至少一个表情图片中任一表情图片的选择操作,将该任一表情图片和该输入语音消息发送至该目标会话。

需要说明的是,用户能够通过点击待选择的至少一个表情图片中任一表情图片,来触发选择操作,终端即能够响应于该选择操作,对被选中的表情图片和输入语音消息进行发送。将表情图片和输入语音消息发送至目标会话,也即是,将该表情图片和该输入语音消息显示在该目标会话对应的界面中。

本申请实施例提供的方案,通过获取目标会话的输入语音消息,获取与输入语音消息匹配的至少一个表情图片,显示待选择的至少一个表情图片,以便基于用户输入的语音消息来对表情图片进行推荐,用户能够从这至少一个表情图片中选择自己要发送的表情图片,进而响应于对至少一个表情图片中任一表情图片的选择操作,将任一表情图片和输入语音消息发送至目标会话,来对输入语音消息和表情图片进行显示,无需用户输入文字即可实现表情图片的推荐,提高人机交互效率,从而提高用户体验。

图3是本申请实施例提供的一种会话消息处理方法的流程图,参见图3,该方法包括:

301、服务器响应于接收到目标会话的任一参与用户的输入语音消息,对该输入语音消息进行识别,得到该输入语音消息对应的文本标签,该文本标签用于表示该输入语音消息的语义。

需要说明的是,对该输入语音消息进行识别时,可以先对该输入语音消息进行语音识别,得到该输入语音消息的文本内容,再对该文本内容进行语义识别,得到该输入语音消息对应的文本标签。可选地,还可以采用其他方式来对该输入语音消息进行识别,本申请实施例对此不加以限定。

通过对该输入语音消息进行识别,即可得到该输入语音消息对应的文本标签,以便基于该文本标签进行表情图片的推荐,实现基于输入语音消息的表情图片推荐。

302、服务器根据该输入语音消息对应的文本标签,确定与该文本标签匹配的至少一个表情图片,作为与该输入语音消息匹配的至少一个表情图片。

303、服务器将该至少一个表情图片发送至该参与用户的终端。

本申请实施例提供的方案,通过在接收到目标会话的任一参与用户的输入语音消息时,对输入语音消息进行识别,以便得到可以表达所输入的语音消息的语义倾向的文本标签,从而得到至少一个将语义倾向可视化表达的表情图片,作为推荐给用户的表情图片,进而将获取到的至少一个表情图片发送给参与用户终端,实现基于用户录入的语音消息的表情推荐,参与用户输入语音消息后即能通过终端看到推荐的表情图片,无需用户输入文字,简化操作过程,提高人机交互效率,从而提高用户体验。例如通过该方案,文字输入困难的用户能快速输入表达语义或情绪的表情图片,让用户发给好友的消息更有感情色彩,而非冷冰冰的文字,好友通过表情图片也可直观了解到用户想要表达的意思或用户发送消息时的心情。

图4是本申请实施例提供的一种会话消息处理方法的流程图,参见图4,该方法包括:

401、终端获取目标会话的输入语音消息。

在一种可能的实现方式中,该目标会话的界面包括会话显示区域、文本输入区域、功能选择区域和语音输入区域。其中,该语音输入区域设置有录制按钮,用户能够通过触发该录制按钮,来触发语音输入请求,终端能够响应于该语音输入请求,通过麦克风组件来对用户的语音进行录制,并对录制得到的语音进行编码,得到输入语音消息。例如,该目标会话的界面可以参见图5,图5是本申请实施例提供的一种目标会话的界面示意图,该目标会话的界面中包括会话显示区域501、文本输入区域502、功能选择区域503和语音输入区域504,该语音输入区域504中设置有录制按钮,用户即能够通过触发该录制按钮,来使终端获取用户的输入语音消息。用户能够通过长按该录制按钮来进行一段时长的语音的录入,该录制过程中的界面示意图可以参见图6,图6是本申请实施例提供的一种录制过程中目标会话的界面示意图,该目标会话的界面中包括会话显示区域601、文本输入区域602、功能选择区域603和语音输入区域604,用户能够通过长按语音输入区域604中设置的录制按钮605来进行语音录制,录制完成后,即可松开该录制按钮605,终端在检测到用户松开按钮后,即可获取到用户录制的语音对应的输入语音消息。

需要说明的是,可选地,该目标会话的界面还包括其他区域,本申请实施例对此不加以限定。

402、终端将该输入语音消息发送给服务器。

需要说明的是,终端在将该输入语音消息发送给服务器后,无需在会话区域显示界面中对该输入语音消息进行显示,可以在下述步骤403至步骤413处理完成后,基于服务器发送的同时包括输入语音消息和表情图片的目标消息来进行显示,以实现输入语音消息和表情图片的一体化显示。

403、服务器接收该输入语音消息,响应于接收到的该输入语音消息,对该输入语音消息进行语音识别,得到该输入语音消息对应的文本内容。

在一种可能的实现方式中,服务器在接收到该输入语音消息后,能够获取该输入语音消息的频谱特征,从而将该频谱特征输入至语音识别模型,通过该语音识别模型的卷积层,进一步获取该频谱特征的特征,以便基于该特征确定该输入语音消息的音素信息,进而基于字典中因素信息与发音的对应关系,再通过语言模型,确定组成该输入语音信息对应的文本内容的字词,基于因素信息对应的顺序对字词进行排序,得到该输入语音消息对应的文本内容。

其中,该语音识别模型为卷积神经网络(convolutionalneuralnetwork,cnn)模型,可选地,该语音识别模型该可以为其他类型,本申请实施例对此不加以限定。

需要说明的是,在获取该输入语音信息的频谱特征时,服务器能够基于该输入语音信息的各个语音帧,进行快速傅里叶变换,以得到该输入语音消息的频谱,对该输入语音消息中各个语音帧的绝对值取平方,得到该输入语音消息的功率谱,对该输入语音消息中各个语音帧的功率谱取倒数,得到该输入语音信息的倒谱系数,将该倒谱系数作为该输入语音消息的频谱特征。

其中,可选地,该倒谱系数为线性倒谱系数(linearpredictioncepstralcoefficients,lpcc),或者,该倒谱系数为梅尔倒谱系数(mel-frequencycepstralcoefficients,mfcc),本申请实施例对此不加以限定。

需要说明的是,在获取该输入语音消息的频谱特征之前,服务器还能够对该输入语音消息进行预处理,如预滤波、采样和量化、加窗、端点检测、预加重等。通过对输入语音信息进行预处理,能够提高输入语音消息的质量,保证获取到的频谱特征的准确性,进而提高语音识别的准确性。

上述过程提供的仅为一种示例性的语音识别方法,在更多可能的实现方式中,服务器还能够采用其他方式来对输入语音消息进行语音识别,本申请实施例对具体采用哪种方式不加以限定。

404、服务器对该文本内容进行语义识别,得到该文本内容对应的文本标签,作为该输入语音消息对应的文本标签。

需要说明的是,在对文本内容进行语义识别时,可以采用语义识别模型。该语义识别模型可以用于确定文本内容的语义或情绪,进而得到用于表示该输入语音消息的语义或情绪的文本标签。

在一种可能的实现方式中,服务器将该文本内容输入至语义识别模型,通过该语义识别模型,提取该文本内容的文本特征,基于各个文本特征与各个文本特征对应的上下文特征,确定该文本内容对应的文本标签,作为该输入语音消息的文本标签。其中,该语义识别模型为cnn模型,可选地,该语义识别模型还可以为其他类型,本申请实施例对此不加以限定。例如,服务器可以通过语义识别模型,基于上下文特征和语气关键字,确定输入语音消息的用户讲话时的情绪,如讲话时的情绪是开心还是生气,进而得到用于表示输入语音的情绪的文本标签。服务器还可以通过语义识别模型,确定输入语音消息的语义。例如,对于文本内容为“happybirthday”的输入语音消息,服务器对该文本内容进行语义识别,可以得到“生日快乐”的文本标签,进而基于该“生日快乐”的文本标签进行表情的匹配。

405、服务器在表情标签库中,确定与该输入语音信息对应的文本标签的相似度满足预设条件的至少一个表情标签。

需要说明的是,服务器能够关联有一个表情标签库,该表情标签库中存储有多个表情标签,如喜悦、悲伤、感动等,可选地,该表情标签还可以包括其他内容,本申请实施例对此不加以限定。

在一种可能的实现方式中,服务器能够计算该文本标签和该表情标签库中存储的表情标签的相似度,确定与该文本标签的相似度满足预设条件的至少一个表情标签。其中,该预设条件为该相似度大于预设阈值,可选地,该预设阈值可以为任意取值,本申请实施例对此不加以限定。

在另一种可能的实现方式中,服务器在计算出该文本标签与表情标签的相似度之后,可以对该相似度按照从大到小的顺序进行排序,进而获取与该文本标签的相似度满足预设条件的至少一个表情标签。其中,该预设条件为相似度排序在目标位置之前。

需要说明的是,服务器在确定出至少一个表情标签后,还能够确定该至少一个表情标签的推荐指数。在一种可能的实现方式中,服务器能够根据各个表情标签与文本标签的相似度,确定各个表情标签的推荐顺序,也即是,按照相似度从高到低的顺序,对该至少一个表情标签进行排序,基于排序结果设置各个表情标签的推荐指数,得到该至少一个表情标签的推荐指数。

其中,对于相似度相同的多个表情标签,服务器能够根据表情标签所指示的语义范围或情绪范围和文本标签的语义范围或情绪范围,对相似度相同的这多个表情标签进行排序,以确定各个表情标签的推荐指数。例如,服务器将所指示的语义范围或情绪范围与文本标签的语义范围或情绪范围相同的表情标签的推荐顺序设置为最小值,将所指示的语义范围或情绪范围大于文本标签的语义范围或情绪范围的表情标签的推荐顺序设置为较大值,将所指示的语义范围或情绪范围小于文本标签的语义范围或情绪范围的表情标签的推荐顺序设置为最大值,以得到各个表情标签的排序顺序,进而将排序靠前的标签的推荐指数设置为较大值,将排序靠前的标签的推荐指数设置为较小值,得到各个表情标签的推荐指数。例如,用a表示文本标签所指示的语义范围或情绪范围,用b表示表情标签所指示的语义范围或情绪范围,则a=b的表情标签的推荐指数最大,a<b的表情标签的推荐指数次之,a>b的表情标签的推荐指数最小。例如,若文本标签为“大笑”,对该文本标签与表情标签的相似度进行计算后,确定出“哈哈哈”这个表情标签和“喜悦”这个表情标签的相似度相同,而“喜悦”这个表情标签所指示的语义范围大于“大笑”这个文本标签所指示的语义范围,“哈哈哈”这个表情标签所指示的语义范围大于“大笑”这个文本标签所指示的语义范围,因而可以将“喜悦”这个表情标签的推荐指数设置为较大值,将“哈哈哈”这个表情标签的推荐指数设置为较小值。

需要说明的是,上述步骤403至步骤405的过程,可以参见图7所示的流程图,图7是本申请实施例提供的一种推荐表情图片的方法流程图,服务器通过步骤702,对获取到的输入语音消息701进行识别,得到文本标签703,用a表示该文本标签703所指示的语义范围或情绪范围,进而通过步骤705,将文本标签a与表情标签库704中的多个表情标签进行匹配,用b表示该表情标签所指示的语义范围或情绪范围,根据a与b之间的关系,确定要推荐的表情,优先推荐706和708中a=b的关系所对应的1号表情图片707和2号表情图片709,进而推荐710中a<b的关系所对应的3号表情图片711,再推荐712中a>b的关系所对应的4号表情图片713,以此类推,得到要推荐的前30个表情图片714,进而通过步骤715,来对这30个表情图片进行推荐。可选地,还可以推荐更多或更少的表情图片,本申请实施例对此不加以限定。

406、服务器将该至少一个表情标签对应的至少一个表情图片,确定为与该文本标签匹配的至少一个表情图片。

需要说明的是,服务器还能够关联有一个表情图片数据库,该表情图片数据库中存储有多个表情图片,这多个表情图片是基于各个表情图片对应的表情标签来进行存储的。例如,喜悦的表情标签对应存储有多个表情图片,悲伤的表情标签对应存储有多个表情图片,以实现对该多个表情图片的分类存储。通过对该多个表情图片进行分类存储,以便服务器能够直接基于表情标签获取到对应的多个表情图片,无需逐个查找每个表情图片的表情标签,降低服务器的处理压力,提高服务器的处理速度。

在一种可能的实现方式中,终端根据步骤406中确定的至少一个表情标签,从表情图片数据库获取该至少一个表情标签对应的至少一个表情图片,作为与该文本标签匹配的至少一个表情图片。

407、服务器将该至少一个表情图片发送至该终端。

需要说明的是,上述步骤402至步骤407是以通过终端与服务器之间的交互来识别输入语音消息为例进行说明的,在更多可能的实现方式中,终端还可以直接对输入语音消息进行识别,得到该输入语音消息对应的文本标签,进而根据该输入语音消息对应的文本标签,进而从终端所关联的表情图片(例如,用户已下载的或有访问权限的表情图片)中,确定与该文本标签匹配的至少一个表情图片,作为与该输入语音消息匹配的至少一个表情图片,以实现基于输入语音消息的表情推荐,具体过程与上述步骤402至步骤407同理,此处不再赘述。通过由终端自行进行表情图片的推荐,无需与服务器进行交互,可以减少表情图片推荐所需的时间,从而提高会话处理速度。

可选地,终端还可以在识别出文本标签后,将文本标签发送给服务器,由服务器基于接收到的文本标签进行表情图片的推荐。由于服务器关联的表情图片数据库中,表情图片的数据更多,因而由服务器进行表情图片的推荐,可以为用户推荐更多、更多样化的表情图片,提高推荐效果,进而提高用户体验。

408、终端接收该服务器发送的与该输入语音消息的文本标签匹配的至少一个表情图片,显示待选择的该至少一个表情图片。

在一种可能的实现方式中,终端在语音输入区域的子区域中,以缩略图的形式显示待选择的该至少一个表情图片。

在以缩略图的形式对表情图片进行显示时,终端能够对接收到该至少一个表情图片进行压缩,得到该至少一个表情图片的缩略图,从而对该至少一个表情图片的缩略图进行显示,实现以缩略图的形式显示表情图片。

其中,在以缩略图的形式显示该至少一个表情图片时,可以在该语音输入区域的子区域出提供滑动功能,进而可以先显示目标数量的缩略图,用户能够在该子区域中进行向左或向右的滑动操作,终端能够响应于用户的滑动操作,再显示目标数量的其他缩略图。例如,终端可以先显示目标数量的推荐指数较高的表情图片对应的缩略图,用户能够在该子区域中进行向右的操作,终端能够响应于用户的滑动操作,再显示目标数量的推荐指数次之的表情图片对应的缩略图,以此类推,即可实现对该至少一个表情图片对应的缩略图的显示。参见图8,图8是本申请实施例提供的一种显示表情图片的界面示意图,终端在获取到该至少一个表情图片的缩略图后,能够在语音输入区域801下方的子区域中,对先显示5个推荐指数较高的表情图片对应的缩略图,也即是,动态表情图片1的缩略图802、动态表情图片2的缩略图803、动态表情图片3的缩略图804、动态表情图片4的缩略图805、动态表情图片5的缩略图806,用户在该子区域中进行右滑操作,终端能够响应于用户的滑动操作,再显示推荐指数次之的5个表情图片对应的缩略图。可选地,终端还可以采用其他方式来对该至少一个表情图片的缩略图进行显示,本申请实施例对此不加以限定。

409、终端响应于对该至少一个表情图片中任一表情图片的选择操作,获取选择操作对应的该任一表情图片。

在一种可能的实现方式中,用户能够通过点击该至少一个表情图片的缩略图中任一缩略图,来触发对该任一缩略图的选择操作,终端能够响应于对该至少一个表情图片的缩略图中任一缩略图的选择操作,获取该任一缩略图对应的表情图片,也即是,该选择操作对应的任一表情图片。

410、终端向服务器发送表情发布请求,该表情发布请求携带该任一表情图片的表情标识。

在一种可能的实现方式中,终端在获取到该任一缩略图对应的表情图片后,可以获取该表情图片的表情标识,进而基于该表情标识生成表情发布请求,将该表情发布请求发送给服务器,以便服务器根据接收到的表情发布请求所携带的表情标识确定被选中的表情图片。

411、服务器接收该表情发布请求,根据该输入语音消息的时长,确定该表情发布请求所携带的表情标识对应的表情图片的播放信息,该播放信息用于表示该表情图片的播放次数和播放速度。

需要说明的是,服务器能够对接收到的表情图片播放一次所需的播放时长进行识别(或记录),以便基于该表情图片播放一次所需的播放时长来确定该表情图片的播放信息。

在一种可能的实现方式中,终端根据该表情发布请求所携带的表情标识,在表情图片数据库中,确定该表情标识对应的表情图片,进而根据该输入语音消息的时长,结合该表情图片播放一次所需的播放时长,确定该表情图片在该输入语音消息的时长内的播放次数,进而基于该播放次数,确定该表情图片的播放速度。

需要说明的是,在确定该表情图片在该输入语音消息的时长内的播放次数时,终端能够通过确定该输入语音消息的时长与该表情图片播放一次所需的播放时长的比值,来进行该表情图片的播放次数的确定。例如,终端能够通过如下公式(1)来进行播放次数的确定:

其中,x表示输入语音消息的时长,y表示表情图片播放一次所需的播放时长,z表示表情图片在该输入语音消息的时长内的播放次数。

需要说明的是,在得到该输入语音消息的时长与该表情图片播放一次所需的播放时长的比值后,若该比值为整数值,则该表情图片正好可以在该输入语音消息的时长内循环播放整数次,因而可以将该比值确定为该表情图片在该输入语音消息的时长内的播放次数。若该比值不是整数值,则可以通过四舍五入的方式,对该比值进行取整,将取整后的比值确定为该表情图片在该输入语音消息的时长内的播放次数。也即是,若该比值的小数点后一位小于5,则可以对该比值向下取整,得到为该表情图片在该输入语音消息的时长内的播放次数;若该比值的小数点后一位大于5,则可以向上取整,得到该表情图片在该输入语音消息的时长内的播放次数。

需要说明的是,在确定出该表情图片在该输入语音消息的时长内的播放次数后,若该比值是整数值,则服务器直接将该表情图片播放一次所需的播放时长对应的播放速度,确定为该表情图片的播放速度。若该比值不是整数值,则服务器能够通过上述公式(1)来反推出该表情图片播放一次所需的新播放时长y’,进而将该表情图片播放一次所需的新播放时长对应的播放速度,确定为该表情图片的播放速度,以实现通过加快或放慢该表情图片的播放速度,来时y=y’。参见图9,图9是本申请实施例提供的一种确定表情图片播放信息的方法示意图,对于输入语音消息901,在该输入语音消息中,可以完整播放2次表情图片,但输入语音消息播放结束之前,表情图片就已完成了这2次播放,则服务器能够通过上述过程来对表情图片的播放速度进行调整,以使播放完这2次表情图片后,该输入语音消息也正好播放完毕。

通过确定该任一表情图片的播放次数和播放速度,可以始终得到一个与输入语音消息的时长相匹配的表情图片,以便在后续对该输入语音消息和表情图片进行播放时,保证在输入语音消息的时长内,对该表情图片进行多次完整播放,提高播放效果,进而提高用户体验。

需要说明的是,对于上述步骤406至步骤411,服务器能够在确定出与该文本标签匹配的至少一个表情图片后,根据该输入语音消息的时长,确定该至少一个表情图片的播放信息,将该至少一个表情图片和该至少一个表情图片的播放信息发送至该参与用户的终端,终端显示待选择的至少一个表情图片,用户从中选择自己要发送的表情图片,终端响应于对该至少一个表情图片中任一表情图片的选择操作,将该任一表情图片和该任一表情图片的播放信息发送给服务器,由服务器直接通过下述步骤412来进行进一步处理。其中,服务器确定该至少一个表情图片的播放信息的具体过程以及终端显示待选择的至少一个表情图片的具体过程可以参见上述步骤406至步骤411中的内容,此处不再赘述。通过由服务器直接确定出该至少一个表情图片的播放信息,再将表情图片和播放信息一起发送给终端,能够减少终端与服务器的交互次数,从而提高会话消息的处理速度。

412、服务器基于该播放信息,通过目标编码器,对该输入语音消息与该任一表情图片进行编码,得到用于发送的目标消息,该目标编码器用于对输入语音消息与表情图片共同进行编码,该目标消息包括编码后的输入语音消息和任一表情图片。

需要说明的是,在编码时,编码器对各个字符设置有不同的编码数值,不同类型的消息包括的字符不同,因而在解码时,能够根据编码数值的数值范围,来确定该字符所属的消息类型。由于表情图片和英文、中文、emoji表情、语音消息的数值范围相差较大,无法将表情图片和英文、中文、emoji表情、语音消息共同进行编码,因而需要一种目标编码器来对表情图片和英文、中文、emoji表情、语音消息共同进行编码。图10是本申请实施例提供的一种各类消息的编码数值范围示意图,参见图10,英文1001对应的编码数值的数值范围为0至1000,中文1002对应的编码数值的数值范围为1000至2000,绘文字(emoji)表情1003对应的编码数值的数值范围为2000至3000,语音消息1001的编码数值对应的数值范围为3000至5000,而动态表情图片的编码数值对应的数值范围为5000至10000。参见图11,图11是本申请实施例提供的一种目标编码器的编码数值范围示意图,目标编码器能够同时对英文1101、中文1102、emoji表情1103、语音消息1104和动态表情图片1105共同进行编码,从而得到同时包括语音消息和动态表情图片的目标消息,通过对该目标消息进行发送,即可实现对语音消息和动态表情图片的一体化发送。

通过目标编码器,能够对语音消息和动态表情图片进行一体化发送,终端解码后即可同时看到语音消息和动态表情图片,提高显示效果,从而提高用户体验。

413、服务器将该目标消息发送给目标会话的各个参与用户对应的终端。

414、终端在目标会话对应的界面中对该目标消息进行显示。

需要说明的是,终端能够在接收到该目标消息后,通过目标编码器对应的目标解码器,来对目标消息进行解码,以便对该输入语音消息和动态表情图片一起进行显示。上述步骤412至步骤414的过程参见图12,图12是本申请实施例提供的一种输入语音消息和动态表情图片的处理过程示意图,终端在对输入语音消息1201和动态表情图片1202进行发送时,可以分别将输入语音消息1201和动态表情图片1202发送到服务器1203,服务器1203通过步骤1204,对输入语音消息1201和动态表情图片1202一起进行编码,得到包括输入语音消息1201和动态表情图片1202的目标消息,进而将目标消息发送给终端1205,终端1205通过步骤1206,来对该目标消息进行解码,即可得到步骤1207中的输入语音消息和动态表情图片。

在一种可能的实现方式中,终端在对目标消息进行解码后,将该目标消息发送至目标会话,以便在目标会话对应的界面的会话显示区域,对该任一表情图片和该输入语音消息进行显示。

需要说明的是,在对该任一表情图片和输入语音消息进行显示时,终端在会话显示区域对该输入语音消息进行显示,用户通过触发该输入语义消息,来触发对该输入语音消息的播放指令,终端响应于该播放指令,基于该输入语音消息的显示位置,从该输入语音消息对应的消息框的顶部,按照自下往上的顺序,逐渐对该表情图片进行显示,以最终实现在该输入语音消息对应的消息框的顶部完整显示该表情图片。终端还能够对该表情图片的显示速度进行设置,以实现对该表情图片按照自下往上的顺序完整显示需要的时间进行设置。终端还能够根据该表情图片按照自下往上的顺序完整显示需要的时间,在输入语音消息播放完成前的预设时间点,在该输入语音消息对应的消息框的顶部,按照自上往下的顺序,逐渐隐藏该表情图片,直至最后该会话显示区域仅对该输入语音消息进行显示。通过对该表情图片的显示速度进行设置,以便终端能够根据该显示速度,确定开始隐藏该表情图片的时间,进而实现语音播放完成时,该表情图片正好完全隐藏,提高显示效果,从而提高用户体验。

下面以即时通讯软件中同时显示输入语音消息和动态表情图片的效果进行举例,参见图13至图16,图13是本申请实施例提供的一种动态表情显示方法的示意图,终端在会话显示区域中输入语音消息对应的消息框1301的顶部,自下往上从该消息框1301的顶部抽出该动态表情图片1302,从而实现图14中该动态表情图片完全显示的显示效果,图14是本申请实施例提供的一种动态表情显示方法的示意图,参见图14,终端在该消息框1401的顶部,完整显示该动态表情图片1402。终端根据该动态表情图片的显示速度,确定开始隐藏该动态表情图片的时间点,进而在对应的时间点,开始自上往下地隐藏该表情图片,参见图15,图15是本申请实施例提供的一种动态表情显示方法的示意图,终端按照自上往下的顺序,从消息框1501的顶部开始隐藏该动态表情图片1502,直至达到图16中的效果,图16是本申请实施例提供的一种动态表情显示方法的示意图,参见图16,终端最终仅显示该输入语音消息对应的消息框1601。

可选地,终端还可以采用其他方式来对该表情图片进行显示,本申请实施例对此不加以限定。例如,终端还可以不对该表情图片进行隐藏,也即是,自下往上完整显示该表情图片后,即一直在该输入语音消息对应的消息框的顶部进行完整显示,无需对该表情图片进行隐藏。通过不对该表情图片进行隐藏,则在用户再次播放该输入语音消息时,终端即可以直接基于在输入语音消息对应的消息框顶部完整显示的表情图片进行播放,而无需再自下往上逐渐显示该表情图片,减少终端的处理压力,提高显示效果,从而提高用户体验。

需要说明的是,上述步骤412至步骤414仅为一种可选的实现方式,在更多可能的实现方式中,服务器通过步骤411确定出表情图片的播放信息后,可以基于该播放信息,仅对该表情图片进行编码,进而将编码后的表情图片发送给终端,终端基于录制得到的输入语音消息和接收到的编码后的表情图片进行显示。可选地,服务器还可以直接将该播放信息发送给终端,由终端自行根据播放信息来对被选中的表情图片进行编码,进而基于录制得到的输入语音消息和接收到的编码得到的表情图片进行显示,本申请实施例对具体采用哪种方式不加以限定。通过仅对表情图片进行编码,无需对语音消息进行重复的编码和发送,减少服务器和终端的处理压力,提高会话消息处理速度。

需要说明的是,本申请实施例提供的方案,可以应用在各类即时通讯工具的聊天窗口中,当用户点击录制语音,完成输入语音消息的输入后,服务器即可基于输入语音消息进行智能识别,以推荐相关的表情图片,用户通过终端对任一表情图片进行选择后,服务器即可通过目标编码器,将输入语音消息和表情图片在同一条消息中进行发送,进而可以使终端对输入语音消息和表情图片同时进行显示,从而可以提高用户体验,提升用户的消息发送活跃度,进而增加用户粘性。

本申请实施例提供的方案,通过在接收到目标会话的任一参与用户的输入语音消息时,对输入语音消息进行识别,以便得到可以表达所输入的语音消息的语义倾向的文本标签,从而得到至少一个将语义倾向可视化表达的表情图片,作为推荐给用户的表情图片,进而将获取到的至少一个表情图片发送给参与用户终端,实现基于用户录入的语音消息的表情推荐,参与用户输入语音消息后即能通过终端看到推荐的表情图片,无需用户输入文字,简化操作过程,提高人机交互效率,从而提高用户体验。例如通过该方案,文字输入困难的用户能快速输入表达语义或情绪的表情图片,让用户发给好友的消息更有感情色彩,而非冷冰冰的文字,好友通过表情图片也可直观了解到用户想要表达的意思或用户发送消息时的心情。本申请实施例通过根据输入语音消息的时长,来确定表情图片的播放信息,可以保证在输入语音消息的播放过程中,可以对该表情图片进行多次完整显示,提高显示效果。此外,通过对编码器进行优化,提供了一种对输入语音消息和表情图片进行共同编码的目标编码器,以便终端可以同时对输入语音消息和表情图片进行显示,以提供一种新型互动聊天玩法,可以让用户更加方便地表达自己,从而提高用户体验,进而达到提升用户活跃度的目的。

上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。

图17是本申请实施例提供的一种会话消息处理装置的结构示意图,参见图17,该装置包括:

消息获取模块1701,用于获取目标会话的输入语音消息;

第一图片获取模块1702,用于获取与该输入语音消息匹配的至少一个表情图片;

第一显示模块1703,用于显示待选择的该至少一个表情图片;

发送模块1704,用于响应于对该至少一个表情图片中任一表情图片的选择操作,将该任一表情图片和该输入语音消息发送至该目标会话。

本申请实施例提供的装置,通过获取目标会话的输入语音消息,获取与输入语音消息匹配的至少一个表情图片,显示待选择的至少一个表情图片,以便基于用户输入的语音消息来对表情图片进行推荐,用户能够从这至少一个表情图片中选择自己要发送的表情图片,进而响应于对至少一个表情图片中任一表情图片的选择操作,将任一表情图片和输入语音消息发送至目标会话,来对输入语音消息和表情图片进行显示,无需用户输入文字即可实现表情图片的推荐,提高人机交互效率,从而提高用户体验。

在一种可能的实现方式中,该第一图片获取模块1702,用于将该输入语音消息发送给服务器,接收该服务器发送的与该输入语音消息的文本标签匹配的至少一个表情图片;或,对该输入语音消息进行识别,得到与该输入语音消息匹配的至少一个表情图片。

在一种可能的实现方式中,该目标会话对应的界面包括语音输入区域;

该第一显示模块1703,用于在该语音输入区域的子区域中,以缩略图的形式显示待选择的该至少一个表情图片。

在一种可能的实现方式中,该装置还包括:

第二图片获取模块,用于响应于对该至少一个表情图片的缩略图中任一缩略图的选择操作,获取该任一缩略图对应的表情图片。

在一种可能的实现方式中,该目标会话对应的界面包括会话显示区域;

该装置还包括:

第二显示模块,用于在该会话显示区域,对该任一表情图片和该输入语音消息进行显示。

在一种可能的实现方式中,该第二显示模块,用于在该会话显示区域的目标位置,对该输入语音消息进行显示,基于该输入语音消息对应的目标位置,按照该任一表情图片被遮挡、该任一表情图片不被遮挡以及该任一表情图片再次被遮挡的顺序,对该任一表情图片进行显示。

在一种可能的实现方式中,该表情图片为动态表情图片。

图18是本申请实施例提供的一种会话消息处理装置的结果示意图,参见图18,该装置包括:

识别模块1801,用于响应于接收到目标会话的任一参与用户的输入语音消息,对该输入语音消息进行识别,得到该输入语音消息对应的文本标签;

图片确定模块1802,用于根据该输入语音消息对应的文本标签,确定与该文本标签匹配的至少一个表情图片,作为与该输入语音消息匹配的至少一个表情图片;

图片发送模块1803,用于将该至少一个表情图片发送至该参与用户的终端。

在一种可能的实现方式中,该识别模块,用于对该输入语音消息进行语音识别,得到该输入语音消息对应的文本内容,对该文本内容进行语义识别,得到该文本内容对应的文本标签,作为该输入语音消息对应的文本标签。

本申请实施例提供的装置,通过在接收到目标会话的任一参与用户的输入语音消息时,对输入语音消息进行识别,以便得到可以表达所输入的语音消息的语义倾向的文本标签,从而得到至少一个将语义倾向可视化表达的表情图片,作为推荐给用户的表情图片,进而将获取到的至少一个表情图片发送给参与用户终端,实现基于用户录入的语音消息的表情推荐,参与用户输入语音消息后即能通过终端看到推荐的表情图片,无需用户输入文字,简化操作过程,提高人机交互效率,从而提高用户体验。例如通过该方案,文字输入困难的用户能快速输入表达语义或情绪的表情图片,让用户发给好友的消息更有感情色彩,而非冷冰冰的文字,好友通过表情图片也可直观了解到用户想要表达的意思或用户发送消息时的心情。

在一种可能的实现方式中,该图片确定模块1802,用于在表情标签库中,确定与该输入语音信息对应的文本标签的相似度满足预设条件的至少一个表情标签,将该至少一个表情标签对应的至少一个表情图片,确定为与该文本标签匹配的至少一个表情图片。

在一种可能的实现方式中,该装置还包括:

接收模块,用于接收该参与用户的终端,基于对该至少一个表情图片中任一表情图片的选择操作发送的该任一表情图片;

信息确定模块,用于根据该输入语音消息的时长,确定该任一表情图片的播放信息,该播放信息用于表示该任一表情图片的播放次数和播放速度。

在一种可能的实现方式中,该装置还包括:

该信息确定模块,还用于根据该输入语音消息的时长,确定该至少一个表情图片的播放信息,该播放信息用于表示该至少一个表情图片的播放次数和播放速度;

信息发送模块,用于将该至少一个表情图片和该至少一个表情图片的播放信息发送至该参与用户的终端。

在一种可能的实现方式中,该信息确定模块包括次数确定模块和速度确定模块;

该次数确定模块,用于根据该输入语音消息的时长,结合该表情图片播放一次所需的播放时长,确定该表情图片在该输入语音消息的时长内的播放次数,该速度确定模块,用于基于该播放次数,确定该表情图片的播放速度。

在一种可能的实现方式中,该次数确定模块,用于确定该输入语音消息的时长与该表情图片播放一次所需的播放时长的比值,若该比值为整数值,则将该比值确定为该表情图片在该输入语音消息的时长内的播放次数,若该比值不是整数值,则对该比值进行取整,将取整后的比值确定为该表情图片在该输入语音消息的时长内的播放次数。

在一种可能的实现方式中,该装置还包括:

编码模块,用于基于该播放信息,通过目标编码器,对该输入语音消息与该任一表情图片进行编码,得到用于发送的目标消息,该目标编码器用于对输入语音消息与表情图片共同进行编码,该目标消息包括编码后的输入语音消息和任一表情图片。

需要说明的是:上述实施例提供的会话消息处理装置在对会话消息进行处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将终端/服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的会话消息处理装置与会话消息处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

在示例性实施例中,提供了一种计算机设备,该计算机设备可以包括终端和服务器,终端和服务器的具体结构如下:

图19是本申请实施例提供的一种终端的结构示意图。该终端1900可以是:智能手机、平板电脑、mp3播放器(movingpictureexpertsgroupaudiolayeriii,动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1900还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常,终端1900包括有:一个或多个处理器1901和一个或多个存储器1902。

处理器1901可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1901可以采用dsp(digitalsignalprocessing,数字信号处理)、fpga(field-programmablegatearray,现场可编程门阵列)、pla(programmablelogicarray,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1901也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(centralprocessingunit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1901可以集成有gpu(graphicsprocessingunit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1901还可以包括ai(artificialintelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。

存储器1902可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1902还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1902中的非暂态的计算机可读存储介质用于存储至少一个程序代码,该至少一个程序代码用于被处理器1901所执行以实现本申请中方法实施例提供的会话消息处理方法。

在一些实施例中,终端1900还可选包括有:外围设备接口1903和至少一个外围设备。处理器1901、存储器1902和外围设备接口1903之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1903相连。具体地,外围设备包括:射频电路1904、显示屏1905、摄像头组件1906、音频电路1907、定位组件1908和电源1909中的至少一种。

外围设备接口1903可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器1901和存储器1902。在一些实施例中,处理器1901、存储器1902和外围设备接口1903被集成在同一芯片或电路板上;在一些其他实施例中,处理器1901、存储器1902和外围设备接口1903中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。

射频电路1904用于接收和发射rf(radiofrequency,射频)信号,也称电磁信号。射频电路1904通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1904将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1904包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1904可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wirelessfidelity,无线保真)网络。在一些实施例中,射频电路1904还可以包括nfc(nearfieldcommunication,近距离无线通信)有关的电路,本申请对此不加以限定。

显示屏1905用于显示ui(userinterface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1905是触摸显示屏时,显示屏1905还具有采集在显示屏1905的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1901进行处理。此时,显示屏1905还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1905可以为一个,设置在终端1900的前面板;在另一些实施例中,显示屏1905可以为至少两个,分别设置在终端1900的不同表面或呈折叠设计;在另一些实施例中,显示屏1905可以是柔性显示屏,设置在终端1900的弯曲表面上或折叠面上。甚至,显示屏1905还可以设置成非矩形的不规则图形,也即异形屏。显示屏1905可以采用lcd(liquidcrystaldisplay,液晶显示屏)、oled(organiclight-emittingdiode,有机发光二极管)等材质制备。

摄像头组件1906用于采集图像或视频。可选地,摄像头组件1906包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtualreality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1906还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。

音频电路1907可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1901进行处理,或者输入至射频电路1904以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1900的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1901或射频电路1904的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1907还可以包括耳机插孔。

定位组件1908用于定位终端1900的当前地理位置,以实现导航或lbs(locationbasedservice,基于位置的服务)。定位组件1908可以是基于美国的gps(globalpositioningsystem,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

电源1909用于为终端1900中的各个组件进行供电。电源1909可以是交流电、直流电、一次性电池或可充电电池。当电源1909包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中,终端1900还包括有一个或多个传感器1910。该一个或多个传感器1910包括但不限于:加速度传感器1911、陀螺仪传感器1912、压力传感器1913、指纹传感器1914、光学传感器1915以及接近传感器1916。

加速度传感器1911可以检测以终端1900建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1911可以用于检测重力加速度在三个坐标轴上的分量。处理器1901可以根据加速度传感器1911采集的重力加速度信号,控制显示屏1905以横向视图或纵向视图进行用户界面的显示。加速度传感器1911还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1912可以检测终端1900的机体方向及转动角度,陀螺仪传感器1912可以与加速度传感器1911协同采集用户对终端1900的3d动作。处理器1901根据陀螺仪传感器1912采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1913可以设置在终端1900的侧边框和/或显示屏1905的下层。当压力传感器1913设置在终端1900的侧边框时,可以检测用户对终端1900的握持信号,由处理器1901根据压力传感器1913采集的握持信号进行左右手识别或快捷操作。当压力传感器1913设置在显示屏1905的下层时,由处理器1901根据用户对显示屏1905的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1914用于采集用户的指纹,由处理器1901根据指纹传感器1914采集到的指纹识别用户的身份,或者,由指纹传感器1914根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1901授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1914可以被设置在终端1900的正面、背面或侧面。当终端1900上设置有物理按键或厂商logo时,指纹传感器1914可以与物理按键或厂商logo集成在一起。

光学传感器1915用于采集环境光强度。在一个实施例中,处理器1901可以根据光学传感器1915采集的环境光强度,控制显示屏1905的显示亮度。具体地,当环境光强度较高时,调高显示屏1905的显示亮度;当环境光强度较低时,调低显示屏1905的显示亮度。在另一个实施例中,处理器1901还可以根据光学传感器1915采集的环境光强度,动态调整摄像头组件1906的拍摄参数。

接近传感器1916,也称距离传感器,通常设置在终端1900的前面板。接近传感器1916用于采集用户与终端1900的正面之间的距离。在一个实施例中,当接近传感器1916检测到用户与终端1900的正面之间的距离逐渐变小时,由处理器1901控制显示屏1905从亮屏状态切换为息屏状态;当接近传感器1916检测到用户与终端1900的正面之间的距离逐渐变大时,由处理器1901控制显示屏1905从息屏状态切换为亮屏状态。

本领域技术人员可以理解,图19中示出的结构并不构成对终端1900的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。

图20是本申请实施例提供的一种服务器的结构示意图,该服务器2000可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(centralprocessingunits,cpu)2001和一个或多个的存储器2002,其中,该一个或多个存储器2002中存储有至少一条程序代码,该至少一条程序代码由该一个或多个处理器2001加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器2000还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器2000还可以包括其他用于实现设备功能的部件,在此不做赘述。

在示例性实施例中,还提供了一种计算机可读存储介质,例如包括程序代码的存储器,上述程序代码可由处理器执行以完成上述实施例中的会话消息处理方法。例如,该计算机可读存储介质可以是只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、只读光盘(compactdiscread-onlymemory,cd-rom)、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中,终端/服务器的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该终端/服务器执行上述各个方法实施例中提供的会话消息处理方法的方法步骤。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来程序代码相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

上述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1