信息输入方法和装置与流程

文档序号：15405456发布日期：2018-09-11 19:29阅读：147来源：国知局

本申请涉及计算机领域，具体涉及输入法领域，尤其涉及信息输入方法和装置。

背景技术：

目前，一些输入法提供语音输入的功能。用户在利用输入法语音输入功能进行输入时，通常采用的方式为：将输入的语音转化为语句后进行输入。

然而，当采用方式进行语音输入时，无法满足诸如用户在输入时在不同的情况下需要输入不同类型的表情图片的需求，语音输入功能较为单一。

技术实现要素：

本申请提供了信息输入方法和装置，用于解决上述背景技术部分存在的技术问题。

第一方面，本申请提供了信息输入方法，该方法包括：接收用户输入的语音信息，语音信息与待输入到应用的输入区域的内容相关联；将与语音信息相关联的表情图片作为候选结果，表情图片包括：多个用户在输入与语音信息语义相关联的语音信息的历史输入中输入到应用的输入区域的次数大于次数阈值的表情图片；将用户从候选结果中选取出的表情图片输入到应用的输入区域中。

第二方面，本申请提供了信息输入装置，该装置包括：接收单元，配置用于接收用户输入的语音信息，语音信息与待输入到应用的输入区域的内容相关联；选取单元，配置用于将与语音信息相关联的表情图片作为候选结果，表情图片包括：多个用户在输入与语音信息语义相关联的语音信息的历史输入中输入到应用的输入区域的次数大于次数阈值的表情图片；输入单元，配置用于将用户从候选结果中选取出的表情图片输入到应用的输入区域中。

本申请提供的信息输入方法和装置，通过接收用户输入的语音信息，语音信息与待输入到应用的输入区域的内容相关联；将与语音信息相关联的表情图片作为候选结果，表情图片包括：多个用户在输入与语音信息语义相关联的语音信息的历史输入中输入到应用的输入区域的次数大于次数阈值的表情图片；将用户从候选结果中选取出的表情图片输入到应用的输入区域中。实现了在用户通过语音输入时，能够精准理解用户语音输入的语义，根据说话的内容、情绪，智能推荐匹配的表情图片，帮助用户进行快速的表情图片的输入，缩短了用户查找表情图片的繁琐操作，为用户提供便利。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是可以应用于本申请的信息输入方法或装置的实施例的示例性系统架构图；

图2示出了根据本申请的信息输入方法的一个实施例的流程图；

图3示出了根据本申请的信息输入方法的另一个实施例的流程图；

图4示出了根据本申请的信息输入装置的一个结构示意图；

图5是适于用来实现本申请实施例的信息输入装置的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用于本申请的信息输入方法或装置的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供传输链路的介质。网络104可以包括各种连接类型，例如有线、无线传输链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯应用，例如、输入法类应用、浏览器类应用、搜索类应用、文字处理类应用等。

终端设备101、102、103可以是具有显示屏并且支持网络通信的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以获取海量的表情图片，向终端设备101、102、103上的输入法类应用发送海量的表情图片。终端101、102、103上的输入法类应用可以记录用户输入的语音信息，建立语音信息与上屏的表情图片的对应关系。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

请参考图2，其示出了根据本申请的信息输入方法的一个实施例的流程200。需要说明的是，本申请实施例所提供的信息输入方法可以由图1中的终端设备101、102、103执行，相应地，信息输入装置可以设置于终端设备101、102、103中。该方法包括以下步骤：

步骤201，接收用户输入的语音信息。

在本实施例中，用户的语音信息与待输入到应用的输入区域的内容相关联。例如，当用户之间在通过即时通讯应用聊天时，需要在即时通讯应用的输入区域输入内容时，可以通过语音输入设备例如麦克风输入语音信息。

步骤202，将与语音信息相关联的表情图片作为候选结果。

在本实施例中，与用户输入的语音信息相关联的表情图片包括：多个用户在输入与语音信息语义相关联的语音信息的历史输入中输入到应用的输入区域的次数大于次数阈值的表情图片。

在本实施例中，可以将多个用户在输入语义相关联的语音信息时，选择上屏比较多的表情图片作为候选结果推荐给当前输入语音信息的用户。

在本实施例的一些可选的实现方式中，还包括：获取多个用户的历史输入信息，历史输入信息包括：历史输入中输入的语音信息、输入到应用的输入区域的表情图片；确定语义相关联的多个语音信息；聚合语义相关联的多个语音信息对应的表情图片；从表情图片中选取出对应的输入次数大于次数阈值的表情图片。

在本实施例中，为了在用户通过语音输入的过程中将与语音信息相关联的表情图片作为候选结果，向用户推荐表情图片，可以预先建立海量的用户输入的语音信息与海量的表情图片的对应关系。

在本实施例中，步骤201中的用户可以是指当前输入语音信息的用户。可以在通过步骤201接收当前用户输入的语音信息之前，预先获取海量用户在历史输入中曾经输入过的语音信息和输入语音信息时选择输入到应用的输入区域(例如即时通讯应用的输入区域)的表情图片即上屏的表情图片。可以从海量用户的历史输入中查找出语义相关联的语音信息，得到多个语音信息集合。每一个语音信息集合中包含多个用户输入的语音相关联的语音信息。同时，可以聚合多个用户在输入语音信息集合中的语音信息时，选择的上屏的表情图片，得到表情图片集合。

从而，可以建立由语义相关联的语音信息组成的语音信息集合与表情图片集合的对应关系，每一个语音信息集合对应一个表情图片集合。语音信息集合与表情图片集合的对应关系可以表示出多个用户在输入语义相关联的语音信息时，选择了哪些表情图片上屏。进一步地，可以查找出语音信息集合对应的表情图片集合中上屏次数大于次数阈值的表情图片。即查找出多个用户在输入语义相关联的语音信息时，选择上屏比较多的表情图片。

在预先建立了建立海量的用户输入的语音信息与海量的表情图片的对应关系之后，当步骤201中的当前用户进行语音输入时，可以查找出与当前用户输入的语音信息相关联的语音信息，确定与当前用户输入的语音信息相关联的语音信息所属的语音信息集合。然后，可以查找出语音信息集合对应的表情图片集合中上屏次数大于次数阈值的表情图片。即查找出多个用户在输入语义相关联的语音信息时，上屏比较多的图片作为候选结果。

例如，多个用户在历史输入中通过语音输入“好闲啊”、“本周工作提前完成了”等语义相关联的语音信息时，上屏的表情图片均为轻松类型的表情图片“咖啡”，即输入次数大于次数阈值的表情图片“咖啡”。

当步骤201中的用户在当前输入中通过语音输入“轻松的周五下午”时，由于“轻松的周五下午”与“好闲啊”、“本周工作提前完成了”的语义相关关联，可以将“好闲啊”、“本周工作提前完成了”对应的上屏的表情图片即表情图片“咖啡”作为候选结果推荐给当前输入语音信息的用户。

步骤203，将用户从候选结果中选取出的表情图片输入到应用的输入区域中。

在本实施例中，在通过步骤202将与语音信息相关联的表情图片作为候选结果之后，可以用户从候选结果中选取出的表情图片输入到应用的输入区域中。即用户可以选取查找出多个用户在输入与通过步骤201输入的语义相关联的语音信息时，上屏比较多的图片作为候选结果输入到应用的输入区域中。

例如，当用户之间通过即时通讯应用进行聊天时，当前用户输入的语音信息“轻松的周五下午”与之前多个用户输入的语音信息“好闲啊”、“本周工作提前完成了”等语音信息在语义上相关联，并且之前多个用户在输入“好闲啊”、“本周工作提前完成了”等语音信息时选择上屏的表情图片均为表情图片“咖啡”，即上屏的次数大于次数阈值，则候选结果可以包含表情图片“咖啡”。当前通过语音输入“轻松的周五下午”的用户可以从候选结果中选择表情图片“咖啡”进行上屏。

在本实施例中，可以由输入法执行本实施例中的上述步骤201-203。输入法能够在用户通过语音输入时，精准理解用户语音输入的语义，根据说话的内容、情绪，智能推荐匹配的表情图片，帮助用户进行快速的表情图片的输入，缩短了用户查找表情图片的繁琐操作，为用户提供便利。

请参考图3，其示出了根据本申请的信息输入方法的另一个实施例的流程300。需要说明的是，本申请实施例所提供的信息输入方法可以由图1中的终端设备101、102、103执行。该方法包括以下步骤：

步骤301，接收用户输入的语音信息。

在本实施例中，用户的语音信息与待输入到应用的输入区域的内容相关联。例如，当用户需要在应用的输入区域输入内容时，可以通过语音输入设备例如麦克风输入语音信息。

步骤302，将与语音信息对应的语义识别结果相关联的表情图片作为候选结果。

在本实施例中，在通过步骤301接收用户输入的语音信息之后，可以对语音信息进行语义识别，得到语音信息对应的语句。然后，可以采用规则匹配方式对语句进行语义识别，得到语义识别结果。

在本实施例中，可以采用规则匹配方式对输入的语音信息对应的语句进行语义识别，得到语义识别结果。语义识别结果包括：指示用户的心情的心情类型。例如，可以预先设置包含与指示用户的心情类型的关键词的规则匹配模版，针对用户不同的类型的心情，设置相应的类型的规则匹配模版。当用户输入的语音信息对应的语句与规则匹配模版匹配时，则可以根据规则匹配模版的类型，确定用户的心情的心情类型。

在本实施例中，可以预先建立每一种心情类型与表情图片的对应关系。根据每一种心情类型与表情图片的对应关系，确定通过对用户输入的语音信息进行语义识别得到的用户的心情的心情类型对应的表情图片。从而，可以将心情类型对应的表情图片作为候选结果。例如，用户输入“好闲啊”时，可以通过语义识别，识别出用户的心情的心情类型为轻松类型，可以将属于轻松类型的表情图片例如表情图片“咖啡”作为候选结果。

在本实施例中，可以采用以下方式建立海量表情图片与心情类型的对应关系：预先获取多个表情图片，对多个表情图片进行标注，得到表情图片的标注信息，表情图片的标注信息可以指示表情图片对应的用户的心情的心情类型。例如，可以将用户的心情的心情类型开心类型划分为特别开心、比较开心等子类型。可以利用表情图片和标注信息作为样本数据，对深度学习模型进行训练。例如，可以将心情类型开心的各个子类型的表情图片和各个子类型的表情图片的标注信息作为样本数据，对深度学习模型进行训练。在利用多个表情图片和多个表情图片的标注信息对深度学习模型进行训练之后，深度学习模型可以学习到表情图片的特征与心情类型的对应关系。可以利用训练后的深度学习模型识别海量表情图片对应的心情类型，建立海量表情图片与心情类型的对应关系。

在本实施例中，步骤301中的用户可以是指当前输入语音信息的用户。可以在通过步骤301接收当前用户输入的语音信息之前，预先获取海量用户在历史输入中曾经输入过的语音信息和输入语音信息时选择输入到应用的输入区域(例如即时通讯应用的输入区域)的表情图片即上屏的表情图片。可以从海量用户的历史输入中查找出语义相关联的语音信息，得到多个语音信息集合。每一个语音信息集合中包含多个用户输入的语音相关联的语音信息。同时，可以聚合多个用户在输入语音信息集合中的语音信息时，选择的上屏的表情图片，得到表情图片集合。

在预先建立了建立海量的用户输入的语音信息与海量的表情图片的对应关系之后，当步骤301中的当前用户进行语音输入时，可以查找出与当前用户输入的语音信息相关联的语音信息，确定与当前用户输入的语音信息相关联的语音信息所属的语音信息集合。然后，可以查找出语音信息集合对应的表情图片集合中上屏次数大于次数阈值的表情图片。即查找出多个用户在输入语义相关联的语音信息时，上屏比较多的图片作为候选结果。

例如，多个用户在历史输入中通过语音输入“好闲啊”、“本周工作提前完成了”等语义相关联的语音信息时，可以通过语义识别，识别出用户的心情类型为轻松类型，推荐轻松类型的表情图片作为候选结果，轻松类型的表情图片中包含表情图片“咖啡”。当输入“好闲啊”、“本周工作提前完成了”等语义相关联的语音信息的用户均选择表情图片“咖啡”上屏时，可以记录用户选择上屏的表情图片“咖啡”。

从而，当步骤301中的当前用户通过语音输入“轻松的周五下午”时，由于当前用户通过语音输入的“轻松的周五下午”与“好闲啊”、“本周工作提前完成了”等语音信息的语义相关联，可以将“好闲啊”、“本周工作提前完成了”等语音信息对应的上屏的表情图片“咖啡”作为候选结果推荐给当前通过语音输入“轻松的周五下午”的用户。

步骤303，将用户从候选结果中选取出的表情图片输入到应用的输入区域中。

在本实施例中，在通过步骤302将与语音信息相关联的表情图片作为候选结果之后，可以用户从候选结果中选取出的表情图片输入到应用的输入区域中。即用户可以选取查找出多个用户在输入与通过步骤301输入的语义相关联的语音信息时，上屏比较多的图片作为候选结果输入到应用的输入区域中。

例如，当用户之间通过即时通讯应用进行聊天时，当前用户输入的语音信息“轻松的周五下午”与之前多个用户输入的语音信息“好闲啊”、“本周工作提前完成了”等语音信息在语义上相关联，并且之前多个用户在输入“好闲啊”、“本周工作提前完成了”等语音信息时选择上屏的表情图片均为表情图片“咖啡”，即上屏的次数大于次数阈值，则候选结果可以包含表情图片“咖啡”。当前用户可以在通过语义输入“轻松的周五下午”时，选择候选结果中的表情图片“咖啡”进行上屏。

在本实施例中，可以由输入法执行本实施例中的上述步骤301-303。输入法能够在用户通过语音输入时，精准理解用户语音输入的语义，根据说话的内容、情绪，智能推荐匹配的表情图片，帮助用户进行快速的表情图片的输入，缩短了用户查找表情图片的繁琐操作，为用户提供便利。

请参考图4，作为对上述各图所示方法的实现，本申请提供了一种信息输入装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图4所示，本实施例的信息输入装置400包括：接收单元401，选取单元402，输入单元403。其中，接收单元401配置用于接收用户输入的语音信息，语音信息与待输入到应用的输入区域的内容相关联；选取单元402配置用于将与语音信息相关联的表情图片作为候选结果，表情图片包括：多个用户在输入与语音信息语义相关联的语音信息的历史输入中输入到应用的输入区域的次数大于次数阈值的表情图片；输入单元403配置用于将用户从候选结果中选取出的表情图片输入到输入区域中。

在本实施例的一些可选的实现方式中，装置400还包括：语音识别单元(未示出)，配置用于在将与语音信息相关联的表情图片作为候选结果之前，对语音信息进行语音识别，得到语音信息对应的语句；语义识别单元(未示出)，配置用于采用规则匹配方式对语句进行语义识别，得到语义识别结果，语义识别结果包括：指示用户的心情的心情类型；表情图片确定单元(未示出)，配置用于将心情类型对应的表情图片作为与语音信息相关联的表情图片。

在本实施例的一些可选的实现方式中，装置400还包括：信息获取单元(未示出)，配置用于获取多个表情图片的标注信息，标注信息指示表情图片对应的心情类型；训练单元(未示出)，配置用于利用表情图片和标注信息作为样本数据，对深度学习模型进行训练；表情类型识别单元(未示出)，配置用于利用训练后的深度学习模型识别海量表情图片对应的心情类型；建立单元，配置用于建立海量表情图片与心情类型的对应关系。

在本实施例的一些可选的实现方式中，装置400还包括：历史输入信息获取单元(未示出)，配置用于在接收用户输入的语音信息之前，获取多个用户的历史输入信息，历史输入信息包括：历史输入中输入的语音信息、输入到应用的输入区域的表情图片；关联语音信息确定单元(未示出)，配置用于确定语义相关联的多个语音信息；表情图片聚合单元(未示出)，配置用于聚合语义相关联的多个语音信息对应的表情图片；表情图片选取单元(未示出)，配置用于从表情图片中选取出对应的输入次数大于次数阈值的表情图片。

在本实施例的一些可选的实现方式中，装置400还包括：输入法执行单元(未示出)，配置用于利用输入法接收用户输入的语音信息。

图5示出了适于用来实现本申请实施例的信息输入装置的计算机系统的结构示意图。

如图5所示，计算机系统500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM503中，还存储有系统500操作所需的各种程序和数据。CPU501、ROM502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505：包括键盘、鼠标等的输入部分506；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

作为另一方面，本申请还提供了一种非易失性计算机存储介质，该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质；也可以是单独存在，未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序，当所述一个或者多个程序被一个设备执行时，使得所述设备：接收用户输入的语音信息，所述语音信息与待输入到应用的输入区域的内容相关联；将与所述语音信息相关联的表情图片作为候选结果，所述表情图片包括：多个用户在输入与所述语音信息语义相关联的语音信息的历史输入中输入到应用的输入区域的次数大于次数阈值的表情图片；将所述用户从候选结果中选取出的表情图片输入到应用的输入区域中。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：秦添;赵晓蕾;
技术所有人：北京百度网讯科技有限公司;
我是此专利的发明人

上一篇：分布式缓存系统、方法及存储介质与流程
上一篇：一种低功率铁芯线圈电流互感器的饱和判定方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。