聊天数据输入方法、装置及通讯终端与流程

文档序号：12785909阅读：237来源：国知局

本申请属于即时通信应用中的数据处理技术领域，尤其涉及一种聊天数据输入方法、装置及通讯终端。

背景技术：

随着移动通信技术的迅速发展，IM(InstantMessaging，即时通讯工具)已成为人们生活中必不可少的一部分。用户可以通过IM软件如QQ、微信、钉钉等，实时地跟朋友、同事、家人等联系人进行通信，大大方便了人们的日常交流需求。

目前，用户在即时通讯工具时，可以聊天场景中输入文字、语音、表情、图片等信息。这些聊天信息通常可以通过用户的键盘输入、表情或图片选择等方式直接输入在聊天场景的对话界面中。尽管现有的即时通讯工具中用户可以输入多种多样的聊天信息，但这种聊天信息的输入方式都是基于用户的键盘拼写或表情、图片选择等的方式直接输入到聊天场景中。而在其他的应用场景中，如用户不会拼写的生僻字，用户不会或者不习惯用键盘输入，或者用户需要摘录或查询图片中的某些信息发送给对方，如查看官方网址、搜索论文中某个公式的含义，等等，在这种情况下，现有的聊天场景中的信息输入方式难以快速、方便的满足用户的这些使用需求。此时的用户往往是手写查询生僻字或者逐个字符输入图片中商品的网址信息等等，用户操作繁琐，聊天信息输入缓慢，用户聊天应用体验较差。

技术实现要素：

本申请目的在于提供一种聊天数据输入方法、装置及通讯终端，可以通过读取图片中的信息，将其转化为文本字符等实现聊天场景中信息内容的快速输入，大大提高用户聊天应用的使用体验。

本申请提供的一种聊天数据输入方法、装置及通讯终端是这样实现的：

一种聊天数据输入方法，所述方法包括：

获取选取的待识别图片；

接收在所述待识别图片上的划取操控指令，确定所述待识别图片中的识别图块；

识别出所述识别图块的信息内容，将所述识别出的信息内容接入到聊天场景中。

一种聊天数据输入方法，所述方法包括：

基于用户的触发指令打开拍摄装置，获取用户通过所述拍摄装置得到的拍摄图片；

获取用户在所述拍摄图片上划取的识别图块；

匹配识别出所述识别图块的信息内容，将所述识别出的信息内容发送到聊天场景的文本编辑框中。

一种聊天数据输入装置，所述装置包括：

图片获取模块，用于获取选取的待识别图片；

图块划取模块，用于接收在所述待识别图片上的划取操控指令，确定所述待识别图片中的识别图块；

图块识别模块，用于识别出所述识别图块的信息内容；

信息输入模块，用于将所述识别出的信息内容接入到聊天场景中。

一种通讯终端，包括处理单元，

所述处理单元被设置成，用于获取选取的待识别图片；还用于接收在所述待识别图片上的划取操控指令，确定所述待识别图片中的识别图块；还用于识别出所述识别图块的信息内容，并将所述识别出的信息内容发送到通信界面指定区域位置。

一种通讯终端，包括拍摄装置和处理器，

基于用户的触发指令打开拍摄装置，响应用户的图片拍摄指令；

所述处理器被设置成，用于获取用户通过所述拍摄装置得到的拍摄图片；还用于接收用户在所述待识别图片上的划取操控指令，确定所述待识别图片中的识别图块；还用于识别出所述识别图块的信息内容，并将所述识别出的信息内容发送到用户的通信界面指定区域位置。

本申请提供的一种聊天数据输入方法、装置及通讯终端，可以在聊天场景中通过读取用户选取的图片，然后识别出用户在所述图片上选中的图片内容，可以将其转化为相应的文本信息内容，并可以将识别出的信息内容接入到用户的聊天场景中。这样，通过图片识别的方式，可以快速获取图片中的内容，帮助用户实现聊天场景中的信息快速输入。利用本申请实施方案可以解决用户不会或不习惯使用字符或手写键盘的困扰，帮助识别生僻字、快速获取图片中的字符信息等等，多方位辅助用户输入，提高用户体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请提供的一种聊天数据输入方法一种实施例的方法流程图；

图2是本申请一种实施例中获取用户选取的待识别图片的过程示意图；

图3是本申请一种实施例中用户划取识别区域、确定识别图块的实施过程示意图；

图4是本申请所述聊天数据输入方法中处理识别图块并将识别出的信息内容接入聊天场景的过程示意图；

图5是本申请一种实施例中优化识别匹配处理结果的实施过程示意图；

图6是本申请用户划取识别区域并识别图块信息内容的一种实施例场景示意图；

图7是本申请提供将识别出的信息内容接入到聊天场景中的一种应用场景示意图；

图8是本申请提供将识别出的信息内容接入到聊天场景中的另一种应用场景示意图；

图9是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图；

图10是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图；

图11是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图；

图12是是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图；

图13是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图；

图14是本申请提供的聊天场景中聊天数据输入聊天数据的一种即时通讯终端示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

图1是本申请所述一种聊天数据输入方法一种实施例的方法流程图。虽然本申请提供了如下述实施例或附图所示的方法操作步骤或装置结构，但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中，这些步骤的执行顺序或装置的模块结构不限于本申请实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时，可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理的实施环境)。

具体的如图1所述，本申请提供的一种聊天数据输入方法的一种实施例可以包括：

S1：获取选取的待识别图片。

本申请实施例以用户在手机终端即时通讯应用的聊天场景中输入聊天信息为应用场景进行说明。图2是本申请一种实施例中获取用户选取的待识别图片的过程示意图，在图2中，用户想要向好友发送好友1咨询的感冒药厂家公司的相关信息。此时，用户可以在聊天场景的对话界面中通过相应的功能按键选择图片。具体的，一些实施例中可以选取图库中已保存的图片作为待识别图片。本申请如图2的应用场景中，一种实施方式可以为用户通过拍照获取的待识别图片。如图2中2-1所示，用户可以点击“拍照”按键启动手机的摄像头，然后对着拍照对象-感冒药包装盒的背面进行拍照，得到一张拍摄图片，如图2中2-2。若用户确定使用该张图片，则可以点击“使用照片”进行确认，即可获取待识别图片，如图2中2-3。

当然，如上所述，用户也可以直接从图库或相册(在此将终端本地化的图片存储统一称为图库)中选取一组图片作为本申请中所述的待识别图片。在其他的一些实施例应用场景中，所述的待识别图片还可以为屏幕截图获取的图片，或者在当前聊天界面对话框中的聊天记录中选取的图片等。因此，本申请所述获取用户选取的待识别图片的一种实施例中，所述获取选取的待识别图片可以包括：

S101：基于用户的触发指令打开拍摄装置；以用户通过所述拍摄装置得到的拍摄图片作为待识别图片。

上述S101可以适用于多数应用场景的实施中。当然，另一种实施例中，所述获取选取的待识别图片可以包括：

S102：获取用户从本地图库中选取的本地照片，以选取的所述本地照片作为待识别图片；

S103：获取用户在聊天记录中选取的聊天图片，以选取的所述聊天图片作为待识别图片；

S104：基于用户的触发指令执行屏幕截图，以所述屏幕截图获取的截图图片作为待识别图片。

所述的屏幕结果可以包括例如手机终端全屏截图，或者PC终端拖动矩形块的局部截图的实施方式。本实施例中，可以采用多种方式获取待识别图片，提高用户利用图表识别快速输入聊天信息的灵活性，便于用户操作，提高用户体验。

本实施例应用场景中，用户可以通过手机的摄像头装置进行拍照，快速便捷的获取待处理图片。这种实施场景可以应用在遇到生僻字输入、较多的文档摘录信息输入(实体书本或名片上的信息输入)、繁琐的信息输入(如法文、较长且包括多种复杂字符的网址等)等时，用户可以直接通过手机拍照，将需要输入到聊天场景中的信息包含在拍摄图片中。这样，后续处理时可以免去用户很多手写输入、字符/编码识别等操作，实现快速聊天内容的信息输入，辅助用户输入，提高便利性。另外，本实施例中所述的获取选取的待识别图片在一些实施例应用场景中可以包括用户选取的待识别图片，也可以包括电子设备采用一定算法选取的图片，或者其他按照设定读取规则选取得到的待识别图片等。

S2：接收在所述待识别图片上的划取操控指令，确定所述待识别图片中的识别图块

获取待识别图片后，用户可以在所述待识别图片上划取需要识别的位置区域，如待识别图片中展示出的某一行文字、某一块条形码等。图3是本申请一种实施例中用户划取识别区域、确定识别图块的实施过程示意图。用户可以在所述待识别图片上进行多次编辑，如选取多个不连续的区域，或者取消划取的多个区域的某一个或多个，重新划取等。用户选好内容后，可以触发设置的完成指令，如图3中的点击“完成”按钮，确定最终此次在待识别图片中划取的需要识别的内容。本实施例中，用户在屏幕上划取选择内容的操作可以被终端设备识别，产生相应的划取操作指令。手机可以接收并读取用户在手机屏幕上对待识别图片的划取操作指令，根据用户的操控行为，确定最终此次需求识别的信息内容所在的一个或多个识别图块，如图3中用户通过手势涂抹划取出的三块识别图块。

本实施例中所述的接收在所述待识别图片上的划取操控指令可以包括接收用户直接作用在在所述待识别图片上产生的划取操控指令，也可以包括电子设备检测到的用户间接作用在所述待识别图片上产生的划取操作指令，甚至是获取得到其他终端设备/功能组件/物理感应设备等作用到待识别图片上产生的划取操作指令。

如图3所示的，本申请实施例中，用户划取选择图片中的信息内容的方式可以包括手势涂抹的方式选取、复制，用户可以在终端屏幕上直接通过手指连续滑动选定一块识别图块。本申请其他的实施方式中并不仅限于此，在其他实施例中用户也可以通过触摸笔、激光笔、磁/光感应笔等物理工具方式直接或间接在待识别图片上划取识别图块。其中，所述的手指触摸划取可以包括直接用手指划取，也可以使用提供的虚拟画笔、首尾(或多个)定位光标、模拟鼠标等工具在待识别图片上划取区域。因此，本申请提供的一种聊天数据输入方法的一种实施例中，所述划取操控指令包括采用下述中的至少一种实施方式作用在待识别图片上产生的指令数据：

S201：通过用户在触摸屏上与待识别图片的肢体触碰划取识别区域；

S202：用户使用触摸笔、激光笔、磁/光感应笔、肢体感应方式划取识别区域；

S203：使用提供的虚拟划取工具划取识别区域。

具体的实现方式上，所述的肢体触碰通常的可以包括手指在终端屏幕上的滑动，当然也可以为用户的其他肢体，如脚趾或鼻子等。所述的磁感应或光感应可以包括隔空划取的方式，所述的肢体感应可以包括手势感应、眼睛(眼球转动)感应等实施方式。

通过接收用户的划取操作指令，可以确定出所述待识别图片中的一个或者多个识别图块。用户确认后，这些识别图块可以被复制保存在缓存中。

S3：识别出所述识别图块的信息内容，将所述识别出的信息内容接入到聊天场景中。

根据用户划取选定的识别图块，进行图片识别处理。本申请实施例中可以将获取的各个识别图块的图像信息转化为相应的文本信息，然后可以将转化后识别出的文本信息接入到用户的聊天场景中。具体的如本实施例应用场景中，用户划取的三个识别图块，这三个识别图块均是图像数据，包括像素颜色、灰度、梯度等等。可以通过图像识别技术将这三个识别图块中包含的字符信息转化为相应的文本。具体的识别所述识别图块中的信息内容的实施方式可以采用本地处理单元进行识别图片文字识别转化，也可以采用将所述识别图块上传到远程/云端服务器进行图像识别处理，然后接收服务器返回的识别结果，得到识别图块的信息内容。

图4是本申请所述聊天数据输入方法中处理识别图块并将识别出的信息内容接入聊天场景的过程示意图，如图4所示，对用户划取的三个识别图块Block_1、Block_2、Block_3分别进行图像识别，将其转化为相应的文本内容“北京同仁堂科技发展股份”、“有限公司制药厂”、“www.tongrentangkj.com”。然后可以将识别出的这些文字信息内容接入到用户当前与好友的聊天场景中。具体接入实现方式可以包括例如将识别出的信息内容默认复制到粘贴板中，用户在聊天场景对话界面的信息输入框中通过粘贴操作将识别出的信息内容输入到聊天信息编辑框中，如图4所示。

当然，本实施例提供的方法不仅可以图片中的文本信息的快速输入，在实际应用中用户遇到生僻字时同样可以通过拍照、划取生僻字，将生僻字直接转化为文本字符进行输入，大大提高用户聊天信息数据速度，并辅助用户输入，识别生僻字。

利用本申请所述实施方案，可以在聊天场景中通过读取用户选取的图片，然后识别出用户在所述图片上选中的图片内容，可以将其转化为相应的文本信息内容，并可以将识别出的信息内容接入到用户的聊天场景中。这样，通过图片识别的方式，可以快速获取图片中的内容，帮助用户实现聊天场景中的信息快速输入。利用本申请实施方案可以解决用户不会或不习惯使用字符或手写键盘的困扰，帮助识别生僻字、快速获取图片中的字符信息，多方位辅助用户输入，提高用户体验。

如上述所述，识别所述识别图块中的信息内容的实施方式可以采用本地处理单元进行识别图片文字识别转化，也可以采用将所述识别图块上传到远程/云端服务器进行图像识别处理。本申请提供的一种实施方式中，可以采用优先由服务器一侧进行识别图块的识别、转换处理等。这样，由于通常服务器一侧计算处理能力强、存储空间大、识别渠道多等，可以快速对用户划取得到的识别图块进行处理，将识别结果返回给客户端，提高处理效率。因此，本申请所述一种聊天数据输入方法的一种实施例中，所述识别出所述识别图块的信息内容可以包括：

S301：将所述识别图块发送到预设服务端进行识别匹配处理；接收服务端返回的识别匹配结果。

具体的，如上述识别用户在感冒药包装盒上划取的三张识别图块的信息内容时，可以将这三张识别图块Block_1、Block_2、Block_3发送到服务端中某个服务器进行图像识别处理。如对用户划取的三个识别图块Block_1、Block_2、Block_3分别进行图像识别，将其转化为相应的文本内容“北京同仁堂科技发展股份”、“有限公司制药厂”、“www.tongrentangkj.com”。然后可以将这三条识别出的文本内容作为识别匹配处理结果返回给至用户手机客户端。当然，其他的实施例也可以由服务端一侧将这三条识别出的文本内容拼接成一条文本内容“北京同仁堂科技发展股份有限公司制药厂www.tongrentangkj.com”返回给客户端，或者客户端一侧将接收到的这三条文本内容拼接合并为一条文本内容。

当然，其他的实施例中，识别图块的图像数据处理也可以在本地终端进行处理，如手机终端本身硬件设施较为强大，或终端为PC或服务器，则所述识别出所述识别图块的信息内容可以包括：

S302：本地化识别匹配处理所述识别图块，获取识别匹配结果。

本地识别匹配处理可以在断网情况下进行图片信息识别，或者节约用户流量，若本地化识别处理能力较强，则可以提高识别图块的识别效率。

另一种应用场景中，可以设置，如果在终端联网状态下优先使用远程服务器进行数据库识别、匹配等处理，如果断网或者不符合远程识别条件，则可以进行本地化识别、匹配处理。因此，本申请所述方法的另一种实施例中，所述识别出所述识别图块的信息内容可以包括：

S303：在满足网络通信条件下，将所述识别图块发送到预设服务端进行识别匹配处理，并接收服务端返回的识别匹配结果；否则，本地化识别匹配处理所述识别图块，获取识别匹配结果。

在图像识别处理的过程中，有些识别图块可能会存在信息不全、分辨率较低、局部残缺等，此时服务器一侧可以根据识别图块的图像识别处理的结果在数据库中进一步的进行匹配，完善、纠正、补充等得到最后的识别出的信息内容。因此，本申请所述一种聊天数据输入方法的另一种实施例中，所述识别匹配处理可以包括：

S3011：对所述识别图块进行图像识别处理，获取所述识别图块的图像识别内容；在预设数据库匹配所述图像识别内容，根据匹配结果优化所述图像识别内容，生成优化后的识别匹配结果；

相应的，所述接收服务端返回的识别匹配结果包括接收服务端返回的优化后的识别匹配结果。

例如，上述识别图块Block_1划取时最后一个字“份”没有完全包含在内，如图5所示的用户在待识别图片上划取的残缺Block_1识别图块示意图。图5是本申请一种实施例中优化识别匹配处理结果的实施过程示意图。服务端对三张识别图块Block_1、Block_2、Block_3数据库匹配识别后得到三条文本内容“北京同仁堂科技发展股”、“有限公司制药厂”、“www.tongrentangkj.com”。然后将这三条文本内容进一步纠正完善后进行拼接得到“北京同仁堂科技发展股份有限公司制药厂www.tongrentangkj.com”，然后服务端可以将该条信息完善后的识别匹配结果返回给用户手机终端。当然，服务端还可以进行其他的智能优化处理等，如识别出Block_2与Block_3的文本信息结尾和开头字符分别是“厂”和“w”，则可以认为是不同语种或表述不同语义成分，则可以在Block_2与Block_3之间添加空格。同理，相应的，Block_1与Block_2识别出的文本内容在服务端的数据库中进行匹配时可以查询到存在“北京同仁堂科技发展股份有限公司制药厂”这么一条完善的信息，因此可以直接将Block_1与Block_2识别出的文本信息进行拼接。

上述所述实施例的应用场景中可以识别出识别图块中的图像文本信息，将其转化为对应的字符文本信息，如上述的一张图像数据Block_1转化为字符文本信息后成为“北京同仁堂科技发展股份”的若干汉字字符。本申请所述的聊天数据输入方法并不仅限于此，在其他的实施例中，将用户划取的图块区域转化为相应的信息内容还可以包括识别出图块中的代码或编码信息，如识别出图块中的二维码或条形码。另一些应用场景中，可以将用户划取的识别图块中的外文翻译成指定语言，如将英文单词翻译成中文。甚至，在一些应用场景中可以识别出图块中包含的水印、商品链接等信息内容，提取出这些水印或商品链接信息后可以将其发送到用户的聊天场景中。这样，用户可以通过手机拍照或截屏等获取待识别图片，然后划取需要识别的图块，进一步的识别出图块中包含的显性或隐性信息内容，或者进行相应的翻译、转换等，大大辅助用户聊天场景中的多种信息输入，提高输入速度和效率，帮助用户识别图片信息，提高用户体验。因此，本申请所述一种聊天数据输入方法的另一种实施例中，所述识别出所述识别图块的信息内容可以包括：

S311：识别出所述识别图块中的图像数据，并转化为相应的文本信息。

本申请所述一种聊天数据输入方法的另一种实施例中，所述识别出所述识别图块的信息内容可以包括执行下述中的至少一种处理：

S312：翻译出所述识别图块中的代码/编码信息；

S313：若识别出的文本信息包含预先设置的需要进行翻译第一语种，则将所述第一语种的文本信息翻译成第二语种的文本信息；

S314：获取设置在所述识别图块中的隐藏信息，所述隐藏信息包括但不限于图片水印、商品页面链接地址、电话号码等。

上述S322中所述的代码/编码信息如可以为二维码或条形码、摩斯代码等，如用户划取图3中的条形码区域，可以将其转化为相应的二进制/十进制数字或其他对应的信息。S333中，例如所述识别图块中包含一段英文信息，则本实施例实施过程中可以获取图片中的英文字符信息，并附加这些英文字符信息翻译后的中文信息，如图6所示，图6是本申请用户划取识别区域并识别图块信息内容的一种实施例场景示意图。其他一些实施例中，所述识别图块若包含一些隐藏信息，用户可能事先并不知道存在这些隐性信息，则本申请实施例在对识别图块进行识别处理时可以获取这些隐藏信息，将其展示给用户。如用户划取的识别图块中包含这个待识别图片的商品页面链接地址，则可以将识别出的这个商品页面链接地址一同作为识别出的信息内容，用户可以将该商品页面链接地址发送到聊天场景中。

一般的，如果用户划取的识别图块中包含多种类型的信息内容，可以识别出的所有信息内容全部接入到聊天场景的输入框中。如从图块中识别出的一段中文文本T1和一段英文文本T2，然后在服务器或客户端本地识别图块处理时还将其中的英文文本T2进行了翻译，生成了相应的翻译文本T3。另外，还将用户划取的另一块识别图块中的条形码转化成了对应的13位十进制的数字文本T4。那么，一种实施方式中可以将上述多种类型的识别匹配结果T1、T2、T3、T4这四种文本信息全部接入到用户聊天场景中，作为用户输入的聊天数据。图7是本申请提供将识别出的信息内容接入到聊天场景中的一种应用场景示意图，如图7所示，在另一种实施例应用场景中，如果识别出多种类型的信息内容，则另一种实施方式中可以让用户选择需要作为输入数据的信息内容种类。具体的，本申请提供的一种聊天数据输入方法的另一种实施例中，所述方法还可以包括：

当识别出的信息内容包括多种类型的识别匹配结果时，为用户提供不同类型识别匹配结果的选项；以及，获取用户选择的识别匹配结果；

相应的，所述将所述识别出的信息内容接入到用户的聊天场景中包括：将所述获取的用户选择的识别匹配结果接入到用户的聊天场景中。

如上述所述的应用场景中识别匹配结果可以包括T1、T2、T3、T4这四种文本信息。然后可以将这四种文本信息用户提示板的方式展示给用户，用户可以从中选择一个或者多个文本信息作为需要输入到聊天场景中的数据。当然，不种类型识别匹配结果的划分可以自定义的设计，如上述中可以将T1与T2合并为一个识别匹配结果T1’，该T1’可以表示为从用户划取的识别图块中直接识别输出的信息内容，而T3、T4等则是经过进一步的翻译、代码识别、数据格式转换等得到的信息内容。

显然，让用户选择需要作为输入数据的信息内容种类，可以方便一些用户进行输入信息的选择，满足一些用户需求，提高这些场景需求的用户使用体验。

本申请的一些实施例中，识别出的信息内容可以接入到用户的聊天场中，具体的实现方式上可以包括将识别出的信息内容复制粘贴到用户当前聊天场景中对话界面的输入信息编辑框中，如图4所示。此时，用户可以通过点击信息发送按钮将包括识别出的所述信息内容的聊天数据发送出去。当然，用户也可以在聊天场景的输入信息编辑框中对所述识别出的信息内容进行编辑处理等。本申请的另一种实施例中，也可以在聊天场景中直接将识别出的信息内容直发送出去，成为用户已发送出去的聊天信息，如图8所示，图8是本申请提供将识别出的信息内容接入到聊天场景中的另一种应用场景示意图。当然，将识别出的信息内容接入到用户的聊天场景中的实施方式还可以包括其他设计方式，如添加到表情库等，具体的可以根据需求进行设计，实现用户的便利、快捷、辅助、灵活的信息输入，在此不做一一解释。因此，本申请所述一种聊天数据输入方法的另一种实施例中，所述将所述识别出的信息内容接入到用户的聊天场景中可以包括采用下述中的至少一种实施方式：

S321：将所述识别出的信息内容作为缓存数据存储，基于用户的粘贴指令将缓存数据发送到聊天场景的文本编辑框中；

S322：将所述识别出的信息内容作为已输入到当前聊天场景中文本编辑框内的消息内容；

S323：将所述识别出的信息内容作为用户的聊天场景中已发送出去的消息内容；

S324：将所述识别出的信息内容添加到用户的信息收藏栏。

上述中所述的信息收藏栏可以包括用户的表情栏，存储用户表情信息的同时可以同时或者分组存储通过待识别图片获取的信息内容。也可以包括采用单独的功能模块进行存储，如同发送语音、图片、视频对话的功能组件等。这样可以方便用户后期查看识别过的信息内容，或者方便以后快速的将例如上述应用场景中关于效果较好的感冒药生成厂信息分享给其他好友等。上述S321中，识别出的信息内容可以先暂时缓存到粘贴板中，待用户长按弹出功能选项并选择粘贴功能后才将信息内容展示到文本编辑框中。在S322中，则可以直接将识别出的信息内容发送到文本编辑框中，方便一些用户快速简洁的输入需求。当然，S323中，则可以更加快速、高效的直接将识别出的信息内容发送给好友。S321～S324的每个实施方式可以单独实施，当然，在一些应用场景中，本申请并不排除使用其中多个方式的组合实施方式将识别信息接入到用户的聊天场景中。采用多种方式的聊天数据接入，可以方便灵活，每一种实施方式都可以实现快速、便利的聊天数据输入，满足一些场景下的用户需求，提高这些用户的聊天应用使用体验。

在实施本申请的一些应用场景中，用户往往是随机性的希望将实物上的某些信息作为聊天信息输入，或者偶尔遇到生僻字或者无法识别的外文、图标、编码等。在这些应用场景下，用户通常可以采取用终端如手机摄像头对实物进行拍照，然后涂抹划取照片上需求识别的生僻字或者复制下来的一段文本信息等等，可以帮助用户快速输入，并且输入方式便捷、灵活，用户的信息输入体验效果提升明显。因此，本申请提供具体的一种聊天信息输入方式的另一种实施例中，所述方法可以包括：

基于用户的触发指令打开拍摄装置，获取用户通过所述拍摄装置得到的拍摄图片；

获取用户在所述拍摄图片上划取的识别图块；

匹配识别出所述识别图块的信息内容，将所述识别出的信息内容发送到聊天场景的文本编辑框中。

本申请提供的上述各个实施例所示的聊天数据输入方法，可以在聊天场景中通过拍照等获取待识别图片，将用户划图识别出的信息接入到聊天场景中，实现图像数据的文本转换，生僻字识别、编码/代码识别、翻译、隐含信息等输入辅助，帮助用户实现通过图片的快速信息输入，并辅助信息输入，提供灵活多样的远程信息识别、多类型信息选择输入等，大大提高即时通信应用的聊天信息输入便利性，提高用户体验。尤其需要说明的是，上述各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间不同的实施部分可以相互采用。虽然上述一种举例说明了远程匹配处理识别模块，另一种实施例中说明示意了图块代码翻译、语种转换、获取隐藏信息等，显然，各个实施例相互结果借鉴，可以实现远程服务端进行图块代码翻译、语种转换等，也可以终端本地化进行处理等。这样，即使本申请实施例没有直接的给出这样的实施方式，但显然通过阅读本申请各个实施例可以相互特征组合实现变形、变换、扩展的其他实施方式，这些实施方式都应当属于本申请保护的实施范围之内。

基于本申请所述的聊天数据输入方法，本申请提供一种聊天数据输入装置。所述装置可以用于手机、平板、PC、服务器、PDA等多种终端设备中即时通信应用中的信息输入，可以集成在即时通信应用的功能组件中(如应用程序模块)，帮助用户实现通过图片方式的快速信息输入。图9是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图，如图9所示，所述装置可以包括：

图片获取模块101，可以用于获取选取的待识别图片；

图块划取模块102，可以用于接收在所述待识别图片上的划取操控指令，确定所述待识别图片中的识别图块；

图块识别模块103，可以用于识别出所述识别图块的信息内容；

信息输入模块104，可以用于将所述识别出的信息内容接入到聊天场景中。

利用本申请所述装置的实施方案，可以在聊天场景中通过读取用户选取的图片，然后识别出用户在所述图片上选中的图片内容，可以将其转化为相应的文本信息内容，并可以将识别出的信息内容接入到用户的聊天场景中。这样，通过图片识别的方式，可以快速获取图片中的内容，帮助用户实现聊天场景中的信息快速输入。利用本申请实施方案可以解决用户不会或不习惯使用字符或手写键盘的困扰，帮助识别生僻字、快速获取图片中的字符信息，多方位辅助用户输入，提高用户体验。

图10是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图，如图10所示，所述图片获取模块101可以包括：

拍摄模块1011，可以用于为用户提供照片拍摄选项，并基于用户的触发指令打开拍摄装置；

图片确认模块1012，可以用于获取用户通过所述拍摄装置得到的拍摄照片；并基于用户使用当前拍摄照片的确认指令将所述当前拍摄照片作为用户选取的待识别图片。

图11是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图，如图11所示，所述图片获取模块101可以包括下述中的至少一种：

本地选取模块1013，可以用于获取用户从本地图库中选取的本地照片，以选取的本地照片作为待识别图片；

聊天记录图片选取模块1014，可以用于获取用户在聊天记录中选取的聊天图片，以选取的聊天图片作为待识别图片；

屏幕截图选取模块1015，可以用于基于用户的触发指令执行屏幕截图，以所述屏幕截图获取的截图图片作为待识别图片。

如上所述，用户也可以直接从图库或相册(在此将终端本地化的图片存储统一称为图库)中选取一组图片作为本申请中所述的待识别图片。在其他的一些实施例应用场景中，所述的待识别图片还可以为屏幕截图获取的图片，或者在当前聊天界面对话框中的聊天记录中选取的图片等。本实施例中，可以采用多种方式获取待识别图片，提高用户利用图表识别快速输入聊天信息的灵活性，便于用户操作，提高用户体验。

如上述所述，识别所述识别图块中的信息内容的实施方式可以采用本地处理单元进行识别图片文字识别转化，也可以采用将所述识别图块上传到远程/云端服务器进行图像识别处理。图12是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图，如图12所示，所述图块识别模块103可以包括：

远程识别模块1031，可以用于将所述识别图块发送到预设服务端进行识别匹配处理；接收服务端返回的识别匹配结果；

本地识别模块1032，可以用于地化识别匹配处理所述识别图块，获取识别匹配结果；

识别模块选择单元1033，可以用于根据设置的处理规则选择远程识别模块1031或本地识别模块1032来识别所述图块的信息内容。

所述的处理规则可以根据设计需求进行设置，如优先使用远程识别模块1031或者优先使用本地识别1032模块处理识别图块，或者设置一定的判断条件，如在满足网络通信条件下，本地识别模块1032；否则，使用识别模块选择单元1033对识别图块进行处理。

在图像识别处理的过程中，有些识别图块可能会存在信息不全、分辨率较低、局部残缺等，此时服务器一侧可以根据识别图块的图像识别处理结果在数据库中进一步的进行匹配，完善、纠正、补充等得到最后的识别出的信息内容。因此，本申请所述一种聊天数据输入装置另一种实施例中，所述识别匹配处理可以包括：

对所述识别图块进行图像识别处理，获取所述识别图块的图像识别内容；

在预设数据库匹配所述图像识别内容，根据匹配结果优化所述图像识别内容，生成优化后的识别匹配结果；

相应的，所述接收服务端返回的识别匹配结果包括接收服务端返回的优化后的识别匹配结果。

如上述实施例中所述的识别图块Block_1划取时最后一个字“份”没有完全包含在内，但通过数据库匹配查询可以得到完整的“北京同仁堂科技发展股份有限公司制药厂”信息，对可能存在的信息缺失、错误进行优化处理。

本申请所述一种聊天数据输入装置另一种实施例中，所述图块识别模块包括：

文本识别模块，用于识别出所述识别图块中的图像数据，并转化为相应的文本信息。本申请所述一种聊天数据输入装置另一种实施例中，所述图块识别模块识别出所述识别图块的信息内容可以包括执行下述中的至少一种处理来获取信息内容：

翻译出所述识别图块中的代码/编码信息；

若识别出的文本信息包含预先设置的需要进行翻译第一语种，则将所述第一语种的文本信息翻译成第二语种的文本信息；

获取设置在所述识别图块中的隐藏信息。

本申请所述装置的另一种实施例应用场景中，如果识别出多种类型的信息内容，则另一种实施方式中可以让用户选择需要作为输入数据的信息内容种类。图13是本申请所述一种聊天数据输入装置一种实施例的模块结构示意图，如图13所示，

所述信息输入模块104可以包括：

输入信息选择模块1041，可以用于当识别出的信息内容包括多种类型的识别匹配结果时，为用户提供不同类型识别匹配结果的选项；以及，获取用户选择的识别匹配结果；

结果输入模块1042，可以用于所述获取的用户选择的识别匹配结果接入到用户的聊天场景中。

本申请所述一种聊天数据输入装置另一种实施例中所述信息输入模块104可以包括下述中的至少一种模块：

缓存输入模块，可以用于将所述识别出的信息内容作为缓存数据存储，基于用户的粘贴指令将缓存数据发送到聊天场景的文本编辑框中；

第一方式输入模块，可以用于将所述识别出的信息内容作为已输入到当前聊天场景中文本编辑框内的消息内容；

第二方式输入模块，可以用于将所述识别出的信息内容作为用户的聊天场景中已发送出去的消息内容；

收藏栏模块，可以用于将所述识别出的信息内容添加到用户的信息收藏栏。

上述中所述的信息收藏栏可以包括用户的表情栏，存储用户表情信息的同时可以同时或者分组存储通过待识别图片获取的信息内容，也可以包括采用单独的功能模块进行存储。

本申请的实施例中，识别出的信息内容可以接入到用户的聊天场中，具体的实现方式上可以包括将识别出的信息内容复制粘贴到用户当前聊天场景中对话界面的输入信息编辑框中。此时，用户可以通过点击信息发送按钮将包括识别出的所述信息内容的聊天数据发送出去。当然，用户也可以在聊天场景的输入信息编辑框中对所述识别出的信息内容进行编辑处理等。另一种实施例中，也可以在聊天场景中直接将识别出的信息内容直发送出去，成为用户已发送出去的聊天信息。当然，将识别出的信息内容接入到用户的聊天场景中的实施方式还可以包括其他设计方式，如添加到表情库等，具体的可以根据需求进行设计，实现用户的便利、快捷、辅助、灵活的信息输入。

在实际终端如手机中，用户可以在终端屏幕上直接通过手指连续滑动选定一块识别图块。本申请其他的实施方式中并不仅限于此，在其他实施例中用户也可以通过触摸笔、激光笔、磁/光感应笔等物理工具方式直接或间接在待识别图片上划取识别图块。因此，所述装置的另一种实施例中，所述划取操控指令可以包括采用下述中的至少一种实施方式作用在待识别图片上产生的指令数据：

通过用户在触摸屏上与待识别图片的肢体触碰划取识别区域；

用户使用触摸笔、激光笔、磁/光感应笔、肢体感应方式划取识别区域；

使用提供的虚拟划取工具划取识别区域。

其中，所述的手指触摸划取可以包括直接用手指划取，也可以使用提供的虚拟画笔、首尾(或多个)定位光标、模拟鼠标等工具在待识别图片上划取区域。

本申请提供的上述各个实施例所示的聊天数据输入装置，可以在聊天场景中通过拍照等获取待识别图片，将用户划图识别出的信息接入到聊天场景中，实现图像数据的文本转换，生僻字识别、编码/代码识别、翻译、隐含信息等输入辅助，帮助用户实现通过图片的快速信息输入，并辅助信息输入，提供灵活多样的远程信息识别、多类型信息选择输入等，大大提高即时通信应用的聊天信息输入便利性，提高用户体验。

如前所述，本申请提供的聊天数据输入方法或装置可以用于手机、平板、PC、服务器、PDA等多种终端设备中即时通信应用中的信息输入，可以集成在即时通信应用的功能组件中(如应用程序模块)，帮助用户实现通过图片方式的快速信息输入，提高用户即时通信应用或终端的使用体验。因此，本申请还提供一种通讯终端，具体的，一种实施例中，所述通讯终端可以包括处理单元，其中，

所述处理单元可以被设置成，可以用于获取选取的待识别图片；还可以用于接收在所述待识别图片上的划取操控指令，确定所述待识别图片中的识别图块；还可以用于识别出所述识别图块的信息内容，并将所述识别出的信息内容发送到通信界面指定区域位置。

在实施本申请的一些应用场景中，用户使用通信终端进行聊天时，往往是随机性的希望将实物上的某些信息作为聊天信息输入，或者偶尔遇到生僻字或者无法识别的外文、图标、编码等。在这些应用场景下，用户通常可以采取用终端如手机摄像头对实物进行拍照，然后涂抹划取照片上需求识别的生僻字或者复制下来的一段文本信息等等。因此，本申请还提供一种尤其是使用拍摄装置拍照获取待处理图片进行聊天信息输入的通信终端，用户同拍照获取图片，然后划取图块，转换为文本、翻页、解码等，可以帮助用户快速输入，并且输入方式便捷、灵活，用户的信息输入体验效果提升明显。具体的，本申请提供的一种通讯终端的一种实施例中，所述通讯终端可以包括拍摄装置和处理器，其中，

所述即使通信终端基于用户的触发指令打开拍摄装置，响应用户的图片拍摄指令；

图14是本申请提供的聊天场景中聊天数据输入聊天数据的一种即时通讯终端示意图。

尽管本申请内容中提到不同的待处理图片获取方式、在图片上涂抹划取识别图块、数据库匹配识别、图像识别、识别信息接入到用户场景的各种时序方式、消息发送/接收/判断的信息交互方式等的描述，但是，本申请并不局限于必须是数据库数据存储规则、行业通信标准、图像识别技术标准或实施例所描述的情况等，某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、存储、判断、处理方式等获取的实施例，仍然可以属于本申请的可选实施方案范围之内。

虽然本申请提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或客户端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。

上述实施例阐明的单元、装置或模块等，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，移动终端，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例采用递进的方式描述，各个实施例之间相同或相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

虽然通过实施例描绘了本申请，本领域普通技术人员知道，本申请有许多变形和变化而不脱离本申请的精神，希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金雯彬
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：计算方法和计算设备与流程
上一篇：一种“杏仁形”Mn2O3/C颗粒的制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。