一种图像识别方法及用户终端的制作方法

文档序号:6510367阅读:156来源:国知局
一种图像识别方法及用户终端的制作方法
【专利摘要】本发明实施例公开了一种图像识别方法及用户终端,本发明实施例方法包括:用户终端检测用户在图像上进行标记的操作,然后确定用户在图像上的标记的区域,用户终端识别标记的区域的标记内容,然后放大显示标记内容,能够对用户感兴趣的内容进行放大显示。
【专利说明】一种图像识别方法及用户终端

【技术领域】
[0001]本发明涉及通信领域,尤其涉及一种图像识别方法及用户终端。

【背景技术】
[0002]通常,人们在看书、报纸或者大街上的广告语的时候,看见自己感兴趣的内容会想要存储下来,特别是在室外时,没有纸笔无法记录下来。
[0003]现有的光学字符识别(OCR, Optical Character Recognit1n)技术,可以将文本内容透过光学仪器,如影像扫描仪、传真机或任何摄影器材,将影像转入计算机、手机等终端,然后对文本内容进行识别进而显示在计算机、手机等终端中,然而,由于终端设备的屏幕较小,所需显示的一页内容又较多,无法清晰查看用户较为关注的内容。


【发明内容】

[0004]本发明提供一种图像识别方法及用户终端,能够解决用户无法清晰查看较为关注的内容。
[0005]第一方面,提供了一种图像识别方法,包括:
[0006]所述用户终端检测所述用户在所述图像上进行标记的操作;
[0007]所述用户终端确定所述用户在所述图像上的标记的区域;
[0008]所述用户终端识别所述标记的区域的标记内容;
[0009]所述用户终端放大显示所述标记内容。
[0010]结合第一方面,在第一方面的第一种实施方式中,所述用户终端确定用户在所述图像上的标记的区域的具体步骤包括:
[0011]所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域。
[0012]结合第一方面的第一种实施方式,在第一方面的第二种实施方式中,所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域的具体步骤包括:
[0013]若所述标记的轨迹为封闭轨迹,所述用户终端确定封闭轨迹内的区域为所述标记的区域。
[0014]结合第一方面的第一种实施方式,在第一方面的第三种实施方式中,所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域的具体步骤包括:
[0015]若所述标记的轨迹为封闭轨迹,所述用户终端确定封闭轨迹内的区域为所述标记的区域。
[0016]第二方面,提供了一种用户终端,所述用户终端包括:
[0017]检测单元,用于检测所述用户在所述图像上进行标记的操作;
[0018]确定单元,用于确定所述用户在所述图像上的标记的区域;
[0019]识别单元,用于识别所述标记的区域的标记内容;
[0020]显示控制单元,用于控制显示器放大显示所述标记内容。
[0021]结合第二方面,在第二方面的第一种实施方式中,包括:
[0022]所述确定单元,用于通过所述标记的轨迹坐标确定所述图像的所述标记的区域。
[0023]结合第二方面的第一种实施方式,在第二方面的第二种实施方式中,包括:
[0024]所述确定单元,用于所述标记的轨迹为封闭轨迹,所述用户终端确定封闭轨迹内的区域为所述标记的区域。
[0025]结合第二方面的第一种实施方式,在第二方面的第三种实施方式中,包括:
[0026]所述确定单元,用于所述标记的轨迹为非封闭轨迹,所述用户终端确定非封闭轨迹的上方为所述标记的区域。
[0027]结合第二方面,或第二方面的第一种实施方式,或第二方面的第二种实施方式,或第二方面的第三种实施方式,在第二方面的第四种实施方式中,所述显示控制单元包括:
[0028]摘取模块,用于将识别得到的所述标记内容进行摘取;
[0029]处理模块,用于对摘取到的所述标记内容进行处理,并保存处理后的所述标记内容;
[0030]显示控制模块,用于控制所述显示器对处理后的所述标记内容进行放大显示。
[0031]从以上技术方案可以看出,本发明实施例具有以下优点:
[0032]本发明实施例中,用户终端检测用户在图像上进行标记的操作,然后确定用户在图像上所做的标记的区域,用户终端对标记的区域中的标记内容进行识别,然后对识别后的标记内容进行放大显示,能够对用户感兴趣的内容进行放大显示。

【专利附图】

【附图说明】
[0033]图1为本发明实施例中图像识别方法一个实施例示意图;
[0034]图2为本发明实施例中图像识别方法另一实施例示意图;
[0035]图3为本发明实施例中用户终端一个实施例结构参考图;
[0036]图4为本发明实施例中用户终端另一实施例示意图;
[0037]图5为本发明实施例中用户终端的另一实施例示意图。

【具体实施方式】
[0038]本发明实施例提供一种图像识别方法及用户终端,能够实现用户终端只对标记的区域内的标记内容放大显示。
[0039]请参照图1,本发明实施例中图像识别方法一个实施例包括:
[0040]101、用户终端检测用户在图像上进行标记的操作;
[0041]本实施例中,用户终端可以检测用户在图像上进行标记的操作,用户可以通过手指在图像上做标记,也可以通过手写笔在图像上做标记,此处不做限定,该图像的获取方式不做限定,可以是用户终端通过摄像头拍摄后生产的图像,也可以为用户终端从其它电子设备下载的图像。
[0042]102、用户终端确定用户在图像上标记的区域;
[0043]本实施例中,在步骤101检测用户在图像上进行标记之后,用户终端可以确定用户在图像上所做的标记的区域。
[0044]103、用户终端识别标记的区域的标记内容;
[0045]本实施例中,用户终端在确定标记的区域后,可以识别标记的区域的标记内容,使得用户可以通过用户终端的屏幕查看识别得到的标记内容。
[0046]104、用户终端放大显示标记内容。
[0047]本实施例中,用户终端可以对在步骤103中识别后的标记内容放大显示在用户终端的屏幕上。
[0048]本实施例中,用户终端检测用户在图像上进行标记,然后确定用户在图像上所做的标记的区域,用户终端识别标记的区域的标记内容,然后放大显示识别后的标记内容,实现了用户终端只对标记的区域中的标记内容进行识别,进而能够对用户感兴趣的内容进行放大显示。
[0049]为了便于理解,下面以一具体实例对本发明实施例中的图像识别方法进行描述,请参阅图2,本发明实施例中图像识别方法另一实施例包括:
[0050]201、用户终端检测用户在图像上进行标记的操作;
[0051]本实施例中,用户终端检测用户在图像上进行标记,图像的获取方式可以为用户终端通过摄像头拍摄后生产的图像,也可以为用户终端从其它电子设备下载的图像,例如,当用户在读书、报纸或者在室外看到广告标语的时候,看到自己感兴趣的文字内容或图案,用户可以向用户终端发出指令,用户终端根据用户的指令进行拍照,并在拍照后生成图像,用户的指令为指示用户终端拍摄用户感兴趣的文字内容或图案,拍照后生成的图像中包含用户感兴趣的文字内容或图案,用户终端可以先将图像显示在用户终端的屏幕上,用户可以在图像上标记出感兴趣的内容,用户在图像上的标记方式不做限定,用户可以通过手指在图像上做标记,也可以通过手写笔在图像上做标记,当然本领域技术人员还可以根据手指和手写笔两种标记方式所显而易见其它标记方式,本实施例中以对文字内容进行标记为例进行说明。
[0052]在实际应用中,用户终端可以开启预设的标记界面来供用户在图像上进行标记,当用户标记完成后,用户可以通过点击“完成”虚拟按键的方式来告知用户终端完成标记,用户也可以通过语音命令来告知用户终端完成标记,此处告知用户终端完成标记的方式不做限定,当然用户终端可以预先设定阈值A,当用户在图像上标记的时间大于或等于该阈值A时,用户终端可以发出提示信息来询问用户是否完成标记。
[0053]202、用户终端通过标记的轨迹坐标确定图像中的标记的区域;
[0054]本实施例中,用户在图像上所做的标记不做限定,可以为直线、或曲线、或椭圆形、或矩形、或圆形,在实际应用中,用户终端识别标记的轨迹为现有技术,由于用户对用户终端的屏幕中的图像进行标记,用户终端可以检测到用户在屏幕上的触摸点,识别出触摸点的轨迹坐标,用户终端通过标记的轨迹坐标确定图像中的标记的区域,若标记的轨迹为封闭轨迹(如,椭圆形、矩形或圆形),用户终端可以预先设定封闭轨迹内的区域为标记的区域,若标记的轨迹为非封闭轨迹(如,直线或曲线),用户终端可以预先设定非封闭轨迹上方为标记的区域,在实际应用中,用户终端可以预先设定最靠近非封闭轨迹上方N行的文字区域作为标记的区域,若图像中包括图案(如,人物、物体)时,用户终端可以提示用户选择封闭轨迹进行标记,当然还可以根据用户的习惯自行设定标记的区域,例如,非封闭轨迹的下方为标记的区域。
[0055]203、用户终端识别标记的区域的标记内容;
[0056]本实施例中,以标记内容为文字为例,用户终端可以通过OCR仅识别标记的区域的标记内容,OCR技术是通过检查纸上打印的字符,并检测暗、亮的模式确定字符的形状,然后用字符识别方法将形状翻译成计算机文字的技术,OCR具体的实现方式为公知技术,此处不做详述。
[0057]204、用户终端将识别得到的标记内容进行摘取;
[0058]205、用户终端对摘取到的标记内容进行处理,并保存处理后的标记内容;
[0059]206、用户终端放大显示标记内容。
[0060]本实施例中,用户终端对步骤203中得到的标记内容进行摘取,若标记内容为文字,则对摘取到的标记内容进行重新排版,将重新排版后的标记内容进行保存并向用户进行显示,若标记内容为图案,则对该图案的大小、色调等参数进行处理,然后用户终端放大显示处理后的标记内容,在实际应用中,用户可以将保存在用户终端中的标记内容分享给其它用户。
[0061]本实施例中,用户终端检测用户在图像上进行标记的操作,用户终端通过标记的轨迹坐标确定图像中的标记的区域,用户终端识别标记的区域的标记内容,用户终端将识别得到的标记内容进行摘取,用户终端对摘取到的标记内容进行处理,并保存处理后的标记内容,用户终端对处理后的标记内容进行显示,实现了用户终端只对标记的区域内的标记内容放大显示,进而方便用户查看感兴趣的内容,而且用户终端将摘取到的标记内容进行保存可以有效的节省了存储的空间,进而使用户随时都可以查找自己感兴趣的内容并分享给其它用户。
[0062]下面对用于执行上述图像识别方法的本发明实施例的用户终端进行说明,其基本逻辑结构参考图3,本发明实施例中用户终端一个实施例包括:
[0063]检测单元301、确定单元302、识别单元303和显示控制单元304 ;
[0064]检测单元301,用于检测用户在图像上进行标记的操作;
[0065]确定单元302,用于确定用户在图像上的标记的区域;
[0066]识别单元303,用于识别标记的区域的标记内容;
[0067]显示控制单元304,用于控制显示器放大显示识别后的标记内容。
[0068]本实施例中,检测单元301检测用户在图像上进行标记的操作,确定单元302确定用户在图像上标记的区域,识别单元303识别标记的区域的标记内容,显示控制单元304控制显示器放大显示识别单元303识别后的标记内容,实现了用户终端只对标记的区域的标记内容进行识别,进而能够对用户感兴趣的内容进行放大显示。
[0069]为了更好的理解上述的实施例,下面以具体实施例对用户终端中包括的各个模块及单元间的交互对用户终端中的数据交互方式进行说明,请参阅图4,本发明实施例中用户终端的另一实施例包括:
[0070]检测单元401、确定单元402、识别单元403、显示控制单元404 ;
[0071]其中显示控制单元404包括:摘取模块4041、处理模块4042和显示控制模块4043 ;
[0072]检测单元401检测用户在图像上进行标记,在实际应用中,图像的获取方式可以为通过摄像头拍摄后生产的图像,也可以为用户终端从其它电子设备下载的图像,例如,当用户在读书、报纸或者在室外看到广告标语的时候,看到自己感兴趣的文字内容或图案,用户可以向用户终端发出指令,用户终端根据用户的指令进行拍照,并在拍照后生成图像,用户的指令为指示用户终端拍摄用户感兴趣的文字内容或图案,拍照后生成的图像中包含用户感兴趣的文字内容或图案,用户终端可以先将图像显示在用户终端的屏幕上,用户可以在图像上标记出感兴趣的文字内容,用户在图像上的标记方式不做限定,用户可以通过手指在图像上做标记,也可以通过手写笔在图像上做标记,当然本领域技术人员还可以根据手指和手写笔两种标记方式所显而易见其它标记方式,检测单元401可以告知确定单元402检测完毕,并将图像发送至确定单元402 ;
[0073]确定单元402通过标记的轨迹坐标确定图像的标记的区域,其中用户在图像上的标记不做限定,可以为直线、或曲线、或椭圆形、或矩形、或圆形,在实际应用中,标记的区域识别标记的轨迹为现有技术,由于用户对用户终端的屏幕中的图像进行标记,确定单元402可以检测到用户的触摸点,识别出触摸点的轨迹坐标,然后确定单元402通过标记的轨迹坐标确定图像中的标记的区域,若标记的轨迹为封闭轨迹(如,椭圆形、矩形或圆形),确定单元402确定封闭轨迹内的区域为标记的区域,若标记的轨迹为非封闭轨迹(如,直线或曲线),确定单元402确定非封闭轨迹上方为标记的区域,在实际应用中,确定单元402确定最靠近非封闭轨迹上方N行的文字区域作为标记的区域,若图像中包括图案(如,人物、物体)时,可以提示用户选择封闭轨迹进行标记,当然还可以根据用户的习惯自行设定标记的区域,例如,非封闭轨迹的下方为标记的区域,确定单元402将确定后的图像发送至识别单元403,并告知识别单元403图像中的标记的区域;
[0074]识别单元403识别标记的区域的标记内容,若标记内容为文字时,可以通过OCR仅识别标记的区域的标记内容,OCR技术是通过检查纸上打印的字符,并检测暗、亮的模式确定字符的形状,然后用字符识别方法将形状翻译成计算机文字的技术,OCR具体的实现方式为公知技术,此处不做详述,识别单元403发送图像至摘取模块4041,并将识别出的标记内容告知摘取模块4041 ;
[0075]摘取模块4041对图像中的标记的区域中的标记内容进行摘取,并将摘取到的标记内容发送至处理模块4042 ;
[0076]若标记内容为文字,处理模块4042对摘取到的标记内容进行重新排版,将重新排版后的标记内容进行保存并向用户进行显示,若标记内容为图案,处理模块4042对该图案的大小、色调等参数进行处理,处理模块4042保存处理后的标记内容,在实际应用中,用户可以将保存在用户终端中的标记内容分享给其它用户,处理模块4042将处理后的标记内容发送至显示控制模块4043 ;
[0077]显示控制模块4043控制显示器放大显示处理后的标记内容。
[0078]本实施例中,检测单元401检测用户在图像上进行标记的操作,确定单元402通过标记的轨迹坐标确定图像的标记的区域,识别单元403识别标记的区域的标记内容,摘取模块4041将识别得到的标记内容进行摘取,处理模块4042对摘取到的标记内容进行处理,并保存处理后的标记内容,显示控制模块4043控制显示器放大显示处理后的标记内容,实现了用户终端只对标记的区域内的标记内容放大显示,进而方便用户查看感兴趣的内容,而且用户终端通过处理模块4042将摘取到的标记内容进行保存可以有效的节省了存储的空间,进而使用户随时都可以查找自己感兴趣的内容并分享给其它用户。
[0079]下面对本发明实施例中用户终端的进一步说明,请参阅图5,本发明实施例中用户终端另一实施例包括:处理器501、用于生产图像的摄像头502、显示器503以及用于存储图像的存储器504。
[0080]处理器501检测用户在图像上进行标记的操作,确定用户在图像上的标记的区域,然后识别标记的区域的标记内容;
[0081]显示器503放大显示标记内容。
[0082]所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0083]以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【权利要求】
1.一种图像识别方法,其特征在于,包括: 所述用户终端检测所述用户在所述图像上进行标记的操作; 所述用户终端确定所述用户在所述图像上的标记的区域; 所述用户终端识别所述标记的区域的标记内容; 所述用户终端放大显示所述标记内容。
2.根据权利要求1所述的方法,其特征在于,所述用户终端确定用户在所述图像上的标记的区域的具体步骤包括: 所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域。
3.根据权利要求2所述的方法,其特征在于,所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域的具体步骤包括: 若所述标记的轨迹为封闭轨迹,所述用户终端确定封闭轨迹内的区域为所述标记的区域。
4.根据权利要求2所述的方法,其特征在于,所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域的具体步骤包括: 若所述标记的轨迹为非封闭轨迹,所述用户终端确定非封闭轨迹的上方为所述标记的区域。
5.一种用户终端,其特征在于,所述用户终端包括: 检测单元,用于检测所述用户在所述图像上进行标记的操作; 确定单元,用于确定所述用户在所述图像上的标记的区域; 识别单元,用于识别所述标记的区域的标记内容; 显示控制单元,用于控制显示器放大显示所述标记内容。
6.根据权利要求5所述的用户终端,其特征在于, 所述确定单元,用于通过所述标记的轨迹坐标确定所述图像的所述标记的区域。
7.根据权利要求6所述的用户终端,其特征在于, 所述确定单元,用于所述标记的轨迹为封闭轨迹,所述用户终端确定封闭轨迹内的区域为所述标记的区域。
8.根据权利要求6所述的用户终端,其特征在于, 所述确定单元,用于所述标记的轨迹为非封闭轨迹,所述用户终端确定非封闭轨迹的上方为所述标记的区域。
9.根据权利要求5-8任一项所述的用户终端,其特征在于,所述显示控制单元包括: 摘取模块,用于将识别得到的所述标记内容进行摘取; 处理模块,用于对摘取到的所述标记内容进行处理,并保存处理后的所述标记内容; 显示控制模块,用于控制所述显示器对处理后的所述标记内容进行放大显示。
【文档编号】G06K9/00GK104424472SQ201310400604
【公开日】2015年3月18日 申请日期:2013年9月5日 优先权日:2013年9月5日
【发明者】徐丹华, 汪运斌, 龙志明 申请人:华为终端有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1