对象识别方法和装置制造方法

文档序号:6622548阅读:205来源:国知局
对象识别方法和装置制造方法
【专利摘要】本发明公开了一种对象识别方法和装置。其中,方法包括:S1、接收待识别对象的信息,并根据信息获得识别结果;S2、当识别结果不唯一时,基于待识别对象的属性信息提供用于在客户端显示的问题信息;以及S3、接收对问题信息的答复信息,并根据答复信息更新识别结果,重复执行S2,直至识别结果非空且唯一,并提供用于在客户端显示的唯一的识别结果。本发明实施例通过在识别结果不唯一时,基于待识别对象的属性信息提供问题信息,并接收对问题信息的答复信息,以及根据答复信息更新识别结果,直至识别结果非空且唯一,能智能化地与用户进行交互,提高了对待识别对象进行识别的准确率,从而使用户能够简便地获知不熟悉的对象名称及其相关信息。
【专利说明】对象识别方法和装置

【技术领域】
[0001]本发明涉及互联网【技术领域】,尤其涉及一种对象识别方法和装置。

【背景技术】
[0002]在人们日常生活中,花卉随处可见,例如花园里、路边、家里等等。这些花卉美化了人们的生活环境,也愉悦了人们的心情。但是,由于花卉的种类繁多,人们看见了美丽的花卉却不知其名是最常见的事情。目前,当人们看见不认识的花卉时,可以通过拍照的方式将花卉的照片上传至互联网中,利用图像识别技术来获知花卉的名称;也可以通过社交工具例如微博等,发布花卉的照片,以此寻求其他网友的帮助,从而获知花卉的名称。
[0003]但是,在实现本发明过程中,发明人发现现有技术中至少存在如下问题:利用图像识别技术对花卉的特征进行识别,可能会获得多个特征类似的结果,而最终只能向用户返回特征最接近却不一定正确的结果,识别的准确率低;通过社交工具寻求网友帮助的方法,由于网友的水平层次不齐,获得的结果也不一定正确。


【发明内容】

[0004]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种对象识别方法。该方法能够智能化地与用户进行交互,提高对待识别对象进行识别的准确率,使用户能够简单、方便地获知不熟悉的对象名称及其相关信息。
[0005]本发明的第二个目的在于提出一种对象识别装置。
[0006]为了实现上述目的,本发明第一方面实施例的对象识别方法,包括:S1、接收待识别对象的信息,并根据所述信息获得识别结果;S2、当所述识别结果不唯一时,基于所述待识别对象的属性信息提供用于在客户端显示的问题信息;以及S3、接收对所述问题信息的答复信息,并根据所述答复信息更新所述识别结果,重复执行S2,直至所述识别结果非空且唯一,并提供用于在所述客户端显示的唯一的识别结果。
[0007]本发明实施例的对象识别方法,通过在识别结果不唯一时,基于待识别对象的属性信息提供问题信息,并接收对问题信息的答复信息,以及根据答复信息更新识别结果,直至识别结果非空且唯一,能够智能化地与用户进行交互,提高了对待识别对象进行识别的准确率,从而使用户能够简单、方便地获知不熟悉的对象名称及其相关信息。
[0008]为了实现上述目的,本发明第二方面实施例的对象识别装置,包括:第一处理模块,用于接收待识别对象的信息,并根据所述信息获得识别结果;提供模块,用于当所述识别结果不唯一时,基于所述待识别对象的属性信息提供用于在客户端显示的问题信息;以及第二处理模块,用于接收对所述问题信息的答复信息,并根据所述答复信息更新所述识别结果,调用所述提供模块进行处理,直至所述识别结果非空且唯一,并提供用于在所述客户端显示的唯一的识别结果。
[0009]本发明实施例的对象识别装置,通过在识别结果不唯一时,基于待识别对象的属性信息提供问题信息,并接收对问题信息的答复信息,以及根据答复信息更新识别结果,直至识别结果非空且唯一,能够智能化地与用户进行交互,提高了对待识别对象进行识别的准确率,从而使用户能够简单、方便地获知不熟悉的对象名称及其相关信息。

【专利附图】

【附图说明】
[0010]图1是根据本发明一个实施例的对象识别方法的流程图
[0011]图2是根据本发明一个实施例的确定待识别对象不为目标对象的效果示意图。
[0012]图3是根据本发明一个实施例的对象识别方法的效果示意图。
[0013]图4是根据本发明一个实施例的对象识别方法的交互效果示意图一。
[0014]图5是根据本发明一个实施例的对象识别方法的交互效果示意图二。
[0015]图6是根据本发明一个实施例的对象识别装置的结构示意图。

【具体实施方式】
[0016]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0017]下面参考附图描述本发明实施例的对象识别方法和装置。
[0018]图1是根据本发明一个实施例的对象识别方法的流程图,本实施例从搜索引擎侧进行描述。
[0019]如图1所示,对象识别方法包括:
[0020]S1、接收待识别对象的信息,并根据信息获得识别结果。
[0021]在本发明的实施例中,首先搜索引擎可接收待识别对象的信息。其中,该信息可包括但不限于图像信息、语音信息和文字信息中的一种或几种。例如:可接收用户上传的花卉的图像,将其作为待识别对象的信息。
[0022]在接收到待识别对象的信息后,搜索引擎可对信息进行解析。待识别对象的信息如果为图像信息,则可利用图像识别技术进行解析。在对待识别对象的信息进行解析后,搜索引擎可根据获得的解析结果确定待识别对象是否为目标对象。如果确定待识别对象为目标对象,则可获得识别结果。其中,目标对象可以为花卉。
[0023]如果根据解析结果确定待识别对象不为目标对象,则搜索引擎可获得识别信息,并提供用于在客户端显示的识别信息。举例来说,如图2所示,用户的需求是识别花卉的名称,而上传了一张非花卉类别的图像,如乒乓球比赛的图像,则可确定其不是花卉,然后获得识别信息“乒乓球比赛”,并向客户端返回该识别信息,使其在客户端上进行显示。同时,还可在客户端显示“想不想试试我识花的功力,快拍花来! ”提示信息,以提醒用户目标对象是“花卉”,以便用户使用该客户端识别花卉。
[0024]在本发明的实施例中,当识别结果非空且唯一时,搜索引擎可提供用于在客户端显示的识别结果。此时,无需进行多轮交互,可直接获得精准地识别结果,并向客户端返回该识别结果,使其在客户端上显示。
[0025]在获得识别结果时,搜索引擎还可获得待识别对象的相关信息。其中,相关信息可包括描述信息等。举例来说,如图3所示,用户上传的图像信息为一种花卉,可利用图像解析技术对该图像信息进行解析,然后可获得识别结果“秋英”,同时还可获得“秋英”的描述信息,如别名、原产地、生长习性等。
[0026]S2、当识别结果不唯一时,基于待识别对象的属性信息提供用于在客户端显示的问题?目息。
[0027]在本发明的实施例中,当识别结果不唯一时,搜索引擎可基于待识别对象的属性信息提供用于在客户端显示的问题信息。例如:如图4所示,用户上传的图像信息为一种花丼,而识别结果可能为多种特征相似的花卉,则可基于“花卉”具有“花瓣的颜色”这一属性信息,向客户端提供“它的花瓣是什么颜色的? ”问题信息。
[0028]此外,在提供用于在客户端显示的问题信息时,搜索引擎还可基于待识别对象的属性信息提供用于在客户端显示的交互选项信息。
[0029]具体地,搜索引擎可获得识别结果的属性及其属性值,对属性及其属性值进行排序,基于排序结果选取至少一个属性的至少一个属性值作为交互选项信息。例如:“花瓣的颜色”这一属性信息的属性值可包括“绿色”、“紫色”、“白色”、“粉色”、“黄色”、“橘色”等,如图4所示,可将排名最高的前三名“绿色”、“紫色”和“白色”作为交互选项信息,并提供至客户端,使客户端显示上述交互选项信息。
[0030]S3、接收对问题信息的答复信息,并根据答复信息更新识别结果,重复执行S2,直至识别结果非空且唯一,并提供用于在客户端显示的唯一的识别结果。
[0031]在本发明的实施例中,搜索引擎可接收用户在输入框中输入的答复信息,也可以接收用户选中的一个交互选项。应当理解的是,此处用户选中的交互选项信息就是对上述问题的答复。同时,提供交互选项信息的方式为用户提供了可选答案,且用户直接选中目标选项而不需要输入信息,操作更方便。由于交互选项信息是基于排序后的属性及其属性值生成的,所以交互选项信息包含正确答案的概率很高。即使用户的答复信息为“不知道”或“不清楚”这样的模糊答复,仍能保证很高的正确率。
[0032]在接收到答复信息后,搜索引擎可根据答复信息进行进一步地识别,生成新的识别结果。如果新的识别结果仍为多个,则可基于一个新的属性信息,向客户端提供新的问题信息和/或新的交互选项信息,与用户进行进一步地交互,直到识别结果唯一为止。
[0033]例如:如图5所示,经过多次的交互之后,在接收到用户选择的交互选项信息“4月”后,可得知花期为4月,然后可进一步识别,获得唯一的识别结果“洋金花”,同时还可获得“洋金花”的描述信息,如别名、一年生草本植物等。
[0034]在本发明的实施例中,在与用户进行交互的过程中,当识别结果为空时,即客户端没有可以显示的内容时,搜索引擎可提供用于在客户端显示的历史识别结果例如上一轮的识别结果,但上一轮的识别结果为多个。举例来说,如果用户每一轮交互的答复信息均为“不知道”或者经过多轮交互仍无法确定唯一的识别结果时,客户端会显示排名前两位的识别结果或排名前三位的识别结果。此处排名前两位或排名前三位,仅为示例并不进行限定。
[0035]应当理解的是,本实施例中的客户端不仅限于手机客户端。
[0036]本发明实施例的对象识别方法,通过在识别结果不唯一时,基于待识别对象的属性信息提供问题信息,并接收对问题信息的答复信息,以及根据答复信息更新识别结果,直至识别结果非空且唯一,能够智能化地与用户进行交互,提高了对待识别对象进行识别的准确率,从而使用户能够简单、方便地获知不熟悉的对象名称及其相关信息。
[0037]为了实现上述实施例,本发明还提出一种对象识别装置。
[0038]图6是根据本发明一个实施例的对象识别装置的结构示意图。
[0039]如图6所示,对象识别装置包括:第一处理模块110、提供模块120和第二处理模块 130。
[0040]第一处理模块110用于接收待识别对象的信息,并根据信息获得识别结果。
[0041]在本发明的实施例中,第一处理模块110可接收待识别对象的信息。其中,该信息可包括但不限于图像信息、语音信息和文字信息中的一种或几种。例如:可接收用户上传的花卉的图像,将其作为待识别对象的信息。
[0042]在接收到待识别对象的信息后,第一处理模块110可对信息进行解析。待识别对象的信息如果为图像信息,则可利用图像识别技术进行解析。在对待识别对象的信息进行解析后,可根据获得的解析结果确定待识别对象是否为目标对象。如果确定待识别对象为目标对象,则可获得识别结果。其中,目标对象可以为花卉。
[0043]当根据解析结果确定待识别对象不为目标对象时,第一处理模块110还可获得识别信息,并提供用于在客户端显示的识别信息。举例来说,如图2所示,用户的需求是识别花卉的名称,而上传了一张非花卉类别的图像,如乒乓球比赛的图像,则可确定其不是花卉,然后获得识别信息“乒乓球比赛”,并向客户端返回该识别信息,使其在客户端上进行显示。同时,还可在客户端显示“想不想试试我识花的功力,快拍花来! ”提示信息,以提醒用户目标对象是“花卉”,以便用户使用该客户端识别花卉。
[0044]在本发明的实施例中,当识别结果非空且唯一时,第一处理模块110还可提供用于在客户端显示的识别结果。此时,无需进行多轮交互,可直接获得精准地识别结果,并向客户端返回该识别结果,使其在客户端上显示。
[0045]在获得识别结果时,第一处理模块110还可获得待识别对象的相关信息。其中,相关信息可包括描述信息等。举例来说,如图3所示,用户上传的图像信息为一种花卉,可利用图像解析技术对该图像信息进行解析,然后可获得识别结果“秋英”,同时还可获得“秋英”的描述信息,如别名、原产地、生长习性等。
[0046]提供模块120用于当识别结果不唯一时,基于待识别对象的属性信息提供用于在客户端显示的问题信息。
[0047]在本发明的实施例中,当识别结果不唯一时,提供模块120可基于待识别对象的属性信息提供用于在客户端显示的问题信息。例如:如图4所示,用户上传的图像信息为一种花丼,而识别结果可能为多种特征相似的花丼,则可基于“花卉”具有“花瓣的颜色”这一属性信息,向客户端提供“它的花瓣是什么颜色的? ”问题信息。
[0048]此外,在提供用于在客户端显示的问题信息时,提供模块120还可基于待识别对象的属性信息提供用于在客户端显示的交互选项信息。
[0049]具体地,提供模块120可获得识别结果的属性及其属性值,对属性及其属性值进行排序,基于排序结果选取至少一个属性的至少一个属性值作为交互选项信息。例如:“花瓣的颜色”这一属性信息的属性值可包括“绿色”、“紫色”、“白色”、“粉色”、“黄色”、“橘色”等,如图4所示,可将排名最高的前三名“绿色”、“紫色”和“白色”作为交互选项信息,并提供至客户端,使客户端显示上述交互选项信息。
[0050]第二处理模块130用于接收对问题信息的答复信息,并根据答复信息更新识别结果,调用提供模块进行处理,直至识别结果非空且唯一,并提供用于在客户端显示的唯一的识别结果。
[0051]在本发明的实施例中,第二处理模块130可接收用户输入的答复信息,也可以接收用户选中的一个交互选项。应当理解的是,此处用户选中的交互选项信息就是对上述问题的答复。同时,提供交互选项信息的方式为用户提供了可选答案,且用户直接选中目标选项而不需要输入信息,操作更方便。由于交互选项信息是基于排序后的属性及其属性值生成的,所以交互选项信息包含正确答案的概率很高。
[0052]在接收到答复信息后,第二处理模块130可根据答复信息进行进一步地识别,生成新的识别结果。如果新的识别结果仍为多个,则可基于一个新的属性信息,向客户端提供新的问题信息和/或新的交互选项信息,与用户进行进一步地交互,直到识别结果唯一为止。
[0053]例如:如图5所示,经过多次的交互之后,在接收到用户选择的交互选项信息“4月”后,可得知花期为4月,然后可进一步识别,获得唯一的识别结果“洋金花”,同时还可获得“洋金花”的描述信息,如别名、一年生草本植物等。
[0054]在本发明的实施例中,在与用户进行交互的过程中,当识别结果为空时,即客户端没有可以显示的内容时,第二处理模块130可提供用于在客户端显示的历史识别结果例如上一轮的识别结果,但上一轮的识别结果为多个。
[0055]在获得识别结果或历史识别结果时,第二处理模块130还可获得待识别对象的相关信息。其中,相关信息可包括描述信息等。
[0056]本发明实施例的对象识别装置,通过在识别结果不唯一时,基于待识别对象的属性信息提供问题信息,并接收对问题信息的答复信息,以及根据答复信息更新识别结果,直至识别结果非空且唯一,能够智能化地与用户进行交互,提高了对待识别对象进行识别的准确率,从而使用户能够简单、方便地获知不熟悉的对象名称及其相关信息。
[0057]在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0058]此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,
三个等,除非另有明确具体的限定。
[0059]流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属【技术领域】的技术人员所理解。
[0060]在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPR0M或闪速存储器),光纤装置,以及便携式光盘只读存储器(⑶ROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0061]应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0062]本【技术领域】的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0063]此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0064]上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
【权利要求】
1.一种对象识别方法,其特征在于,包括: 51、接收待识别对象的信息,并根据所述信息获得识别结果; 52、当所述识别结果不唯一时,基于所述待识别对象的属性信息提供用于在客户端显示的问题信息;以及 53、接收对所述问题信息的答复信息,并根据所述答复信息更新所述识别结果,重复执行S2,直至所述识别结果非空且唯一,并提供用于在所述客户端显示的唯一的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述信息获得识别结果,包括: 对所述信息进行解析,若根据解析结果确定所述待识别对象为目标对象,则获得所述识别结果。
3.根据权利要求1所述的方法,其特征在于,还包括: 当所述识别结果非空且唯一时,提供用于在所述客户端显示的所述识别结果。
4.根据权利要求1所述的方法,其特征在于,在所述基于所述待识别对象的属性信息提供用于在客户端显示的问题信息时,还包括: 基于所述待识别对象的属性信息提供用于在客户端显示的交互选项信息。
5.根据权利要求4所述的方法,其特征在于,所述基于所述待识别对象的属性信息提供用于在客户端显示的交互选项信息,包括: 获得所述识别结果的属性及其属性值,对所述属性及其属性值进行排序,基于排序结果选取至少一个属性的至少一个属性值作为所述交互选项信息。
6.根据权利要求1所述的方法,其特征在于,在所述执行S3的过程中,还包括: 当所述识别结果为空时,提供用于在所述客户端显示的历史识别结果。
7.根据权利要求1所述的方法,其特征在于,所述信息包括图像信息、语音信息和文字信息中的一种或多种。
8.根据权利要求2所述的方法,其特征在于,在所述对所述信息进行解析之后,还包括: 若根据解析结果确定所述待识别对象不为所述目标对象,则获得识别信息;以及 提供用于在所述客户端显示的所述识别信息。
9.根据权利要求1-8任一权利要求所述的方法,其特征在于,在所述提供用于在所述客户端显示的所述识别结果或所述历史识别结果时,还包括: 获得所述待识别对象的相关信息,所述相关信息包括描述信息;以及 提供用于在所述客户端显示的所述相关信息。
10.一种对象识别装置,其特征在于,包括: 第一处理模块,用于接收待识别对象的信息,并根据所述信息获得识别结果; 提供模块,用于当所述识别结果不唯一时,基于所述待识别对象的属性信息提供用于在客户端显示的问题信息;以及 第二处理模块,用于接收对所述问题信息的答复信息,并根据所述答复信息更新所述识别结果,调用所述提供模块进行处理,直至所述识别结果非空且唯一,并提供用于在所述客户端显示的唯一的识别结果。
11.根据权利要求10所述的装置,其特征在于,所述第一处理模块,具体用于: 对所述信息进行解析,若根据解析结果确定所述待识别对象为目标对象,则获得所述识别结果。
12.根据权利要求10所述的装置,其特征在于,所述第一处理模块,还用于: 当所述识别结果非空且唯一时,提供用于在所述客户端显示的所述识别结果。
13.根据权利要求10所述的装置,其特征在于,所述提供模块,还用于: 在所述基于所述待识别对象的属性信息提供用于在客户端显示的问题信息时,基于所述待识别对象的属性信息提供用于在客户端显示的交互选项信息。
14.根据权利要求13所述的装置,其特征在于,所述提供模块,具体用于: 获得所述识别结果的属性及其属性值,对所述属性及其属性值进行排序,基于排序结果选取至少一个属性的至少一个属性值作为所述交互选项信息。
15.根据权利要求10所述的装置,其特征在于,所述第二处理模块,还用于: 当所述识别结果为空时,提供用于在所述客户端显示的历史识别结果。
16.根据权利要求10所述的装置,其特征在于,所述信息包括图像信息、语音信息和文字信息中的一种或多种。
17.根据权利要求11所述的装置,其特征在于,所述第一处理模块,还用于: 在所述对所述信息进行解析之后,若根据解析结果确定所述待识别对象不为所述目标对象,则获得识别信息,并提供用于在所述客户端显示的所述识别信息。
18.根据权利要求10-17任一权利要求所述的装置,其特征在于,所述第一处理模块和/或所述第二处理模块,还用于: 在所述提供用于在所述客户端显示的所述识别结果或所述历史识别结果时,获得所述待识别对象的相关信息,所述相关信息包括描述信息,并提供用于在所述客户端显示的所述相关信息。
【文档编号】G06F17/30GK104166703SQ201410381961
【公开日】2014年11月26日 申请日期:2014年8月5日 优先权日:2014年7月15日
【发明者】汪冠春, 李彦宏, 王海峰, 吴华, 丁长林, 李静 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1