使用语音标签管理图像的方法和装置的制造方法_4

文档序号:9750843阅读:来源:国知局
部接收(I)语音数据,(2)第一元数据信息,或(3)与从语音数据和/或第一元数据信息生成的第二元数据信息链接的一个或多个图像或视频。
[0112]作为附加的或一般的例示,电子设备101可以包括:被配置为获得关于特定图像300的语音数据的语音输入模块152 ;以及被配置为分析语音数据以确定特定图像300的至少一个元数据信息320的控制模块120。这里,控制模块120可以从多个图像当中相对于至少一个关联图像,将语音数据注册为语音标签,其中,所述至少一个关联图像满足相对于特定图像300或所确定的元数据信息320的特定参考。根据本公开的各种实施例,多个元数据信息320可以包括关于捕获特定图像300的位置或时间的信息、关于捕获特定图像300的设备的信息或者关于特定图像300的拍摄模式的信息中的至少一个。
[0113]根据本公开的各种实施例,电子设备101还可以包括拍摄模块。如果由拍摄模块180捕获特定图像300,则控制模块120可以被配置为激活语音输入模块,以指导获得语音数据。
[0114]此外,如果选择特定图像300,则控制模块120可以被配置为提供用于引导获得语音数据的用户界面(UI),以便相对于所述至少一个图像连同语音标签一起注册通过将语音数据转换成文本而获得的文本标记,或者使用出现在特定图像300的对象来分析语音数据。
[0115]根据本公开的各种实施例,控制模块120可以基于语音数据的分析结果与多个信息中的每一个之间的关系,确定关于位置、时间、拍摄设备和拍摄模式的信息当中的元数据信息320的至少一部分。在这种情况下,控制模块120可以将多个图像当中的、包括属于距特定图像300的位置特定范围内的位置信息作为元数据信息320的图像确定为至少一个关联图像,并且可以将多个图像当中的、包括属于从特定图像300的时间开始的特定范围内的时间信息作为元数据信息320的图像确定为至少一个关联图像,或者可以将多个图像当中的、包括与特定图像300的时间有特定关系的位置信息作为元数据信息320的图像确定为至少一个关联图像。同时,控制模块120可以将多个图像当中的、相对于特定图像300具有阈值或以上的相似性的图像确定为至少一个关联图像。
[0116]此外,根据本公开的各种实施例,多个图像中的至少一部分可以存储在与电子设备101在功能上连接的外部设备上,而且电子设备101还可以包括与外部设备通信的通信丰旲块。
[0117]同时,根据本公开的各种实施例的电子设备101可以提供使用语音标的搜索功能。电子设备101可以包括存储器130,被配置为获得语音数据的语音获得模块152、和被配置为基于所获得的语音数据从多个图像或者视频中搜索至少一个图像的处理器120。存储器130可以包括指令,所述指令当由处理器120运行时使得电子设备101发现并且提供
(I)与多个图像或视频的对应于语音数据的语音标签链接的,(2)基于语音数据与第一元数据信息链接的,或(3)与从语音数据和/或第一元数据信息生成的第二元数据信息链接的图像或视频的至少一个图像。此外,多个图像或视频中的至少一部分可以存储在与电子设备101在功能上连接的外部设备上。而且,在电子设备101还包括通信模块的情况下,存储器还可以包括指令,使得有可能向外部设备发送基于语音数据的用于调用图像或视频搜索结果的请求,并且提供从外部设备接收到的搜索结果的至少一部分。
[0118]下面,将描述根据本公开的各种实施例的语音标签注册方法。以下方法可以由电子设备(例如,电子设备101)运行。此外,所示流程图中所公开的顺序可以遵循逻辑流,而不是时间顺序,并且各个操作可以在相同的时间执行,除非在逻辑上发生冲突,或者可以根据任何其他顺序执行。而且,参照图1和图5描述的各种修改和扩展可以应用于以下方法。
[0119]图6是示意性地示出根据本公开的各种实施例的语音标签注册方法的图。
[0120]在操作610中,电子设备101可以获取关于特定图像(例如,特定图像300)的语音数据。例如,输入/输出接口 150或语音输入模块152可以获取用户发声作为语音数据。此外,在显示其中注册了语音标签的图像、或者在其中注册了语音标签的图像中选择了语音标签图标(例如,图2中的语音标签图标241等)的情况下,电子设备101可以获取存储在存储器130上的对应于语音标签的语音数据。
[0121]操作610可以在用户拍摄对象(例如,图2的屏幕210等)之后执行,或者可以在用户在图库应用中选择特定图像(例如,图2的屏幕250等)之后执行。
[0122]在操作620中,电子设备101 (或电子设备101的处理器120)可以基于语音数据确定元数据信息320。特定图像可以具有多条元数据信息320,并且电子设备101可以分析语音数据,以便从多条元数据信息320当中确定被确定为与语音数据相关联的至少一条元数据信息320。例如,参照图3描述的元数据信息320确定方法可以应用于操作620。
[0123]在操作630中,电子设备101可以使用包括在特定图像300中的对象或出现在特定图像中的目标信息(例如,图像信息310)和/或在操作620中确定的至少一条元数据信息320,来确定被确定为与特定图像300相关联的关联图像。
[0124]在操作630中,可以使用各种参考来确定关联图像。例如,可以使用诸如图像之间的恒定等级的相似性、元数据信息320的一致性、相似性、关系满足性等的参考。在这种连接下,参照图3和图4描述的参考和条件可以应用于操作630。
[0125]在操作640中,电子设备101可以在操作630中被确定为关联图像的图像中,将在操作610中获得的语音数据注册为语音标签。在其中注册了语音标签的图像可以与指示注册了语音标签的图标(例如,图2的语音输入图标241) —起显示。
[0126]根据本公开的各种实施例,可以在一个图像中注册多个语音标签。例如,可以在其中注册了语音标签的图像上相对于任何其他语音输入再次执行操作610、620、630和640,从而可以注册任何其他语音标签。在其中注册了多个标签的图像可以包括诸如图标241的多个标记。
[0127]根据本公开的各种实施例,电子设备101可以在操作610中连续获得语音输入(例如,“夏天”的语音输入或“海”的语音输入),并且可以在使用基于每个语音输入确定的元数据信息320 (例如,时间信息或者位置信息)确定的关联图像(例如,关联图像组A或关联图像组B)中注册各语音标签(例如,“夏天”和“海”)。根据本公开的一些实施例,电子设备101可以在操作610中获得语音输入(例如,“夏天海”),可以通过含义或者通过字划分所获得的语音输入以确定元数据信息320,并且可以使用所划分的语音输入确定关联图像以注册语音标签(“夏天海”)。在这种情况下,即使使用“夏天”、“海”或“夏天海”来执行搜索操作,也可以提供具有“夏天海”的语音标签的图像作为搜索结果。
[0128]图7是示意性地示出根据本公开的各种实施例的使用参数优先级来确定关联图像的方法的图。在与图7和图8至图10相关联的描述中,与以上描述重复或类似的描述可以省略。
[0129]在操作710中,电子设备101可以获得关于特定图像300的语音数据。在操作720中,电子设备101可以基于所获得的语音数据确定元数据信息320。操作710和操作720可以对应于图6的操作610和操作620。
[0130]在操作730中,电子设备101可以确定图像信息和元数据信息320的优先级。例如,图4的实施例可以被理解为,关联图像是在位置信息的优先级高于图像信息的优先级的条件下确定的。
[0131]图像信息和多条元数据信息320可以被理解为用于确定关联图像的参数。电子设备101可以确定每个参数的优先级。在确定(多个)关联图像时可以向参数应用不同的参考。例如,根据图像处理确定相似性可以应用于图像信息作为参考,并且确定是否具有作为元数据信息320的日期可以应用于时间信息作为参照。
[0132]在操作740中,电子设备101可以根据优先级通过应用参数确定关联图像。例如,电子设备101可以通过应用最高优先级的参数以及与其有关的确定参考,从多个存储的图像当中确定被确定为与特定图像300相关联的关联图像的候选(以下称为“关联图像候选”)。
[0133]在操作750中,电子设备101可以确定在操作740中确定的关联图像,S卩,关联图像候选是否满足特定范围。特定范围可以提供用户的输入或电子设备101的设置(其可以是预先确定的)来确定。例如,电子设备101可以确定关联图像候选的数目是否小于参考值(例如,15)。如果关联图像候选的数目满足特定范围(例如,13),则关联图像候选可以被确定为关联图像。在操作770,电子设备101可以在关联图像(在这种情况下,与关联图像候选相同)处,将在操作710中获得的语音数据输入作为语音标签。
[0134]如果关联图像候选的数目不满足特定范围(例如,49),则在操作760中,电子设备101可以确定第二优先级的参数。在操作740中,电子设备101可以相对于所确定的参数(第二优先级的参数)再次确定关联图像。根据确定结果确定的关联图像候选(第二)可以满足最高优先级的参数的条件和第二优先级的参数的条件二者。电子设备101可以重复操作740、操作750和操作760的过程,直到关联图像候选的数目满足特定范围。
[0135]图8是示意性示出根据本公开的各种实施例的使用参数的权重确定关联图像的方法的图。
[0136]在操作810中,电子设备101可以获得关于特定图像的语音数据。在操作820中,电子设备101可以基于所获得的语音数据确定一个元数据信息320的至少一部分。操作810和操作820可以对应于图6的操作610和操作620。
[0137]在操作830中,电子设备101可以确定每个参数的权重。例如,电子设备101可以相对于图像信息来确定为I的权重,并且相对于时间信息确定为0.8的权重。权重可以根据分析在操作810中获得的语音数据的结果或者根据情境来不同地设置。
[0138]在操作840中,电子设备101可以基于所确定的参数和权重来确定关联图像。例如,在图像相对于特定图像(例如,特定图像300)具有80%的相似性、位于距特定图像(例如,特定图像300)的拍摄地点I公里的半径内、并且在与捕获特定图像(例如,特定图像300)时的日期相同的日期捕获的的情况下,可以通过分别将(0.8(80% )*1(权重))的得分应用于图像信息、将(1(位置转换得分)*0.5(权重))的得分应用于位置信息、并且将(I (时间转换得分)*0.8)的得分应用于时间信息来获得总得分2.1。这里,当图像属于距捕获特定图像(例如,特定图像300)的位置I公里内时位置转换得分可以是1,当图像属于距所述位置2公里内时位置转换得分可以是0.8,当图像属于距所述位置3公里内时位置转换得分可以是0.6,当图像属于距所述位置4公里内时位置转换得分可以是0.4,以及当图像距所述位置超过5公里时位置转换得分可以是O。同时,当日期与捕获特定图像(例如,特定图像300)时的日期相同时,时间转换得分可以是1,并且当当日期与捕获特定图像(例如,特定图像300)时的日期不同时,时间转换得分可以是O。每个得分转换方式可以根据用户设置或者语音数据分析结果被不同地设置。例如,如果语音数据分析结果指示语音数据是与位置信息相关联的语音输入(例如,马尔代夫),则高权重可以被设置给元数据信息320的位置信息。如果语音数据分析结果指示语音数据是与时间信息相关联的语音输入(例如,日出),则高权重可以被设置给元数据信息320的时间信息。
[0139]如果确定了作为关联图像候选的每个图像的得分,则电子设备101可以将其得分大于或等于参考得分的图像确定为关联图像。例如,在参考得分是1.5的情况下,电子设备101可以将其得分大于或等于1.5的图像确定为关联图像。如果确定了关联图像,电子设备101可以将在操作810中获得的语音数据注册为语音标签。
[0140]根据本公开的各种实施例,电子设备101可以调整参考得分以改变关联图像的数目。例如,在关联图像的数目被设置为小于或等于20的情况下,满足参考得分的关联图像可以超过20。例如,在关联图像的数目不满足特定范围(例如,小于或等于20)的情况下(操作843),电子设备101可以在操作847中调整(例如,增加)关联图像的确定参考,例如,参考得分,以允许关联图像的数目属于特定范围。在操作847中,电子设备101可以调整关联图像确定参考并且返回到操作841。在操作845中,电子设备101可以将满足最终设置的范围的图像确定为关联图像。在操作850中,电子设备101在关联图像处将语音数据注册为语音标签。
[0141]图9是示意性地示出根据本发明的各种实施例的语音标签注册方法的图。
[0142]在操作910中,电子设备101可以获得关于特定图像300的语音数据。在操作920中,电子设备101可以基于所获得的语音数据确定元数据信息320。操作910和操作920可以对应于图6的操作610和操作620。
[0143]在操作930中,电子设备101可以确定相对于特定图像300具有阈值或以上的相似性的至少一个图像。例如,电子设备101可以基于图像信息310确定多个图像,该多个图像的每个均包括完全类似或类似于特定图像300的对象。
[0144]在操作940中,电子设备101可以从在操作930中确定的多个图像当中确定相对于在操作920中确定的元数据信息320满足特定参考的图像,在操作950中,电子设备101可以在操作940中确定的的图像处将在操作910中获得的语音数据注册为语音标签。
[0145]参照图7或图8描述的使用优先级或权重的语音标签的注册可以通过适合的修改或改变来应用于图9的方法。因为参照图9描述的方法主要使用出现在图像中的对象的相似性(图像的可视信息),所以优先级或权重可以仅应用于在操作920中确定的元数据信息320。
[0146]图10是示意性地示出根据本公开的各种实施例的,在存储在电子设备101和服务器106上的图像处注册语音标签的方法的图。
[0147]—般情况下,由用户终端捕获的图像可以被存储在相同的用户终端中。然而,近来对于在不同位置存储图像和图像信息的兴趣不断增加,例如,使用用户帐户等管理存储在用户终端上的图像、存储在用户的个人计算机(PC)或膝上型计
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1