使用语音标签管理图像的方法和装置的制造方法_6

文档序号:9750843阅读:来源:国知局
1210(例如,程序140)可以包括用于控制与电子设备(例如,电子设备101)相关联的资源的操作系统(OS)和/或在OS上驱动的各种应用(例如,应用程序147) ο例如,OS包括Android、1S、Windows、Symbian、Tizen或 Bada0
[0180]程序模块1210可以包括内核1220、中间件1230、应用编程接口(API) 1260和/或应用1270。程序模块1210中的至少一部分可以被预加载在电子设备上,或者可以是可从外部电子设备(例如,外部电子设备102或104、服务器106等)下载的。
[0181]例如,内核1220(例如,内核141)可以包括系统资源管理器1221或设备驱动程序1223。系统资源管理器1221可以执行系统资源的控制、分配或检索。根据本公开的实施例,系统资源管理器1221可以包括处理管理部件、存储器管理部件或文件系统管理部件。例如,设备驱动器1223可以包括显示驱动器、相机驱动器、蓝牙驱动器、公共存储器驱动器、USB驱动器、键盘驱动器、WiFi驱动器、音频驱动器或进程间通信(IPC)驱动器。
[0182]例如,中间件1230可以提供应用1270共同需要的功能,或者可以通过API 1260向应用1270提供各种功能以使得应用1270有效地使用电子设备的有限系统资源。根据本公开的实施例,中间件1230(例如,中间件143)可以包括运行时间库1235、应用管理器1241、窗口管理器1242、多媒体管理器1243、资源管理器1244、功率管理器1245、数据库管理器1246、分组管理器1247、连接管理器1248、通知管理器1249、位置管理器1250、图形管理器1251、或安全管理器1252中的至少一个。
[0183]例如,运行时库1235可以包括由编译器使用以便当应用1270运行时通过编程语言来添加新功能的库模块。运行时间库1235可以执行输入/输出管理、存储器管理、或关于算术函数的能力。
[0184]例如,应用管理器1241可以管理应用1270当中的至少一个应用的生命周期。窗口管理器1242可以管理在屏幕中使用的⑶I资源。多媒体管理器1243可以识别用于播放各种媒体文件所需的格式,并且可以通过使用适合于所述格式的编解码器来执行媒体文件的编码或解码。资源管理器1244可以管理资源,诸如应用1270中的至少一个应用的存储空间、存储器或源代码。
[0185]例如,功率管理器1245可以与基本输入/输出系统(B1S) —起操作以管理电池或功率,并且提供用于操作电子设备的功率信息。数据库管理器1246可以生成、搜索或修改在应用1270当中的至少一个应用中使用的数据库。分组管理器1247可以安装或更新以分组文件的格式发布的应用。
[0186]例如,连接管理器1248可以管理无线连接,诸如WiFi或蓝牙。通知管理器1249可以以不打扰用户的模式显示或通知事件,诸如到达消息、许诺或接近通知。位置管理器1250可以管理电子设备的位置信息。图形管理器1251可以管理将要提供给用户的图形效果或者管理与其相关的用户界面。安全管理器1252可以提供系统安全性或用户认证所需的一般安全功能。根据本公开的实施例,在电子设备(例如,电子设备101)包括电话功能的情况下,中间件1230可以进一步包括用于管理电子设备的语音或视频呼叫功能的电话管理器。
[0187]中间件1230可以包括组合了上述组件的各种功能的中间件模块。中间件1230可以提供专用于每种OS类型的模块,以提供差异化功能。此外,中间件1230可以动态地移除现有组件的一部分,或者可以向其添加新的组件。
[0188]例如,API 1260(例如,API 145)可以是编程功能的集合,并且被提供为根据OS可变的配置。例如,在OS是Android或1S的情况下,可以允许为每个平台提供一个API1260集合。在OS是Tizen的情况下,可以允许为每个平台提供两个或更多个API 1260集入口 ο
[0189]例如,应用1270(例如,应用程序147)可以包括用于提供功能的一个或多个应用,诸如主页1271、拨号器1272、SMS/MMS 1273、即时消息(頂)1274、浏览器1275、相机1276、闹钟1277、联系人1278、语音拨号器1279、电子邮件1280、日历1281、媒体播放器1282、照片集1283和时钟1284,或者提供健康保健(例如,测量锻炼量或血糖)或环境信息(例如,气压、湿度或温度)。
[0190]根据本公开的实施例,应用1270可以包括用于支持电子设备(例如,电子设备101)和外部电子设备(例如,外部电子设备102或104)之间的信息交换的应用(为了便于描述,以下称为“信息交换应用”)。例如,信息交换应用可以包括用于将特定信息发送到外部电子设备的通知中继应用,或用于管理外部电子设备的设备管理应用。
[0191]例如,信息交换应用可以包括将从其他应用(例如,用于SMS/MMS、电子邮件、卫生保健或环境信息的应用)发生的通知信息发送到外部电子设备(例如,外部电子设备102或104)的功能。此外,信息交换应用可以从外部电子设备接收通知信息,并且可以将通知信息提供给用户。
[0192]例如,设备管理应用可以管理(例如,安装、删除或更新)与电子设备101通信的外部电子设备(例如,外部电子设备102或104)的至少一个功能(外部电子设备本身(或一部分组件)的开启/关闭或者显示器的亮度(或分辨率)的调整),在外部电子设备中运行的应用,或者从外部电子设备提供的服务(例如,呼叫服务或消息服务)。
[0193]根据本公开的实施例,应用1270可以包括根据外部电子设备(例如,外部电子设备102或104)的属性(例如,作为一种电子设备的移动医疗设备的属性)而被分配的应用(例如,卫生保健应用)。根据本公开的实施例,应用1270可以包括从外部电子设备(例如,外部服务器106或电子设备102或104)接收到的应用。根据本公开的实施例,应用1270可以包括预加载的应用或从服务器下载的第三方应用。根据所示的实施例的程序模块1210中的组件的名称可以根据OS的种类而修改。
[0194]根据本公开的各种实施例,程序模块1210的至少一部分可以通过软件、固件、硬件或它们的两个或更多个的组合来实施。例如,程序模块1210的至少一部分可以由处理器(例如,处理器120)实施(例如,运行)。例如,程序模块1210的至少一部分可以包括用于执行一个或多个功能的模块、程序、例程、指令集、进程等。
[0195]在这里使用的术语“模块”可以表示,例如,包括硬件、软件和固件的一个或多个组合的单元。术语“模块”可以与术语“单元”、“逻辑”、“逻辑块”、“组件”或“电路”交换使用。“模块”可以是集成组件的最小单元,或者可以是其一部分。“模块”可以是用于执行一个或多个功能的最小单元或其一部分。“模块”可以机械地或电子地实施。例如,“模块”可以包括执行一些操作的专用IC(ASIC)芯片、现场可编程门阵列(FPGA)和可编程逻辑设备中的至少一个,它们是已公知的或将被开发的。
[0196]例如,根据本公开的各种实施例的装置(例如,其模块或功能)或方法(例如,操作)中的至少一部分可以通过以程序模块的形式存储在计算机可读存储介质中的指令来实施。当一个或多个处理器(例如,处理器120)运行所述指令时,可以使得一个或多个处理器执行与指令相对应的功能。例如,计算机可读存储介质可以是存储器130。
[0197]计算机可读存储介质可以包括硬盘,磁介质,软盘,磁介质(例如,磁带),光学介质(例如,压缩盘只读存储器(⑶-ROM)和数字多功能碟(DVD),磁光介质(例如,可光读盘),和硬件设备(例如,只读存储器(ROM)、随机存取存储器(RAM)、或闪速存储器)。此外,程序指令不仅可以包括由编译器创建的机器代码,而且还可以包括可由计算机使用解释器来运行的高级语言代码。以上硬件单元可以被配置以经由用于执行本公开的操作的一个或多个软件模块来操作,反之亦然。
[0198]例如,计算机可读存储介质可以包括指令,当指令被运行时使得电子设备生成关于相对于第一图像或视频接收到的语音的语音数据,链接语音数据,或者基于语音数据来链接第一元数据信息,确定第二图像或视频与第一图像或视频之间的关系,并且基于所确定的关系的至少一部分将(I)语音数据,(2)第一元数据信息,或(3)从语音数据和/或第一元数据信息生成的第二元数据信息中的至少一个与第二图像或视频链接。此外,可以额外地或者一般地包括用于执行上述方法的指令。
[0199]根据本公开的各种实施例的模块或编程模块可以包括以上元件中的至少一个,或者可以省略以上元件中的一部分,或者还包括附加的其他元件。由根据本公开的各种实施例的模块、编程模块或其他元件执行的操作可以按顺序地、并行地、重复地或启发式方法运行。此外,一部分操作可以以不同的顺序运行,可以被省略,或者可以添加其他操作。
[0200]根据本公开的各种实施例,用户可以使用语音标签管理或搜索存储在电子设备或另一位置(设备)中的多个照片当中的期望照片。例如,用户可以相对于特定照片或者与特定照片有关系的照片来注册语音标签,并且可以使用相应的语音标签来搜索期望照片。
[0201]虽然已经参照本公开的各种示例性实施例示出和描述了本公开,但是本领域术人员应当理解,可以在形式和细节上对其做出各种改变而不脱离由所附权利要求及其等同定义的本公开的精神和范围。
【主权项】
1.一种电子设备,包括: 语音输入模块,被配置为获得用于特定图像的语音数据; 控制模块,被配置为分析语音数据以确定用于特定图像的元数据信息的至少一部分, 其中,所述控制模块被配置为相对于多个图像当中的的至少一个关联图像,将所获得的语音数据注册为语音标签,其中,所述至少一个关联图像满足相对于特定图像和/或相对于所确定的至少一部分元数据信息的特定条件。2.如权利要求1所述的电子设备,其中,所述至少一部分的元数据信息包括以下中的至少一个:关于捕获特定图像的位置或时间的信息、关于捕获特定图像的设备的信息、关于特定图像的拍摄模式的信息。3.如权利要求1或者2所述的电子设备,还包括: 拍摄t吴块, 其中,如果由拍摄模块捕获特定图像,则控制模块被配置为激活语音输入模块,以指导获得语音数据。4.如上述权利要求中的任何一个所述的电子设备,其中,如果选择特定图像,则所述控制模块被配置为提供用于引导获得语音数据的用户界面(UI)。5.如上述权利要求中的任何一个所述的电子设备,其中,所述控制模块被配置为相对于所述至少一个关联图像连同语音标签一起注册通过将语音数据转换成文本所获得的文本标记。6.如上述权利要求中的任何一个所述的电子设备,其中,所述控制模块被配置为使用出现在特定图像中的对象来分析语音数据;和/或 其中,所述控制模块被配置为基于语音数据的分析结果,确定关于位置、时间、捕获特定图像的设备、和拍摄模式的信息当中的元数据信息的至少一部分。7.如上述权利要求中的任何一个所述的电子设备,其中,所述控制模块被配置为将所述多个图像当中的、包括属于在特定图像的位置信息中特定范围内的位置信息作为元数据信息的图像确定为所述至少一个关联图像。8.如上述权利要求中的任何一个所述的电子设备,其中,所述控制模块被配置为将所述多个图像当中的、包括属于在特定图像的时间信息的特定范围内的时间信息作为元数据信息的图像确定为所述至少一个关联图像。9.如上述权利要求中的任何一个所述的电子设备,其中,所述控制模块被配置为将所述多个图像当中的、包括与特定图像的时间信息有特定关系的位置信息作为元数据信息的图像确定为所述至少一个关联图像。10.如上述权利要求中的任何一个所述的电子设备,其中,所述控制模块被配置为将所述多个图像当中的、相对于特定图像满足相似性条件的图像确定为所述至少一个关联图像。11.如上述权利要求中的任何一个所述的电子设备,其中,所述多个图像中的至少一部分被存储在与所述电子设备在功能上连接的外部设备上,而且 其中,所述电子设备还包括: 与所述外部设备通信的通信模块。12.一种注册语音标签的方法,包括: 获得用于至少一个图像的语音数据; 基于语音数据确定特定图像的元数据信息的至少一部分; 确定相对于特定图像和/或相对于所确定的元数据信息满足特定条件的至少一个关联图像;以及 将用于所确定的至少一个关联图像的语音数据注册为语音标签。13.如权利要求12所述的方法,其中,确定所述至少一个关联图像包括: 基于特定图像和/或基于所确定的至少一部分的元数据信息的优先级来确定关联图像候选; 确定关联图像候选的数目是否在特定范围内;以及 根据关联图像候选的数目是否在特定范围内,将关联图像候选的至少一部分确定为关联图像。14.如权利要求13所述的方法,还包括: 如果未满足特定范围,则基于特定图像和/或基于根据优先级的所确定的至少一部分元数据信息来顺序地确定关联图像候选。15.如权利要求12到14中的至少一个所述的方法,其中,确定所述至少一个关联图像包括: 相对于特定图像或相对于所确定的至少一部分的元数据信息确定权重; 基于特定图像或基于所确定的至少一部分的元数据信息以及其所确定的权重来计算每个关联图像候选的得分;以及 根据计算出的得分是否在参考范围内来将关联图像候选的至少一部分确定为关联图像; 可选地,还包括: 如果关联图像候选的数目在特定范围内,则将所有的关联图像候选确定为关联图像;和/或 如果关联图像候选的数目不在特定范围内,则调整参考范围。
【专利摘要】提供了一种电子设备。电子设备包括:语音输入模块,其从外部接收语音以生成语音数据;存储器,其存储一个或多个图像或视频;以及处理器,其电连接到语音输入模块和存储器。存储器包括指令,所述指令当由处理器运行时使得电子设备将语音数据,基于语音数据的第一元数据信息,从语音数据和/或第一元数据信息生成的第二元数据信息中的至少一个与第二图像或视频链接。
【IPC分类】G06F17/30
【公开号】CN105512164
【申请号】CN201510661848
【发明人】安起模
【申请人】三星电子株式会社
【公开日】2016年4月20日
【申请日】2015年10月14日
【公告号】EP3010219A2, EP3010219A3, US20160104511, WO2016060400A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1