一种可基于计算机视觉感知识别的特定标记及方法系统与流程

文档序号:12468989阅读:370来源:国知局

本发明主要涉及一种可基于计算机视觉感知识别的特定标记,并拓展到可基于计算机听觉、触觉、味觉及嗅觉感知识别的特定标记,同时提供了相关的应用方法及支持上述应用方法的应用系统。



背景技术:

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所 指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提 取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。作为一个工程学科,计算机视觉寻求基于相关理论与模型来建立计算机视觉系统。计算机视觉同样可以被看作是生物视觉的一个补充。在生物视觉领域中,人类和各种动物的视觉都得到了研究,从而建立了这些视觉 系统感知信息过程中所使用的物理模型。另一方面,在计算机视觉中,靠软件和硬件实现的人工智能系统得到了研究与描述。生物视 觉与计算机视觉进行的学科间交流为彼此都带来了巨大价值。计算机视觉包含如下一些分支:画面重建,事件监测,目标跟踪,目标识别,机器学习,索引建立,图像恢复等。计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。人类正在进入信息时代,计算机将越来越广泛地进入几乎所有领域。一方面是更多未经计算机专业训练的人也需要应用计算机,而另一方面是计算机的功能越来越强,使用方法越来越复杂。这就使人在进行交谈和通讯时的灵活性与目前在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。人可通过视觉和听觉,语言与外界交换信息,并且可用不同的方式表示相同的含义,而目前的计算机却要求严格按照各种程序语言来编写程序,只有这样计算机才能运行。为使更多的人能使用复杂的计算机,必须改变过去的那种让人来适应计算机,来死记硬背计算机的使用规则的情况。而是反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。这时计算机必须具有逻辑推理和决策的能力。具有上述能力的计算机就是智能计算机。智能计算机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人,就可以使这些自动化系统和智能机器人具有适应环境,和自主作出决策的能力。这就可以在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务。计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,目前还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,目前人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方面的研究被称为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一个研究领域。计算机视觉,图象处理,图像分析,机器人视觉和机器视觉是彼此紧密关联的学科。如果你翻开带有上面这些名字的教材,你会发现在技术和应用领域上他们都有着相当大部分的重叠。这表明这些学科的基础理论大致是相同的,甚至让人怀疑他们是同一学科被冠以不同的名称。然而,各研究机构,学术期刊,会议及公司往往把自己特别的归为其中某一个领域,于是各种各样的用来区分这些学科的特征便被提了出来。下面将给出一种区分方法,尽管并不能说这一区分方法完全准确。计算机视觉的研究对象主要是映射到单幅或多幅图像上的三维场景,例如三维场景的重建。计算机视觉的研究很大程度上针对图像的内容。图象处理与图像分析的研究对象主要是二维图像,实现图像的转化,尤其针对像素级的操作,例如提高图像对比度,边缘提取,去噪声和几何变换如图像旋转。这一特征表明无论是图像处理还是图像分析其研究内容都和图像的具体内容无关。机器视觉主要是指工业领域的视觉研究,例如自主机器人的视觉,用于检测和测量的视觉。这表明在这一领域通过软件硬件,图像感知与控制理论往往与图像处理得到紧密结合来实现高效的机器人控制或各种实时操作。模式识别使用各种方法从信号中提取信息,主要运用统计学的理论。此领域的一个主要方向便是从图像数据中提取信息。还有一个领域被称为成像技术。这一领域最初的研究内容主要是制作图像,但有时也涉及到图像分析和处理。例如,医学成像就包含大量的医学领域的图像分析。对于所有这些领域,一个可能的过程是你在计算机视觉的实验室工作,工作中从事着图象处理,最终解决了机器视觉领域的问题,然后把自己的成果发表在了模式识别的会议上。有不少学科的研究目标与计算机视觉相近或与此有关。这些学科中包括图象处理、模式识别或图象识别、景物分析、图象理解等。由于历史发展或领域本身的特点这些学科互有差别,但又有某种程度的相互重迭。为了清晰起见,我们把这些与计算机视觉有关的学科研究目标和方法的角度加以归纳。1.图象处理:图象处理技术把输入图象转换成具有所希望特性的另一幅图象。例如,可通过处理使输出图象有较高的信-噪比,或通过增强处理突出图象的细节,以便于操作员的检验。在计算机视觉研究中经常利用图象处理技术进行预处理和特征抽取。2.模式识别(图象识别):模式识别技术根据从图象抽取的统计特性或结构信息,把图象分成予定的类别。例如,文字识别或指纹识别。在计算机视觉中模式识别技术经常用于对图象中的某些部分,例如分割区域的识别和分类。3.图象理解(景物分析):给定一幅图象,图象理解程序不仅描述图象本身,而且描述和解释图象所代表的景物,以便对图象代表的内容作出决定。在人工智能视觉研究的初期经常使用景物分析这个术语,以强调二维图象与三维景物之间的区别。图象理解除了需要复杂的图象处理以外还需要具有关于景物成象的物理规律的知识以及与景物内容有关的知识。在建立计算机视觉系统时需要用到上述学科中的有关技术,但计算机视觉研究的内容要比这些学科更为广泛。计算机视觉的研究与人类视觉的研究密切相关。为实现建立与人的视觉系统相类似的通用计算机视觉系统的目标需要建立人类视觉的计算机理论。计算机视觉和图像识别的关联非常密切。图像识别可能是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映象。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。在文字材料的识别中,人们不仅可以把一个汉字的笔划或偏旁等单元组成一个组块,而且能把经常在一起出现的字或词组成组块单位来加以识别。在计算机视觉识别系统中,图像内容通常用图像特征进行描述。事实上,基于计算机视觉的图像检索也可以分为类似文本搜索引擎的三个步骤:提取特征、建索引build以及查询。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别,应用非常广泛。数字图像处理和识别的研究开始于1965年。数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强大的动力。物体的识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。现代图像识别技术的一个不足就是自适应性能差,一旦目标图像被较强的噪声污染或是目标图像有较大残缺往往就得不出理想的结果。图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前,在图像识别的发展中,主要有三种识别方法:统计模式识别、结构模式识别、模糊模式识别。图像分割是图像处理中的一项关键技术,自20世纪70年代,其研究已经有几十年的历史,一直都受到人们的高度重视,至今借助于各种理论提出了数以千计的分割算法,而且这方面的研究仍然在积极地进行着。现有的图像分割的方法有许多种,有阈值分割方法,边缘检测方法,区域提取方法,结合特定理论工具的分割方法等。从图像的类型来分有:灰度图像分割、彩色图像分割和纹理图像分割等。早在1965年就有人提出了检测边缘算子,使得边缘检测产生了不少经典算法。但在近二十年间,随着基于直方图和小波变换的图像分割方法的研究计算技术、VLSI技术的迅速发展,有关图像处理方面的研究取得了很大的进展。图像分割方法结合了一些特定理论、方法和工具,如基于数学形态学的图像分割、基于小波变换的分割、基于遗传算法的分割等。每个物体,有的自己发光,有的反射别的物体的光,当它们发射或反射的光通过瞳孔、晶状体进入眼睛后,会在视网膜上形成这些物体的像,连接视网膜的视神经立即把这些光的信号报告给大脑,我们就看到了这些物体。在本发明中所提到计算机视觉除非特别注明则均包含从感知到识别的所有相关技术,部分不需要感知的则只包含识别技术,同时计算机视觉也不限于计算机系统所用的,其它的交叉的学科如机器视觉也包含在内。

计算机触觉技术是机器人科学技术中的重要分支。计算机将人类的脑力加以延伸,互联网使人类的交流打破了空间界限,机器人将“延长”人类的手,使人类的体力超越空间的界限。随着机器人技术的发展,各种领域中机器人将成为人类的帮手和“代理”,机器人和互联网的结合使得人类的脑力和体力得到空前的增长,必将大大提高人类生产效率和生活质量。外国研究人员已经基于录制播放的思想研究出了一些设备。比如科学家玛格丽特·玛吉奥等人研制了视觉听觉触觉联合的训练系统,用来培训医学院学生进行牙齿龋坏组织的感受体验。这种系统,在一个改进的牙科探针上安装了一个小型振动传感器和振动电机。在录制阶段,首先由医生用探针探诊牙齿龋坏组织和刮磨龋齿表面等操作,通过振动传感器记录探针的振动信号,通过麦克风和摄像头同步记录声音和操作过程。在播放阶段,学生手持探针,可以同时获得视觉听觉触觉的反馈,从而更直观地体会牙齿龋坏组织的操作感受。如果稍加整合加工,将视觉听觉触觉信息数据发到网上,那么人人都可以下载使用这样的资源。计算机触觉技术与计算机图形学、触觉心理学和机器人技术密切相关。目前,计算机触觉技术的研究和应用领域主要集中在:手术模拟、机器人主从控制、产品虚拟样机设计、游戏和娱乐、科学计算可视化等。机器嗅觉是一种模拟生物嗅觉工作原理的新颖仿生检测技术,机器嗅觉系统通常由交叉敏感的化学传感器阵列和适当的计算机模式识别算法组成,可用于检测、分析和鉴别各种气味。以往传统的嗅觉感官的仿生大多只是简单的物质气味的测量,测量方法停留在化学分析方法和仪器分析方法,可是对于一些痕量(相对含量极为微小)物质及复杂物质的分析,特别是许多含有不同气味的痕量物质,还只能停留在人的嗅觉直接测量,这就需要大量的时间和物力来培养专门识别气味的专家。目前,酒类、茶叶等食品的质量主要是靠人的感官来进行判断,感官评定主要依赖人的生理和心理条件,其本身是一门精巧的技术。这类工作通常需要训练有素、经验丰富的专家来进行。但人工鉴别带有很大的主观因素,从某种意义上来说,由于受到经验、情绪等主观因素的影响,感官评定方法的评判结果随鉴别人员的不同而存在相当大的个体差异,即使是同一人员也会随其自身身体状态、情绪变化等的不同而产生不同的结果。由此可见,人的感觉器官的缺点包括主观性、重复性差、耗时长和花费人力巨大等,另外,人的感觉器官不能用于检测有毒气体、连续工作和远程操作。鉴于传统感官评定和化学成分分析仪器的不足,人们期望有一种客观准确的嗅觉鉴别方法来代替人工气味鉴别和化学分析仪器,仿生嗅觉技术在这种需求下得到迅速的发展。仿生嗅觉技术属于新兴的多学科交叉技术,涉及到计算机技术、应用数学、传感器技术、阵列传感器技术的数据融合和各个具体领域的技术的融合,具有很重要的意义。声波按频率分类,频率低于20Hz的声波称为次声波;频率20Hz~20kHz的声波称为可听波;频率20kHz~1GHz的声波称为超声波;频率大于1GHz的声波称为特超声或微波超声。还有计算机听觉、味觉等,这里不再一一列举,但和计算机视觉类似,除非特别注明则均包含从感知到识别的所有相关技术,部分不需要感知的则只包含识别技术,同时也不限于计算机系统所用的,其它的交叉的学科如机器听觉、触觉、味觉、嗅觉也包含在内。

光源指能发出一定波长范围的电磁波(包括可见光与紫外线、红外线、X光线等不可见光)的物体。光源包括紫外光源、红外光源和非照明用的可见光源。通常指能发出可见光的发光体。凡物体本身能发光者,称做光源,又称发光体,如太阳、恒星、灯以及燃烧着的物质等都是。但像月亮表面、桌面等依靠它们反射外来光才能使人们看到它们,这样的反射物体不能称为光源。在我们的日常生活中离不开可见光的光源,可见光以及不可见光的光源还被广泛地应用到工农业,医学和国防现代化等方面。自身正在发光的物体叫光源。光源可以分为自然(天然)光源和人造光源。此外,根据光的传播方向,光源可分为点光源和平行光源。产生途径:第一种是热效应产生的光,太阳光就是很好的例子,此外蜡烛等物品也都一样,此类光随着温度的变化会改变颜色。第二种是原子发光,荧光灯灯管内壁涂抹的荧光物质被电磁波能量激发而产生光,此外霓虹灯的原理也是一样。不同原子发光产生的光线具有相应的基本色彩,所以进行彩色拍摄时我们需要进行相应的补正。第三种是synchrotron发光,同时携带有强大的能量,synchrotron发光是指媒质中的光速比真空中的光速小,粒子在媒质中的传播速度可能超过媒质中的光速,在这种情况下会发生辐射。这不是真正意义上的超光速,真正意义上的超光速是指超过真空中的光速。这种现象被称为切伦科夫效应。但是我们在日常生活中几乎没有接触到这种光的机会。电光源的发明促进了电力装置的建设。电光源的转换效率高,电能供给稳定,控制和使用方便,安全可靠,并可方便地用仪器/仪表计数耗能,故在其问世后一百多年中,很快得到了普及。它不仅成为人类日常生活的必需品,而且在工业、农业、交通运输以及国防和科学研究中,都发挥着重要作用。世界上的照明用电(照明光源的耗电量)约占总发电量的10%~20%。在中国,照明用电约占总发电量的10%。随着中国现代化发展速度的加快,照明用电量逐年上升,而电力增长率又不相适应,因此,研制、开发和推广应用节能型电光源已引起人们的高度重视。主要是提高发光效率,开发体积小的高效节能光源,改善电光源的显色性,延长寿命。达到上述目的的具体途径是开发研制新型材料、采用新工艺以及进一步研究新的发光机理、开发新型电光源,而最为现实的途径则是改进现有电光源的制造技术,采用新型的、自动化性能好的生产设备。照明光源是以照明为目的,辐射出主要为人眼视觉的可见光谱(波长380~780纳米)的电光源,其规格品种繁多,功率从0.1瓦到20千瓦,产量占电光源总产量的95%以上。照明光源品种很多,按发光形式分为热辐射光源、气体放电光源和电致发光光源3类。①热辐射光源。电流流经导电物体,使之在高温下辐射光能的光源。包括白炽灯和卤钨灯两种。白炽灯又称钨丝灯、灯泡,是将灯丝通电加热到白炽状态,利用热辐射发出可见光的电光源。由电流通过灯丝加热至白炽状态产生光的一种光源。是最早出现的电灯,用耐热玻璃制成泡壳,内装钨丝。泡壳内抽去空气,以免灯丝氧化,或再充入惰性气体(如氩),减少钨丝受热蒸发。因灯丝所耗电能仅一小部分转为可见光,故发光效率低,一般为10~15流/瓦。但制造方便,成本低。低压钠灯是利用低压钠蒸气放电发光的电光源,在它的玻璃外壳内涂以红外线反射膜,是光衰较小和发光效率最高的电光源。低压钠灯发出的是单色黄光,用于对光色没有要求的场所。高压钠灯,当灯泡启动后,电弧管两端电极之间产生电弧,由于电弧的高温作用使管内的液钠汞气受热蒸发成为汞蒸气和钠蒸气,阴极发射的电子在向阳极运动过程中,撞击放电物质的原子,使其获得能量产生电离或激发,然后由激发态回复到基态;或由电离态变为激发态,再回到基态无限循环,此时,多余的能量以光辐射的形式释放,便产生了光。②气体放电光源。电流流经气体或金属蒸气,使之产生气体放电而发光的光源。气体放电有弧光放电和辉光放电两种,放电电压有低气压、高气压和超高气压3种。弧光放电光源包括:荧光灯、低压钠灯等低气压气体放电灯,高压汞灯、高压钠灯、金属卤化物灯等高强度气体放电灯,超高压汞灯等超高压气体放电灯,以及碳弧灯、氙灯、某些光谱光源等放电气压跨度较大的气体放电灯。辉光放电光源包括利用负辉区辉光放电的辉光指示光源和利用正柱区辉光放电的霓虹灯,二者均为低气压放电灯;此外还包括某些光谱光源。③电致发光光源。在电场作用下,使固体物质发光的光源。它将电能直接转变为光能。包括场致发光光源和发光二极管两种。辐射光源是不以照明为目的,能辐射大量紫外光谱(1~380纳米)和红外光谱(780~1×106纳米)的电光源无处不在。以上两大类光源均为非相干光源。此外还有一类相干光源,它通过激发态粒子在受激辐射作用下发光,输出光波波长从短波紫外直到远红外,这种光源称为激光光源。光纤通信技术中,进行光纤衰耗的测量,连接损耗的测量、活动连接器损耗以及光电器件或光收端机灵敏度的测量,光源是不可缺少的信号源。稳定光源,即其输出光功率、波长及光谱宽度等特性(主要是光功率)应当是稳定不变的,当然,绝对稳定不变是不可能的,只是在给定的条件下(例如一定的环境、一定的时间范围内)其特性是相对稳定的。若要达到一定的指标要求,稳定光源应有一定的措施以保证其特性的稳定。一般采取APC(自动功率控制)电路和ATC(自动温度控制)电路等措施。光源模组中最核心技术为导光板的光学技术,主要有印刷形和射出成型形二种导光板形式,其它如射出成型加印刷,激光打点,腐蚀等占很少比例,不适合批量生产原则。印刷形因为其成本低在过去较长时间内成为主流技术,但合格品不高一直是其主要缺点,而LCD产品要求更精密的导光板结构,射出成型形导光板必然成为背光源发展主流,但相应的模具技术难题只有少数大厂能够克服。背光源按光源类型主要有EL、CCFL及LED三种背光源类型,依光源分布位置不同则分为侧光式和边光式。LED灯又称发光二极管,是一种能够将电能转化为可见光的固态的半导体器件,它可以直接把电转化为光,比起其它光源,单个LED灯的功耗是最小的。LED光源0.2~0.6mm的厚度。缺点是亮度低,寿命短(一般为3000~5000小时),需逆变驱动,还会受电路的干扰而出现闪烁、噪声等不良。EL的驱动有逆变器、DriverIC驱动两种。因为DriverIC的频率和负载输出电压达不到EL的典型条件(400Hz、AC100V),所以亮度较逆变器驱动更为低。也陆续有白光(全色)EL和LCD背光源出来。但由于亮度较暗其基本上用于4英寸以下小尺寸液晶显示。如手机、PDA、游戏机等。全色(白光)、大尺寸亮度背光源,主流仍然是用CCFL做光源。

指令系统是指计算机所能执行的全部指令的集合,它描述了计算机内全部的控制信息和"逻辑判断"能力。不同计算机的指令系统包含的指令种类和数目也不同。一般均包含算术运算型、逻辑运算型、数据传送型、判定和控制型、移位操作型、位(位串)操作型、输入和输出型等指令。指令系统是表征一台计算机性能的重要因素,它的格式与功能不仅直接影响到机器的硬件结构,而且也直接影响到系统软件,影响到机器的适用范围。一条指令就是机器语言的一个语句,它是一组有意义的二进制代码,指令的基本格式如:操作码字段+地址码字段,其中操作码指明了指令的操作性质及功能,地址码则给出了操作数或操作数的地址。指令系统的发展经历了从简单到复杂的演变过程。早在20世纪50-60年代,计算机大多数采用分立元件的晶体管或电子管组成,其体积庞大,价格也很昂贵,因此计算机的硬件结构比较简单,所支持的指令系统也只有十几至几十条最基本的指令,而且寻址方式简单。到60年代中期,随着集成电路的出现,计算机的功耗、体积、价格等不断下降,硬件功能不断增强,指系统也越来越丰富。在70年代,高级语言己成为大、中、小型机的主要程序设计语言,计算机应用日益普及。由于软件的发展超过了软件设计理论的发展,复杂的软件系统设计一直没有很好的理论指导,导致软件质量无法保证,从而出现了所谓的"软件危机"。人们认为,缩小机器指令系统与高级语言语义差距,为高级语言提供很多的支持,是缓解软件危机有效和可行的办法。计算机设计者们利用当时已经成熟的微程序技术和飞速发展的VLSI技术,增设各种各样的复杂的、面向高级语言的指令,使指令系统越来越庞大。这是几十年来人们在设计计算机时,保证和提高指令系统有效性方面传统的想法和作法。计算机的指令格式与机器的字长、存储器的容量及指令的功能都有很大的关系。从便于程序设计、增加基本操作并行性、提高指令功能的角度来看,指令中应包含多种信息。但在有些指令中,由于部分信息可能无用,这将浪费指令所占的存储空间,并增加了访存次数,也许反而会影响速度。因此,如何合理、科学地设计指令格式,使指令既能给出足够的信息,又使其长度尽可能地与机器的字长相匹配,以节省存储空间,缩短取指时间,提高机器的性能,这是指令格式设计中的一个重要问题。计算机是通过执行指令来处理各种数据的。为了指出数据的来源、操作结果的去向及所执行的操作,一条指令必须包含下列信息:(1)操作码。它具体说明了操作的性质及功能。一台计算机可能有几十条至几百条指令,每一条指令都有一个相应的操作码,计算机通过识别该操作码来完成不同的操作。(2)操作数的地址。CPU 通过该地址就可以取得所需的操作数。(3)操作结果的存储地址。把对操作数的处理所产生的结果保存在该地址中,以便再次使用。(4)下条指令的地址。执行程序时,大多数指令按顺序依次从主存中取出执行,只有在遇到转移指令时,程序的执行顺序才会改变。为了压缩指令的长度,可以用一个程序计数器(Program Counter,PC)存放指令地址。每执行一条指令,PC 的指令地址就自动 +1(设该指令只占一个主存单元),指出将要执行的下一条指令的地址。当遇到执行转移指令时,则用转移地址修改 PC 的内容。由于使用了 PC,指令中就不必明显地给出下一条将要执行指令的地址。各计算机公司设计生产的计算机,其指令的数量与功能、指令格式、寻址方式、数据格式都有差别,即使是一些常用的基本指令,如算术逻辑运算指令、转移指令等也是各不相同的。因此,尽管各种型号计算机的高级语言基本相同,但将高级语言程序(例如 Fortran 语言程序)编译成机器语言后,其差别也是很大的。因此将用机器语言表示的程序移植到其他机器上去几乎是不可能的。从计算机的发展过程已经看到,由于构成计算机的基本硬件发展迅速,计算机的更新换代是很快的,这就存在软件如何跟上的问题。大家知道,一台新机器推出交付使用时,仅有少量系统软件(如操作系统等)可提交用户,大量软件是不断充实的,尤其是应用程序,有相当一部分是用户在使用机器时不断产生的,这就是所谓第三方提供的软件。为了缓解新机器的推出与原有应用程序的继续使用之间的矛盾,1964 年在设计 IBM360 计算机时所采用的系列机思想较好地解决了这一问题。从此以后,各个计算机公司生产的同一系列的计算机尽管其硬件实现方法可以不同,但指令系统、数据格式、I/O 系统等保持相同,因而软件完全兼容(在此基础上,产生了兼容机)。当研制该系列计算机的新型号或高档产品时,尽管指令系统可以有较大的扩充,但仍保留了原来的全部指令,保持软件向上兼容的特点,即低档机或旧机型上的软件不加修改即可在比它高档的新机器上运行,以保护用户在软件上的投资。指令包括操作码域和地址域两部分。根据地址域所涉及的地址数量,常见的指令格式有以下几种。①三地址指令:一般地址域中A1、A2分别确定第一、第二操作数地址,A3确定结果地址。下一条指令的地址通常由程序计数器按顺序给出。②二地址指令:地址域中A1确定第一操作数地址,A2同时确定第二操作数地址和结果地址。③单地址指令:地址域中A 确定第一操作数地址。固定使用某个寄存器存放第二操作数和操作结果。因而在指令中隐含了它们的地址。④零地址指令:在堆栈型计算机中,操作数一般存放在下推堆栈顶的两个单元中,结果又放入栈顶,地址均被隐含,因而大多数指令只有操作码而没有地址域。⑤可变地址数指令:地址域所涉及的地址的数量随操作定义而改变。如有的计算机的指令中的地址数可少至 0个,多至6个。指令系统的性能决定了计算机的基本功能,它的设计直接关系到计算机的硬件结构和用户的需要。随着计算机系统结构的发展,有些计算机还不断引入新指令。如"测并置"指令是为在多机系统和多道程序中防止重入公用子程序而设置的。指令先测试标志位以判断该子程序是否正在使用。如未被使用,则转入子程序并置该标志位,以防其他进程重入。后来又出现功能更强的信号(PV操作)指令。有的计算机还设置"执行"指令。"执行"指令执行由地址域所确定的存储单元中的指令。其目的是避免用程序直接修改程序中的指令。这对程序的检查和流水线等技术的应用均有好处。有的计算机采用堆栈实现程序的调用指令和返回指令。调用时将返回地址和各种状态、参数压入堆栈顶部,这样就能较好地实现子程序的嵌套和递归调用,并可使子程序具有可重入性。另外,一些计算机使不少复杂的操作固定化,形成诸如多项式求值、队列插项、队列撤项和各种翻译、编辑等指令。按功能划分指令可分为:①数据处理指令:包括算术运算指令、逻辑运算指令、移位指令、比较指令等。②数据传送指令:包括寄存器之间、寄存器与主存储器之间的传送指令等。③程序控制指令:包括条件转移指令、无条件转移指令、转子程序指令等。④输入-输出指令:包括各种外围设备的读、写指令等。有的计算机将输入-输出指令包含在数据传送指令类中。⑤状态管理指令:包括诸如实现置存储保护、中断处理等功能的管理指令。其他划分:向量指令和标量指令:有些大型机和巨型机设置功能齐全的向量运算指令系统。向量指令的基本操作对象是向量,即有序排列的一组数。若指令为向量操作,则由指令确定向量操作数的地址(主存储器起始地址或向量寄存器号),并直接或隐含地指定如增量、向量长度等其他向量参数。向量指令规定处理机按同一操作处理向量中的所有分量,可有效地提高计算机的运算速度。不具备向量处理功能,只对单个量即标量进行操作的指令称为标量指令。特权指令和用户指令:在多用户环境中,某些指令的不恰当使用会引起机器的系统性混乱。如置存储保护、中断处理、输入输出等这类指令,均称为特权指令,不允许用户直接使用。为此,处理机一般设置特权和用户两种状态,或称管(理)态和目(的)态。在特权状态下,程序可使用包括特权指令在内的全部指令。在用户状态下,只允许使用非特权指令,或称用户指令。用户如使用特权指令则会发生违章中断。如用户需要申请操作系统进行某些服务,如输入-输出等,可使用"广义指令",或称为"进监督"、"访管"等的指令。复杂指令系统(CISC)。早期的计算机, 存储器是一个很昂贵的资源, 因此希望指令系统能支持生成最短的程序。此外, 还希望程序执行时所需访问的程序和数据位的总数越少越好。在微程序出现后, 将以前由一串指令所完成的功能移到了微代码中, 从而改进了代码密度。此外, 它也避免了从主存取指令的较慢动作, 从而提高执行效率。在微代码中实现功能的另一论点是: 这些功能能较好的支持编译程序。如果一条高级语言的语句能被转换成一条机器语言指令, 这可使编译软件的编写变得非常容易。此外, 在机器语言中含有类似高级语言的语句指令, 便能使机器语言与高级语言的间隙减少。这种发展趋向导致了复杂指令系统( CISC) 设计风格的形成, 即认为计算机性能的提高主要依靠增加指令复杂性及其功能来获取。精简指令系统(RISC)。由于CISC 技术在发展中出现了问题, 计算机系统结构设计的先驱者们尝试从另一条途径来支持高级语言及适应VLSI 技术特点。1975 年IBM 公司Jo hn Cocke 提出了精简指令系统的设想。到了1979 年, 美国加州大学伯克莱分校由Patter son 教授领导的研究组, 首先提出了RISC 这一术语, 并先后研制了RISC-Ⅰ和RISC- Ⅱ计算机。1981 年美国的斯坦福大学在Hennessy教授领导下的研究小组研制了M IPS RISC 计算机, 强调高效的流水和采用编译方法进行流水调度, 使得RISC 技术设计风格得到很大补充和发展。90 年代初, IEEE 的Michael Slater 对于RISC 的定义作了如下描述:RISC 处理器所设计的指令系统应使流水线处理能高效率执行, 并使优化编译器能生成优化代码。RISC 的主要问题是编译后生成的目标代码较长, 占用了较多的存储器空间。但由于半导体集成技术的发展, 使得RAM 芯片集成度不断提高和成本不断下降, 目标代码较长已不成为主要问题。RISC 技术存在另一个潜在缺点是对编译器要求较高,除了常规优化方法外, 还要进行指令顺序调度, 甚至能替代通常流水线中所需的硬件联锁功能。一条指令的执行过程按时间顺序可分为以下几个步骤。① CPU发出指令地址。将指令指针寄存器(IP)的内容--指令地址,经地址总线送入存储器的地址寄存器中。② 从地址寄存器中读取指令。将读出的指令暂存于存储器的数据寄存器中。③ 将指令送往指令寄存器。将指令从数据寄存器中取出,经数据总线送入控制器的指令寄存器中。④ 指令译码。指令寄存器中的操作码部分送指令译码器,经译码器分析产生相应的操作控制信号,送往各个执行部件。⑤ 按指令操作码执行。⑥ 修改程序计数器的值,形成下一条要取指令的地址。若执行的是非转移指令,即顺序执行,则指令指针寄存器的内容加1,形成下一条要取指令的地址。指令指针寄存器也称为程序计数器。本发明所涉及的指令是指可以让电子计算机、其它电子设备、机器/机电设备等实现某种控制、运算乃至应用功能的代码、语句、操作、程序及其集合(如宏指令、批处理等),非仅仅是指电子计算机中的低级机器语言指令,而是在此基础上进行了拓展,既可以是低级机器语言指令,也可以是宏指令、高级语言指令、程序、操作宏、批处理程序集等,而且不限于电子计算机上可以执行的指令,还可以是其它电子设备、机器/机电设备上可以执行的指令(即还可是在其它电子设备、机器/机电设备上执行)上可以执行的指令。

本发明可能用到的一些概念和原理,摘录如下。二维码又称QR Code,QR全称Quick Response,是一个近几年来移动设备上超流行的一种编码方式,它比传统的Bar Code条形码能存更多的信息,也能表示更多的数据类型。二维条码/二维码(2-dimensional bar code)用某种特定的几何图形按一定规律在平面(二维方向上)分布的黑白相间的图形记录数据符号信息的;在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理:它具有条码技术的一些共性:每种码制有其特定的字符集;每个字符占有一定的宽度;具有一定的校验功能等。同时还具有对不同行的信息自动识别功能、及处理图形旋转变化点。条形码或称条码(barcode)是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。常见的条形码是由反射率相差很大的黑条(简称条)和白条(简称空)排成的平行线图案。条形码可以标出物品的生产国、制造厂家、商品名称、生产日期、图书分类号、邮件起止地点、类别、日期等信息,因而在商品流通、图书管理、邮政管理、银行系统等许多领域都得到了广泛的应用。计算机触觉、味觉或称触(力)觉交互技术,可以使操作者通过运动或力等形式感知虚拟环境中物体的粗糙度、纹理、温度、振动和刚度、硬度、重量以及操作力等丰富的外界环境信息,从而使操作者体验到如同操作真实物体的触(力)觉感知效果。计算机触觉系统由触(力)觉反馈设备、虚拟交互环境以及操作者构成。操作者直接操作触(力)觉反馈设备,虚拟交互环境根据映射的操作者的运动信息(如位置、速度)以及虚拟交互场景进行碰撞检测和触(力)觉渲染等计算,触(力)觉反馈设备将渲染的反馈力施加或作用于操作者。总体说来,创造触觉系统有多种方法。虽然它们看上去可能差别很大,但是大都有两个非常重要的共同点——当操纵者的虚拟形象与物体发生交互作用时决定力度大小的软件,以及可以将作用力反馈给操纵者的设备。软件进行运算的过程被称作触觉再现。比如,可以用多面体模型来模拟虚拟世界中的物体,这些三维模型可以准确刻画出许多形状,也可以通过模拟作用力与物体不同面的接触效果,来计算触摸数据。这种三维物体可以模拟出各类表面材质,上面提到的网购时,客户可“隔空”感受衣服的质地应用的就是这种原理。

二维码等可基于计算机视觉感知识别的特定标记可以存储信息并被感知识别,相关的运用已经很多,甚至有些运用已经成熟并已普及。发明人在本发明申请提交之前也提交了两个包含直接可用的位置信息的发明专利申请,分别用于标记单个地点、地名、地址和标记多点、路径、区域范围等并可在上述基础上拓展一些定位等地理信息方面的应用,进一步拓展了这些特定标记的运用领域,但这些特定标记包含的信息需要在特定场景下去理解,即不是指令无法直接驱动计算机动作;如果可以作为指令驱动计算机动作,那么这将开创一个全新的运用领域。类似的计算机触觉、听觉、味觉、嗅觉也是一样,目前相关的设备都只是试图去检测、测量,然后在特定场景下去理解再做出反应,而不能像人(还包括其它生物)一样,可以直接通过触觉、听觉、味觉、嗅觉触发本能反应(当然人也可以根据自己的知识对此进行进一步理解后再做反应)。机器人是当前的一个研究热门,人和机器人之间交互以及机器人和机器人之间交互目前主要靠有线或无线的通信网络传输的指令(包括信号),仿人类之间的语言、动作等的交流方式还在研究的初步阶段,基本上没有什么成熟应用,如果也采用这样的特定标记,就可以大大提高识别/理解的准确率及效率,比自然语言及动作等的直接运用要好很多,但是目前无相关的运用。



技术实现要素:

本发明提供的可基于计算机视觉感知识别的特定标记,明确了包含指令,即可以直接驱动计算机、机器人或其它设备动作,从而使特定标记可以拓展到一个全新的运用领域,其技术方案如下:

包含一个指令或至少两个指令,或者同时还包含非指令信息,采用二维码、条码、特定格式数字、特定格式字母、特定格式文字、特定图形、特定动作或者同时采用上述两种及以上不同类型的图像形式。这个指令是可以直接驱动计算机、机器人或其它设备动作的的代码、语句或其集合,这个动作可以是一种控制动作也可以是一种运算动作,还可以是由若干控制动作和/或运算动作组成的集合甚至是可以实现某个特定目的的功能的控制与运算动作的复杂组合。在电子计算机中,指定电子计算机实现某种控制或运算的代码,包括操作功能和操作对象等内容,根据背景技术中对于指令系统的解释说明,指令是指电子计算机机器语言的语句,由于机器指令比较难记且不便编程等,在此基础上又出现了伪指令、高级语言、宏等,因此在本发明中的指令概念包括所有这些可以直接驱动电子计算机动作的的代码、语句、操作、程序或其集合,包括一切可以直接驱动设备动作的任何指令,对于机器人及其它设备也是如此。指令可以是需立即执行的指令,也可以非立即执行的指令;指令可以是无条件执行的指令,也可是满足条件才执行的指令;指令可是面向任何对象的指令-即任何收到的对象在收到后需要执行,也可是面向特定对象的指令-即收到的对象中只有特定的对象(一般为指定的对象)收到后才需要执行;指令可是带参数的指令,也可是不带参数的指令;上述由指令本身定义或由特定标记附加的非指令信息中定义。而在非指令信息中,除了包含一般内容信息外,还可包含与执行指令有关的信息,如令牌信息(参考令牌环网络的相关概念)、时标信息(指令执行可以附加执行时效,超时无效,也可以用于告知指令发出时间,等等)、身份信息(如告知是谁发出的指令、要谁执行的指令),也可以是身份验证信息(如口令、验证码,从而进一步确认是否有权发出指令、有权执行指令等),上述与执行指令有关的信息可视情况任意综合采用,如身份信息和身份验证信息一般可同时采用。包含指令是其区别于现有二维码、条码、特定格式数字、特定格式字母、特定格式文字、特定图形、特定动作的关键特征。以二维码为例,二维码的应用随着带摄录功能的智能手机的普及而发展非常迅速,扫码购物、扫码支付、扫码获取资源(通过资源定位,上述包含关联的特定地图资源信息、关联的特定服务内容信息、关联的特定服务资源信息的二维码即属于此类应用)等等应用,已经取得了长足的发展,这是由于其使用非常方便,用手机的镜头对准扫一下就可完成原来非常复杂或繁琐的录入、操作过程。同样,如果使其包含直接可用的位置信息,也可同样方便的进行定位或共享、交换、发布位置信息,然后再在此基础上提供关联的特定地图资源信息、关联的特定服务内容信息、关联的特定服务资源信息等与位置相关的服务。但这些功能的实现都是特定的环境下,需要应用软件的支撑。本发明提供的包含指令的二维码,则是可以直接驱动设备如电子计算机、机器人等动作的。再用一个很浅显的例子说明,以流行的手机为例,就是支付二维码必须在支付软件或支持支付的相关软件识别才能实现支付但无法直接用手机识别并支付,而提供的包含指令的二维码手机可以直接识别并执行相应的功能或动作。本发明的这个例子以二维码为例,也可以替换为条码、特定格式数字、特定格式字母、特定格式文字、特定图形、特定动作等,也可同时采用上述两种及以上不同类型的图像形式。用户可以根据需要采用,综合考虑成本、技术、体验等各种因素采用最合适自己的。包含指令的二维码可以称为指令二维码,包含指令的条码可以称为指令条码,以此类推。所述特定标记可以被识别,而且是基于计算机视觉相关技术进行感知和识别。上述特定标记其实都是图像的子集,但二维码、条码是有特定格式规范的,其后的特定格式数字、特定格式字母、特定格式文字其实也就是把数字、字母、文字格式规范化,特定图形则指二维码、条码、数字、字母、文字以外的静态图形,为涵盖未来可能出现的新图像识别技术准备的。所谓特定即不是任何格式的数字、字母、文字、图形,这样以降低识别的难度同时也可增加识别的准确率。与上述特定标记相应的二维码识别、条码识别、数字识别、字母识别、文字识别、图像识别(这里是指对应于二维码、条码、数字、字母、文字以外的特定图形的识别)目前已有许多成熟技术,同时当前带有摄像镜头的手机及普遍建设的视频监控系统就有相关的应用,普及率高、应用非常成熟,在交通领域的车牌识别以及指纹、掌纹、虹膜、人脸识别等技术,都是目前常用的图像识别技术;也可以是对标记物的动作(包括动态的连续图像)进行识别,动作识别的技术目前已有相关的研究,技术将逐渐成熟,目前已有一些较简单的技术在应用。也可以是同时包含上述两种及以上不同类型识别的混合识别,多种识别技术结合在一起,综合运用。上述识别都属于基于计算机视觉技术的,有些情况下,边采集边识别,这时就需要相应的感知设备,如镜头;有些情况下是对已采集的图像进行识别,这时就不需要感知设备了,直接处理图像文件或数据流就可以了。可基于计算机视觉技术进行识别的特定标记可为肉眼可见的,如我们通常所见的二维码、条码、文字、图形、动作等,可移动终端设备可以通过常规的镜头获取,也可为肉眼不可见的,如红外线等非可见光形成或构成的二维码、条码、文字、图形、动作等,可通过相应的红外线等非可见光视觉捕捉。所述特定标记的载体可为自发光物体,如可为灯、发光化学物质、发光生物、发热物体或发热生物,还可进一步从类型上限定为燃烧薪柴的灯、燃油灯、燃气灯、白炽灯、荧光灯和/或LED灯;也可为可反射光物体,如为烟尘、云、纸张、土、石、沙、木材、金属、玻璃、塑料、碳、其它固体非金属(除前面后面已列材质外的单质非金属、金属化合物、其它化合物等)、水和/或油(这里指液态的油性物质),还可进一步从类型上限定为名片(将个人通信地址、单位办公经营地址或店铺地址的位置二维码/条码印上,朋友或客户扫码即知具体位置,而文字描述的地址有时很难找到实际位置或要花很多时间找,下同)、卡片、标签(将厂家或商家地址的位置二维码/条码印上,客户扫码即知具体位置)、标牌、吊牌、铭牌、路牌、贴纸、贴膜、彩页、地图、封面、书籍(如介绍旅游景点的书籍中将景点-一般为入口或售票处地址的位置二维码/条码印上,感兴趣者扫码即知具体位置)、框架、包装或外壳,还可进一步限定是通过印、染、绘、画、雕、刻、缝、织、涂、抹、喷、刮、擦、镀、粘和/或吸附而在所述可反射光物体展现,如各种出版物、印刷品都是通过各种印刷技术(即印)而展现位置二维码/条码这些特定标记的,各个手段或途径都有其适用范围,不一一详述;也可为本身既非自发光物体也非可反射光物体但能通过自发光物体或者可反射光物体展现的非有形物体,如为存储文件(这里主要是指计算机系统存储文件,如存储在磁盘、磁带、硬盘、光盘的文件,但不限于这些,因为存储技术在不断发展,利用DNA、量子进行存储的技术正在发展之中,等等,可能未来还有其它技术)、有线电信号(电缆传输电信号)、有线光信号(光缆传输光信号)、光信号(这里只用于通信的可见光,光也是一种电磁波,但普遍使用的电磁波不在可见光频段)或无线电信号(一种电磁波,这里指的是普遍使用的电磁波,不在可见光频段),还可进一步从内容格式上限定为视频、图片、特定格式数字、特定格式字母和/或特定格式文字(以上均基于图像识别技术进行识别,而非理解其中数字、字母、文字的含义),也可进一步限定展现的方式是通过显示器显示(计算机存储文件一般都可通过显示器显示,集成的液晶屏、电视机等也可作为显示器)、通过灯展现(一般通过特殊形状或组合的灯)、通过发光化学物质展现(如荧光粉可以使在夜间可见)、通过发光生物展现(如萤火虫限制在一个特定形状的容器内活动)、通过发热物体展现(热辐射可散发红外线,为非可见光,但可通过特殊的镜头感知)、通过发热生物展现(人、动物等也具有热辐射,可散发红外线)或通过投影到可反射光物体(如墙壁、幕布上)上展现。上述可基于计算机视觉感知识别的特定标记可用于存储、传递以及发布指令,也可同时还用于存储、传递以及发布非指令信息;在这个基础上所述指令以及非指令信息可采用二进制码、八进制码、十进制码、十六进制码、摩尔斯码、双字节码、UniCode 码或ASCII码表示,这是内容编码格式,可以采用任何已有以及未来可能出现的编码形式,使用时根据场合的实际情况综合考虑,上述编码形式各有各的适用范围,可根据需要采用。基于计算机视觉技术感知识别的特定标记可为肉眼可见的,如我们通常所见的二维码、条码、文字、图形、动作等,可移动终端设备可以通过常规的镜头获取,也可为肉眼不可见的,如红外线等非可见光形成或构成的二维码、条码、文字、图形、动作等,可通过相应的红外线等非可见光视觉捕捉。所述特定标记包含的指令可以是不可变的,即全部指令是不可变的,也可以部分可变的,即其中至少一个指令是不可变的,还可是全部可变的,即全部指令均是可变的;事先印刷、喷涂、雕刻等类型的均是不可变的,而如果是可以控制的,如通过电灯、显示器来展现的,通过控制电灯的开关、变换显示的内容即可实现可变。

上述可基于计算机视觉感知识别的特定标记可替换为可基于计算机听觉、触觉、味觉以及嗅觉感知识别的特定标记,且其分别采用便于计算机听觉、触觉、味觉或嗅觉感知识别的规范格式形式;听觉、触觉、味觉以及嗅觉和视觉一样均是人类认知外界的主要方式,前面对计算机视觉的运用进行了阐述,很显然也可拓展到计算机听觉、触觉、味觉以及嗅觉的运用中,这里的计算机触觉不是触摸屏触控技术这类的触摸技术,尽管也是通过触摸感知识别,而是特指仿人类的触觉,对于质感、力度的感知识别等,目前的计算机听觉、触觉、味觉以及嗅觉和计算机视觉的运用一样,只有通过检测、测量来感知识别内容的运用,而无驱动直接操作的运用。和计算机视觉类似,可基于计算机听觉感知识别的特定标记的载体可为声源物体,也可为可反射声波物体以及本身既非声源物体也非可反射声波物体但能通过声源物体或者可反射声波物体展现的非有形物体,相关解释说明参见前文,但和计算机视觉不同的是,可反射声波物体能量损耗较大,采用的场合较少,所使用的声波可以是次声波、可听波、超声波或微波超声,次声波适合长距离传播,同时人的耳朵听不到,因此可以在较大范围的区域如战场上采用。可基于计算机触觉感知识别的特定标记的载体可为触源物体,如某种材质的物体,不同的指令采用不同的材质,也可是本身既非触源物体但能通过触源物体展现的非有形物体,相关解释说明和前面类似的情形相似,不再赘述,要说明的如果要通过一个物体表示不同的材质那么该物体要具有相应的模拟能力,而在力度的模拟上则要简单得多。可基于计算机味觉感知识别的特定标记的载体可为味源物体,酸甜苦辣咸等味道的感知是人类等高等生物特有的一种感觉,也可为本身既非触源物体但能通过味源物体展现的非有形物体,相关解释说明和前面类似的情形相似,不再赘述。可基于计算机嗅觉感知识别的特定标记的载体为嗅源物体,嗅觉也是人类等高等生物特有的一种感觉,也可为本身既非触源物体但能通过嗅源物体展现的非有形物体。

上述可基于计算机视觉、听觉、触觉、味觉以及嗅觉感知识别的特定标记可用于存储、传递以及发布指令,也可同时还用于存储、传递以及发布非指令信息;这个用法可以运用到用于人与机器之间以及机器与机器之间的交互中,其技术方案为:

将所述特定标记用于人与机器之间或机器与机器之间基于计算机视觉、听觉、味觉、触觉和/或嗅觉传递和/或发布指令,或者同时还用于人与机器之间或机器与机器之间基于计算机视觉、听觉、味觉、触觉和/或嗅觉传递和/或发布非指令信息;目前已有的二维码等特定标记的运用,仅仅用来存储表示某些信息,这些信息只能被动被识别然后进行应用,而包含指令的话,可以直接驱动执行动作,可以实现主动交互。目前机器对于自然语言、人类行为的感知识别技术尽管已取得显著的进步,但离人类自身的能力仍有很大差距,比如自然语言的识别(属于计算机听觉),由于语言众多有些语言还有很多方言这就导致了实用的问题,但如果将语言限定某种规范格式,某种特定音质的某种规范读音,这就可以大大提高识别的准确率,从而可以用于人与机器之间或机器与机器之间基于计算机视觉、听觉、味觉、触觉、嗅觉(可单独采用,也可任意综合采用)传递、发布(可同时采用)指令,当然也可用于人与机器之间或机器与机器之间基于计算机视觉、听觉、味觉、触觉、嗅觉传递、发布非指令信息,还可仅用于于人与机器之间或机器与机器之间基于计算机视觉、听觉、味觉、触觉、嗅觉传递、发布非指令信息,即将前面应用方法中所述特定标记调整为仅包含非指令信息的情况并将所述特定标记用于人与机器之间或机器与机器之间基于计算机视觉、听觉、味觉、触觉和/或嗅觉传递和/或发布非指令信息。所述机器可进一步明确为机器人、计算机、有人驾驶汽车、无人驾驶汽车、有人驾驶飞机、无人机、有人驾驶船舶、无人驾驶船舶、无人驾驶飞艇、有人驾驶飞艇、航空气球、手机或可穿戴设备,无人机、无人驾驶汽车目前是研究热点,但从现有的研究看,都是研究设备本身的智能,而对于它们与外界的交互基本上没有研究,尽管人可以远程控制、监控,但这是一种基于有线和/或无线通信网络建立的交互,而且外人无法与其交互。而采用上述方法,则可以让无人机、无人驾驶汽车等与外界建立自主交互的途径,比依靠自身的传感器去检测、探测感知识别(判断)有时更简便更可靠,可以互补;在一些特定的场合甚至可以仅运用本方法实现无人自主/智能动作,而不需要复杂、高端的传感器系统。具体运用方法为:所述人或所述机器把要传递和/或发布的指令和/或非指令信息包含于可基于计算机视觉、听觉、味觉、触觉和/或嗅觉感知识别的特定标记中然后主动让交互的另一方所述机器可基于计算机视觉、听觉、味觉、触觉和/或嗅觉感知识别或直接识别以传递和/或发布指令和/或非指令信息;所述机器把要传递和/或发布的指令和/或非指令信息包含于可基于计算机视觉、听觉、味觉、触觉和/或嗅觉感知识别的特定标记中然后主动让交互的另一方所述人或所述机器可基于计算机视觉、听觉、味觉、触觉和/或嗅觉感知识别或直接识别以传递和/或发布指令和/或非指令信息。在人机交互中,人可把要传递和/或发布的指令、非指令信息包含于可基于计算机视觉、听觉、味觉、触觉、嗅觉感知识别的特定标记中然后主动让交互的另一方机器可基于计算机视觉、听觉、味觉、触觉、嗅觉感知识别,对于以文件、信号方式接收的特定标记,可以直接识别以传递、发布。其它交互情况与此类似,不再一一叙述。

上述方法可以构成一个应用系统,这个支持上述方法的应用系统的技术方案为:

所述应用系统可在可视范围内基于计算机视觉感知识别将所述特定标记或在可感知范围内基于计算机听觉、触觉、味觉或嗅觉感知识别将所述特定标记,或者所述应用系统可接收以有线电信号、有线光信号、光信号或无线电信号为载体的所述特定标记并基于计算机视觉、听觉、触觉、味觉或嗅觉识别,或者所述应用系统可直接对本地和/或网络上以存储文件为载体的所述特定标记基于计算机视觉、听觉、触觉、味觉或嗅觉识别。所述应用系统可在可感范围内被基于计算机视觉、听觉、触觉、味觉、嗅觉感知识别将所述特定标记(情况1,这种情况是先感知再识别)。上述特定标记也可以有线电信号、有线光信号、光信号或无线电信号为载体,所述应用系统可接收以有线电信号、有线光信号、光信号或无线电信号为载体的所述特定标记并基于计算机视觉、听觉、触觉、味觉、嗅觉识别(情况2,这种情况是先获取再识别)。上述特定标记也可以存储文件为载体,所述应用系统可直接对本地和/或网络上以存储文件为载体的所述特定标记基于计算机视觉、听觉、触觉、味觉、嗅觉识别(情况3,这种情况是直接对存储文件中的特定标记进行识别)。所述应用系统可根据所识别的信息获取指令并按要求执行(因为指令本身可能带条件或非指令信息中附带条件等要求),也可能同时还获取了其中所包含的非指令信息并加工、存储、展现和/或发送,在仅有非指令信息的时候则是仅获取了其中所包含的非指令信息并加工、存储、展现和/或发送。所述应用系统可以是新开发的,也可以是基于现有操作系统(基于某种硬件系统)或者硬件改造的。所述执行包含一个由指令译码模块译码处理所获取指令的过程,由于一般采用非机器语言指令,所以这个时候需要一个指令译码模块译码处理对获取指令进行译码,变成机器可直接执行的指令。所述应用系统可以为硬件系统(机器直接执行指令),也可为具有操作系统的硬件系统(由操作系统解释执行执行),也可为在具有操作系统的硬件系统上运行的应用软件系统(由应用软件解释执行执行,这个应用软件相当于一个总控程序,而非一个任意的应用软件)。如果回到前面人机交互、机机交互等情况中,所述应用系统依托于所述人与机器之间的那个机器或所述机器与机器之间的其中一个机器或前两种之外的某机器,即该应用系统依托于某个机器;还可进一步明确所述应用系统和所依托于的机器是同一关系(该应用系统就是那个被依托于的机器,如电子计算机、机器人),也可以是被包含关系,即该应用系统就是运行那个被依托于的机器上的一个子系统,硬件上本身就是那个被依托于的机器的一部分。所述应用系统可以为可穿戴设备(如手表、腕带)、可手持设备(如手机、平板电脑)、可人负载设备(需要背、杠、双手把持的设备,一般比可穿戴设备可手持设备更大更重)、可人力驱动设备(如推车、自行车)、可自行设备(如汽车、飞机、火车、轮船)、可牵引设备(如被牵引的车厢,自身无动力)、可被运载工具承载移动的设备(如车载设备、可以用车运输的设备),也可以是同时具有上述两种及以上类型特征的混合类型设备上能够安装使用的应用系统。

本发明提供的特定标记,可以采用现有的流行的二维码、条码等形式,并可拓展到计算机听觉、触觉、味觉及嗅觉感知识别的特定标记。但和现有的二维码、条码等形式的区别特征是包含指令可以直接驱动设备动作,从而可以存储、传递发布指令及非指令信息,可用于人机之间或机机之间基于计算机视觉传递、发布,可在无网络连接、直接接触等情况下使用,从而为人机交互、机机交互提供了一种简单可靠的基于计算机视觉等模拟人类交互方式的途径;也可用来实现快捷操作,通过简化输入提高效率。

具体实施方式

实施例1

一种印有转向指令的路标

在介绍道路交通设置的路标上,对于需要提醒转向的位置,均印上对应的转向指令二维码,无人驾驶汽车或有人驾驶的智能汽车在行驶中通过前置摄像头自动感知识别此路标后自主转向。

实施例2

一种人机交互方法

一个餐厅服务机器人和就餐客人之间的交互。点菜时,客人把座位号二维码出示给机器人,机器人知道了他是哪桌的客人,然后将所点菜对应的二维码出示给机器人,机器人就知道了该客人点了哪些菜。

实施例3

一种快速操作电子计算机方法

将一些常用的操作事先制作成指令二维码,在需要执行时直接通过其外接的摄像头扫描识别需执行操作对应的指令二维码,其外接的摄像头扫描识别后即执行。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1