用于评估视觉反应测试中的结果的可靠性的方法和系统与流程

文档序号:21931865发布日期:2020-08-21 14:57阅读:281来源:国知局
用于评估视觉反应测试中的结果的可靠性的方法和系统与流程
本发明涉及一种用于评估视觉反应测试中的结果的可靠性的方法和系统。本发明尤其涉及一种用于确定视觉反应测试用户是否完全专注、作弊或未充分了解测试操作原理的新方法。
背景技术
:测量人类视觉的特性需要合作的测试人员应对用于评定眼睛或视觉系统的结构或测量来自神经通路的电响应的装置。在视觉测量中,通常显示标准化的视觉刺激供测试人员检测或识别。测试人员通常使用按钮或口头给出针对视觉刺激的响应。可以手动或自动保存此响应,并根据响应呈现下一个刺激(更容易或更困难)。这种方法学被称为心理物理学。该方法学中最重要的部分是视觉刺激的特性,视觉刺激特性的设计必须符合理论参考框架。为了从心理物理测量中获得准确的结果,另一关键部分是测试人员的配合:她/他是否能够在合理的时间内基于视觉刺激做出一致的响应。在痴呆或认知障碍的情况下,认知表现可能非常慢或可变,以至于影响了测量的准确性。对视觉刺激的缓慢回答还会削弱视觉执行能力,即,与更快的人相比,无法基于视觉信息迅速采取行动。当一个人进行视觉反应时间测试时,在视觉刺激出现时,他/她应该完全专注于视觉刺激并仅基于刺激做出响应,而不是思考其他事情并按照并非基于视觉刺激出现的节奏按应答按钮。这例如在以下情况下可能会发生:头部受外伤后的人装病或作弊并试图故意获得异常缓慢的结果,以便说服保险公司他患有脑损伤并遭受外伤性脑损伤。该人可能会出现注意力困难,这可能导致在进行反应时间测试时出现专注困难。如果人没有完全了解测试原理,也会出现问题。在这种情况下,反应时间测试将无法测量对视觉刺激的反应。专利文献us9095295b2提出了一种用于测量用户的视觉感知速度的方法,wo2017/024845a1提出了一种刺激信息编辑方法,us2005/0143629a1和us5957859提出了用于检测欺骗的方法。技术实现要素:本发明的一个目的是减少或甚至消除现有技术中出现的上述问题。本发明的一个目的是在简单且易于使用的视觉反应测试中获得可靠的结果。本发明的一个目的是提供一种简单且有效的方法,来确定视觉反应测试用户是否完全专注、作弊或未完全了解测试的操作原理。本发明尤其具有提供视觉反应时间测试的目的,其中为了对人的视觉性能做出判断,我们了解对于非常基本且容易的视觉刺激的认知反应时间,使得即使在视觉系统有缺陷的情况下测试的限制因素不是测试刺激的视觉感知。术语和缩写ocusweep装置ocuspecto独特的多重固定视野计,反应时间视野计ocurt测试ocusweep反应时间测试rt或realrt测试步骤的反应时间dt测试步骤的延迟时间stp测试步骤的刺激时间点rtp测试步骤的报告时间点st或steptime测试步骤的步骤时间st/dt步骤的步骤时间与延迟时间之间的相关性系数rt/dt步骤的反应时间与延迟时间之间的相关性系数此外,为了实现上述目的和根据本发明的其他目的,用于评估视觉反应测试中的结果的可靠性的方法和系统由所附独立权利要求呈现。即便没有特别提及,本文中提到的实施例、示例和优点在适用时涉及根据本发明的方法及系统。根据本发明的用于评估测试用户进行的视觉反应测试中的结果的可靠性的典型方法包括:开始测试;重复多个测试步骤,直到满足停止标准为止,单个测试步骤包括以下阶段:1)选择步骤的延迟时间dt(step),dt(step)在步骤之间变化;2)在步骤的延迟时间dt(step)内不产生待识别的视觉测试刺激;3)在步骤的刺激时间点stp(step)产生视觉测试刺激;4)当用户报告时,在步骤的报告时间点rtp(step)接收刺激的识别;5)通过返回阶段1)开始新的测试步骤,直到满足测试的停止标准为止。所述方法还包括:计算:步骤的反应时间rt(step),其为步骤的刺激时间点与步骤的报告时间点之间消逝的时间,即,rt(step)=rtp(step)-stp(step),以及步骤的步骤时间st(step),其为步骤的延迟时间与步骤的反应时间的和,即,st(step)=dt(step)+rt(step);确定每个测试步骤的步骤时间与延迟时间之间的相关性或反应时间与延迟时间之间的相关性;将所述相关性与用于可靠性的预定义的相关性值进行比较,从而确定结果的可靠性水平和测试对象的响应的一致性。描述本发明的一种方式是限定本发明涉及用于对用户进行的视觉反应测试中的结果的可靠性进行评估的方法和系统。具有以下阶段的方法步骤重复多次:-在刺激时间点向用户显示具有可识别值的视觉测试刺激;-在报告时间点,用户报告其何时识别刺激值;-在视觉刺激之间插入可变且相对短的延迟时间;-记录刺激时间点与报告时间点之间的反应时间;-步骤时间计算为每个步骤的延迟时间与反应时间的和。将步骤时间与延迟时间之间的相关性或反应时间与延迟时间之间的相关性与用于可靠性的预定义的相关性值进行比较,从而确定结果的可靠性水平。在本发明的实施例中,所述方法包括:确定每个测试步骤的步骤时间与延迟时间之间的相关性和反应时间与延迟时间之间的相关性;将所确定的相关性与用于可靠性的预定义的相关性值进行比较,从而确定结果的可靠性水平和测试对象的响应的一致性。由此发现了,为确保人实际上是否对视觉刺激的出现做出反应,可以在视觉刺激出现之前插入可变且相对短的延迟时间。如果该人完全专注于视觉刺激的出现,则他/她的反应时间rt不会受到延迟的长度的影响。在这种情况下,一步骤时间st的变化的根源是由于延迟时间dt的变化,即,这两个变量之间存在统计关系。因此,对应的相关性系数st/dt高。表1.模拟反应时间测试例,其中测试对象专心致志,因此在出现刺激后400毫秒内一致回答。这导致dt与st之间的完美的相关性。方差(rt)和方差(rt)/方差(dt)均为零。所有这些都表明可靠的测试结果。所有时间单位均为毫秒。计算中使用了总方差和皮尔逊相关性。如果人没有完全专注于视觉刺激并在思考其他事情(可能是在装病或作弊,或者没有完全了解测试原理),他/她倾向于以恒定的节奏按下按钮,而忽略了延迟的长度。于是,相关性系数st/dt低。表2.模拟反应时间测试例,其中测试对象没有完全专注,并且除了在测试中间单打喷嚏或其他干扰(在rt列中为2x900ms)时一致回答。这导致计算出的方差显著增加到可以认为测试不可靠的地步。方差(rt)/方差(dt)也是如此。然而,由于dt与st之间存在相当线性的关系,因此相关性指示可靠的测试例,因此是针对孤立错误的更鲁棒的方法。所有时间单位均为毫秒。计算中使用了总方差和皮尔逊相关性。表3.模拟反应时间例,其中测试对象试图通过以不基于刺激出现的规律间隔回答来作弊。这导致不存在相关性(dt,st)以及高方差(rt)和方差(rt)/方差(dt)。这些表明测试结果不可靠。所有时间单位均为毫秒。计算中使用了总方差和皮尔逊相关性。表4.模拟反应时间例,其中测试对象正在学习如何进行测试,并且在趋向测试结束时越来越快。在测试的后半部分,测试对象的反应时间稳定在400–500毫秒之间,表明他/她已经学会了测试。由于在测试期间rt变得更快,所以方差(rt)和方差(rt)/方差(dt)高,表明该测试不可靠。然而,由于dt与st之间存在相当线性的关系,因此相关性指示可靠的测试例。所有时间单位均为毫秒。计算中使用了总方差和皮尔逊相关性。还可以通过将反应时间rt的变异性与延迟时间dt的变异性进行比较,即两个变量之间存在统计关系,确定结果的可靠性水平。可以确定对应的相关性系数rt/dt。在实施例中,所述方法包括:对于正确识别了刺激的这些步骤,确定步骤的步骤时间与延迟时间之间的相关性系数st/dt;将所计算出的相关性系数st/dt与可靠性的预定义值进行比较,从而确定结果的可靠性水平。因此,可以通过相关性系数st/dt或rt/dt来判断测量的可靠性。如果相关性足够高,则可以认为测量是可靠的。相关性可以表示任何统计关联。在一实施例中,相关性是指变量接近彼此而具有线性关系(即线性相关性)的程度。本发明的实施例使用皮尔逊相关性系数。在一实施例中,相关性是指非线性相关性。一实施例使用秩相关性,诸如斯皮尔曼秩相关性系数或肯德尔秩相关性系数。在一实施例中,相关性是指从dt和rt,或dt和st,或rt和st得出的任何数学函数。为了找到可靠性的预定义的相关性值,即,用于可靠测量的临界值,可以在一个测试用户内的重复测量中研究相关性系数,以发现学习的效果。另外,可以在熟悉测试的人员中研究相关性系数,并将其结果与增加认知负荷和故意装病或作弊期间获得的结果进行比较。在本发明的实施例中,在步骤的延迟时间期间提供伪刺激或不希望在测试中识别的另一刺激。这种刺激例如意图测试该测试用户是否完全专注于测试。在实施例中,从一组有限的步骤计算相关性。例如,可以仅从正确识别刺激的步骤,或者仅从反应时间rt(step)或步骤时间st(step)或延迟时间dt(step)满足特定标准的步骤计算相关性。在实施例中,测试期间或测试步骤的子集期间的响应的可靠性还由与正确答案相关的错误答案的数量来确定。在实施例中,为了达到更好的测试-再测试可重复性,通过使用测试步骤的最快的子集片段,例如通过将步骤系列划分为子块并选择最快的可靠子块,确定测试对象的报告的实际反应时间rt。最快的例如是指测试用户在最短时间内可接受地响应的测试或测试片段或测试子块。在实施例中,所述方法包括:针对所有测试步骤或测试步骤的任何子集,确定步骤的步骤时间与延迟时间之间的相关性系数st/dt(step);将计算出的相关性系数与可靠性的预定义值进行比较,从而确定结果的可靠性水平和测试对象响应的一致性。在本发明的实施例中,所产生的视觉测试刺激包含具有视觉可识别值的特性。测试用户必须至少集中精力以识别该值。当用户识别出该值时,她/他例如与报告装置报告该值。步骤的延迟时间可以随机变化,或可以通过任何预定义的顺序或通过算法在延迟时间的下限与上限之间变化。下限和/或上限可以在测试步骤之间改变。这可以根据用户的反应时间或根据其他预定义的标准来完成。如果用户反应缓慢,则下限和上限可以增大。如果用户反应迅速,则下限和上限可以减小。在实施例中,将下限选择为在50ms~500ms之间或65ms~200ms之间。在实施例中,将上限选择为在200ms~1000ms之间或250ms~800ms之间。在实施例中,用户通过按压报告按钮来完成报告。在本发明的实施例中,刺激特性的值选自包含至少两个不同值的组。按钮可以选自包含至少两个不同的报告按钮的组,从而每个按钮与刺激特性的一个可能的值关联。视觉测试刺激可以包括具有指示方向的视觉可识别值的符号,诸如箭头或标准兰道环视标。在实施例中,所述包含至少两个不同值的组包括值“左”和“右”。这些是简单且可靠的符号和值。在实施例中,测试用户通过按钮、触摸元件、身体或身体部位的运动、眼睛运动、口头反馈、来自大脑或神经系统的磁或电信号来报告视觉测试刺激或视觉测试刺激特性的值,诸如刺激方向。在实施例中,测试用户对视觉测试刺激或视觉测试刺激特性的值的不正确识别将向测试用户产生指示错误响应的错误响应反馈或信号,因此鼓励正确响应。反馈也可以是声音、振动或光或它们的任何组合。在本发明的实施例中,在电子屏幕上产生视觉测试刺激。在实施例中,视觉测试刺激可以显示在屏幕上稍微不同的位置上。特别是,如果正确识别了刺激,则下一个视觉测试刺激可以在屏幕上的不同位置上产生。在本发明的实施例中,当记录了正确识别出刺激的多个连续步骤时,将停止标准定义为被满足。该数量可以是例如3~10、4~8或5~7。在本发明的实施例中,将具有较短延迟的步骤的反应时间求和、求平均或以其他方式归拢在一起作为rt(shortdelays)。与此独立地,将延迟长于归拢至rt(shortdelays)的步骤的步骤的反应时间求和、求平均或以其他方式归拢在一起作为rt(longdelays)。rt(shortdelays)和rt(longdelays)的绝对值或它们之间的差或关系用于进一步分析。可以使用它们来确定测试用户的注意力从先前步骤的报告任务中恢复的程度(使用rt(shortdelays)与rt(longdelays)之间的关系),或者确定在没有先前步骤影响的情况下反应时间是多少,即rt(longdelays)。在实施例中,本发明可以用于确定一个人从先前步骤中恢复以专注于新的刺激所需的最短时间。这通过缩短延迟直到反应时间开始变慢来完成。本发明可以实现为用于对用户进行的视觉反应测试中的结果的可靠性进行的评估系统。该系统包括:-具有存储器的计算机;-能在存储器上运行的计算机程序,所述程序包括适于执行和控制视觉反应测试的程序代码元素;-显示装置,布置为按照计算机程序的指示显示视觉测试刺激;-报告装置,布置为接收用户对刺激的识别,并且布置为将所述识别的信息传送到计算机。该系统,特别是其具有程序代码元素的计算机程序,适于执行根据本文提到的实施例的方法步骤。附图说明下面参考所附的示意图更详细描述本发明,其中,图1示出了第一轮ocurt测量ocurt1的步骤时间的相关性;图2示出了第二轮ocurt测量ocurt2的步骤时间的相关性;图3示出了第三轮ocurt测量ocurt3的步骤时间的相关性;图4示出了增加认知负荷期间ocurt测试的相关性;图5示出了故意作弊期间ocurt测试的相关性;图6示出了软化标准兰道环视标的示例;图7示出了错误响应指示符图像的示例。具体实施方式示例1:ocusweep反应时间测试(ocurt测试)为了找到可靠测量的临界值,我们研究了一个测试对象中重复测量的相关性系数,以了解学习效果。此外,我们将测试熟练人员的相关性系数与增加认知负荷和故意装病或作弊期间获得的结果进行比较。测试对象以近距离坐在ocusweep装置和ocusweep平板电脑前面,然后将ocusweep遥控器交给他们。在测试中,平板电脑显示一系列黑环,这些黑环在左侧或右侧具有开口。要求测试对象根据开口位于哪一侧来按遥控器的左按钮或右按钮,并告诉他们尽快这样做。还指示他们只有在看到开口时回答,不要瞎猜。错误回答的结果是,平板电脑上出现红色圆圈,在正确按下按钮后红色圆圈消失。根据对象的个人反应时间,仅在100ms至400-560ms的随机延迟时段后才显示下一个符号。在三轮(称为ocurt1,ocurt2,ocurt3)后,测试终止,并且计算六个连续正确答案的最短中位反应时间,并将其显示在平板电脑屏幕上。在此测试的一种变型中,称为“认知负荷”,测试对象被告知在他们进行反应时间测试时从200倒数7秒。指示他们不要在两轮之间计数,而在新一轮开始时再次开始计数。还告诉测试对象,如果他们在测试中间忘记了从哪个数字计数,或如果他们计到零,则从200开始重新计数。在另一种称为“作弊”的变型中,测试对象被告知具有以下心态:想象一下,您撞到头了,您将去看医生测试您的反应时间。然而,您想从您的保险公司那里得到一些钱,并故意缓慢地回答,好像头部外伤已经影响了您的反应时间。综上所述,您应该缓慢但以貌似合理的方式回答,以骗取保险公司的钱。借助相关性系数st/dt对ocurt测量的可靠性进行了分类。如果人们完全专注于视觉刺激的出现,则反应时间不受随机延迟的变异的影响,但是可以在总步骤时间中检测到变异,从而导致高相关性值。图1示出了每个测试对象(n=44)的第一轮ocurt测量ocurt1的延迟关于总步骤时间st(此处标记为steptime,x轴)和各个反应时间rt(realrt,y轴)的相关性系数。带有图例的测试对象显示了关于steptime的相关性低于70%,这意味着这些人没有完全专注于视觉刺激的出现,可能是因为专注于其他想法或没有完全掌握ocurt测试。由于平板电脑导致的不舒适眩光,13号对象无法进行测试。图2示出了每个测试对象(n=44)的第二轮ocurt测量ocurt2关于总步骤时间(x轴)和各个反应时间(realrt,y轴)的相关性系数。有关进一步说明,请参见图1的说明。图3示出了每个测试对象(n=44)的第三轮ocurt测量ocurt3关于总步骤时间(x轴)和各个反应时间(realrt,y轴)的相关性系数。有关进一步说明,请参见图1的说明。图1至图3显示了练习ocurt测试有助于获得更短的反应时间。在重复测量中,相关性高于70%的研究组的平均反应时间比先前测量好约8ms(ocurt1:460.6ms;ocurt2:451.7ms;ocurt3:443.4ms)。如果人没有完全专注于测试刺激的出现且进行识别并通过按下按钮来报告其方向,那么他可能反应慢。为了使他们更难专注于进行ocurt测试,通过告诉他们在他们进行反应时间测试时从200倒数7秒,来增加测试对象的认知负荷。在图4中,我们可以看到所有测试对象具有低的steptime相关性,表明他们无法同时专心于计数和测试刺激的出现。没有一个测试人员可以实现高的steptime相关性,最大值为59%,平均值为23.7%。图5示出了故意作弊期间ocurt测试的相关性。测试对象的回答缓慢,但以一种貌似合理的方式试图通过具有头部外伤导致的脑部损伤的装病来骗取保险公司的钱。在图5所示的结果中,我们可以看到只有一个测试对象可以实现高的steptime相关性评分(80%),而其他测试对象则专注于作弊而不是视觉反应时间测试。图1至图5的结果表明,相关性系数st/dt清楚地区分了如下ocurt测量:这些测量是在注意力资源完全旨在测试刺激的出现且识别刺激并通过尽快按下按钮报告其方向的情况下做出的。不熟悉测试,同时考虑作弊或试图进行困难的数学计算会明显降低steptime相关性系数。基于以上图的视觉检查,临界值为70%,这似乎是可靠的ocurt测试的标志。示例2:ocurt测试算法的示例ocurt的一些可能示例如下。左右方向的图像或视标(诸如标准兰道环视标)可以用作视觉测试刺激。图6显示了一个示例,即指向右的软化标准兰道环视标。在测试用户的每次正确响应之后,可以使视觉测试刺激在屏幕上略微移动,使得用户更难以根据测试图像方向的“运动”做出结论。如果测试对象的回答有误,例如按下错误方向的按钮,可以显示错误响应指示符图像来代替测试图像。可以持续显示错误响应指示符图像例如1~3秒或2.5秒。图7显示了错误响应指示符图像的示例,即环。环可以是例如红色的。可以将响应等待超时时间设置为例如2至5秒,例如为4秒。如果测试用户在此超时内未响应,则算法可以解释为测试用户未看到视标。在实施例中,如果测试对象在超时时间期间未响应,不解释为错误,但是仍然可以显示红色错误环。在测试开始之前,可以有语音倒数(3-2-1)。在此倒数期间,可以显示图像,诸如黑环。倒数数字之间的时间可以是例如1~3秒或2秒左右。在倒计时后,测试对象开始识别视觉测试刺激并报告,即回答,例如通过针对每个图像按左按钮或右按钮。测试可以包括多轮,例如3轮。一轮的结束标准可以变化。例如,结束标准可以是在15个步骤中连续有6个正确答案。可能的话,如果没有,则该轮将继续进行,直到连续出现4个正确答案或最大步骤数量为止,例如在一轮测试中达到30步骤数量。在一轮结束后,将立即开始下一轮的倒计时。在例如三轮后,测试将停止。最终反应时间可以例如计算为连续最快的6或4个正确响应中最快的中位数。当报告中的错误百分比低于某个限值(例如,15%)时,认为最终结果是可靠的。在测试结束后,最终结果将显示给用户。结果可以显示例如反应时间、测试持续时间和计算出反应时间的一轮中计算出的误差百分比。可以利用环境光传感器测量背景光水平,如果光水平达到预定的停止值,诸如200cd/m2,则停止测试。附图和示例仅显示了根据本发明的一些优选实施例。关于本发明的主要思想的次要事实,对于本领域技术人员而言已知的事实或明显的事实不必讨论。对于本领域技术人员显而易见的是,本发明不仅限于上述示例,而是本发明可以在以下呈现的权利要求的范围内变化。从属权利要求提出了本发明的一些可能的实施例,并且它们不被认为限制了本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1