具有同时文本编辑的语音识别方法和系统的制作方法_3

文档序号：9872437阅读：来源：国知局

然而用户视图371将保持不被改变，将调节语音识别引擎视图372，作为其结果，两个视图在图3G中再一次变成相同的。
[0034]图3A-3G图解医师使用根据本发明的系统或方法能够同时地听写要被插入到报告的“Rx右腿”字段中的词汇并且改正先前已经被插入到“Rx左腿”字段中的文本。因此，医师节约了时间，并且避免了用于在记录模式和编辑模式之间转变的多余的点击，对医师来说提高了整体用户友好度。
[0035]注意，根据本发明的方法或其某些步骤将代表性地为计算机实现的，以在数据处理系统或计算设备上运行。如本领域技术人员可以理解的那样，根据本发明操作的数据处理系统或计算设备可以包括工作站、服务器、膝上型计算机、台式机、手持式设备、移动设备、平板计算机、或其它计算设备。
[0036]数据处理系统或计算设备可以包括用于在若干组件之间的直接或间接的连接性的总线或网络、存储器或数据库、一个或多个处理器、输入/输出端口、电源等。本领域技术人员将领会的是，总线或网络可以包括一个或多个总线，诸如地址总线、数据总线、或其任何结合，或可以包括一个或多个网络链接。另外本领域技术人员将领会的是，依赖于对特定的实施例所意图的应用和使用，可以通过单个设备实现这些组件中的多个。类似地，在一些实例中，可以通过多个设备实现单个组件。
[0037]数据处理系统或计算设备可以包括各种计算机可读媒体或与其交互。例如，计算机可读媒体可以包括随机存取存储器(RAM)、只读存储器(ROM)、电可擦可编程只读存储器(EEPROM)、闪存存储器或其它存储器技术、CDR0M、数字通用盘(DVD)或其它光学或全息媒体、磁带盒、磁带、磁盘储存或其它磁性储存设备，其可以被用于编码信息并且可以由数据处理系统或计算设备访问。
[0038]存储器可以包括以易失性和/或非易失性存储器形式的计算机储存媒体。存储器可以是可移除的、不可移除的、或其任何结合。示例性硬件设备是诸如硬驱动器、固态存储器、光盘驱动器等的设备。数据处理系统或计算设备可以包括从诸如存储器、各种I/O组件等中读取数据的一个或多个处理器。
[0039]I/O端口可以允许数据处理系统或计算设备被本地地耦合到其它设备，诸如I/O组件。I/O组件中的一些可以被构建到计算设备中。这样的I/O组件的示例包括麦克风、操纵杆、记录设备、游戏板、卫星盘、扫描仪、打印机、无线设备、联网设备等。
[0040]虽然已经通过参考具体的实施例图解了本发明，但是对本领域技术人员将显然的是，本发明不被限制于前述例证性实施例的细节，并且本发明可以被体现有各种改变和更改而不脱离其范围。因此，本实施例在各个方面要被认为是例证性的而不是约束性的，由随附的权利要求而不是由前述描述指示本发明的范围，并且因此落入权利要求的等价物的意义和范围内的所有的改变都意图被包括在其中。换言之，预期覆盖落入基本根本性原理的范围内并且其本质属性在本专利申请中被主张的任何以及所有更改、变体或等价。另外，本专利申请的读者将理解的是，词汇“包括”或“包括”不排除其它元件或步骤，词汇“一个”或“一个”不排除多个，并且诸如计算机系统、处理器、或另一被集成的单元的单个元件可以实行在权利要求中陈述的若干装置的功能。在权利要求中的任何参考标记将不被解释为限制相关的各个权利要求。术语“第一”、“第二”、“第三”、“a”、“b”、“c”等，当在说明书或在权利要求中被使用时，它们被引入以区分类似的元件或步骤并且不必然地描述有序的或按时序的顺序。类似地，术语“顶部”、“底部”、“之上”、“之下”等被引入用于描述性目的，并且不必然地表示相对位置。要理解的是，这样使用的术语在适当的情况下是可互换的，并且本发明的实施例能够以其它次序、或以不同于上面描述的或图解的(一个或多个)方向的方向根据本发明操作。
【主权项】
1.一种用于从音频输入生成并编辑文本的方法，所述方法包括: -将来自用户的语音排队在音频队列(201)中； -通过语音识别将被存储在所述音频队列(201)中的所述语音转换成文本；以及 -向所述用户显示所述文本，其特征在于，所述方法还包括: -将文本编辑事件(106，107)排队在所述音频队列(201)中； -即刻向所述用户显示由所述文本编辑事件(106)导致的改变； -当转换在所述音频队列(201)中排队在所述文本编辑事件(107)之前的所有语音时停止所述语音识别； -在将来自所述用户的另外的语音排队在所述音频队列(201)中的同时处理(111)所述文本编辑事件并编辑所述文本;以及 -当已经处理了所述文本编辑事件时恢复所述语音识别。2.根据权利要求1所述的方法，其中所述文本编辑事件包括话音命令。3.根据权利要求1所述的方法，其中所述文本编辑事件包括以下中的一个或多个: -在所述文本中的导航指令； -针对所述文本的一部分的选择和编辑指令； -针对所述文本的部分的选择和格式化指令； -针对所述文本的部分的选择和删除指令； -针对来自下拉列表的字段值的选择指令； -用于将预定义的文本部分插入到所述文本中的指令；以及 -针对已经被选择的所述文本的部分的取消选择指令。4.一种用于从音频输入生成并编辑文本的系统，所述系统包括: -音频队列(201)，被配置成存储来自用户的语音； -语音识别引擎(202)，被配置成将被存储在所述音频队列(201)中的所述语音转换成文本； -用户视图引擎(203)和显示器(204)，用于向所述用户显示所述文本；以及 -事件处理器(205)，用于处理由所述用户输入的文本编辑事件，其特征在于 -所述音频队列(201)被适配成对所述文本编辑事件排队； -所述用户视图引擎(203)和显示器(204)被适配成即刻向所述用户显示由所述文本编辑事件导致的改变； -所述事件处理器(205)被适配成当转换在所述音频队列(201)中排队在所述文本编辑事件之前的所有语音时停止由所述语音识别引擎(202)的语音识别； -所述事件处理器(205)还被配置成在将来自所述用户的另外的语音存储在所述音频队列(201)中的同时处理所述文本编辑事件并编辑所述文本;以及 -所述事件处理器(205)被适配成当已经处理了所述文本编辑事件时恢复由所述语音识别引擎(202)的语音识别。
【专利摘要】为了从音频输入生成文本，将来自用户的语音存储在音频队列（201）中，通过语音识别将所存储的语音转换成文本，并向用户显示文本。将由用户输入的文本编辑事件（106、107）也存储在音频队列（20）中，并且即刻向用户显示由文本编辑事件（201）导致的改变。当将在音频队列（20）中排队在文本编辑事件（107）之前的所有语音转换成文本时，停止语音识别，并在将来自用户的另外的语音存储到音频队列（201）中的同时处理（111）文本编辑事件。一处理完文本编辑事件就恢复语音识别。
【IPC分类】G06F17/24, G10L15/26
【公开号】CN105637503
【申请号】CN201480058245
【发明人】J.范霍伊维斯恩, G.雷纳德
【申请人】爱克发医疗保健公司
【公开日】2016年6月1日
【申请日】2014年10月21日
【公告号】EP2866153A1, WO2015059130A1

完整全部详细技术资料下载

当前第3页1 2 3