根据声音认识的汉语检索方式的制作方法

文档序号：110561阅读：285来源：国知局

专利名称:根据声音认识的汉语检索方式的制作方法
本发明是关于把按照汉语拼音及声调而发音的声音信号变换为发音记号及声调记号，以检索汉语、输出汉语文字的根据汉语的声音认识的汉语检索方式。
在原来的这种汉语汉字的检索方式中，采用了要素输入板方式。这种要素输入板方式就是将汉语的全部汉字印刷在要素输入板上，在印刷了的汉字上附上编码，在要素输入板上的汉字由人手检出，通过以笔尖等压下，汉字的编码就被送出到信息处理装置，与该编码相符的汉字文字图形数据就被显示在CRT(阴极射线管)上。采用这种检索方式的制品，本申请人已将N6300/50N中文终端输出到中国，一般地被使用着。
还有，由于这种方式必须从要素输入板上的汉语的全部汉字中检出1个汉字，这与本发明的声音认识输入方式相比较需要2.5～6倍的检索时间。
本发明的目的在于通过声音认识而能直接根据声音以检索汉语汉字，从而改善上述缺点，以提供能使汉语的检索高速化的汉语检索方式。
本发明的根据声音认识的汉语检索方式，在具有显示装置及键盘，把汉语从文件中检索的汉语检索方式中，包括应答于逐一字发音的汉语的声音而将对应于该声音的发音记号和声调记号输出的汉语的声音认识装置。
将汉语的汉字/数字的发音记号及声调记号合并一起以存储汉语的汉字/数字的文字图形的汉字文字图形文件。
应答于来自上述汉语的声音认识装置的发音记号及声调记号，将与该发音记号及声调记号相符合的汉字文字图形从上述汉字文字图形文件中读出，在上述显示装置中表示汉语的汉字/数字，同时从所表示的汉字/数字中，由上述键盘的输入选择目的汉字/数字的装置。
图1是表示根据本发明的检索方式的一实施例的图，图2是表示控制部的构成与声音输入部，CRT、键盘及标准图形文件的连接关系的图，图3是表示标准图形文件的存储形式的图，图4是表示信息处理装置的构成与汉语的声音认识装置及汉字文字图形文件的连接关系的图，图5是表示汉字文字图形文件的存储形式的图。
下面将参照附图对本发明的根据声音认识的汉语检索方式详细地加以说明。
参照图1，本发明的一实施例具有由进行声音输入的声音输入部2、数据输入用的键盘4、表示至少一个发音记号、声调、汉语汉字以及输入数据的CRT3、将声音编码数据、逻辑地址、发音记号及声调按普通话语音表的顺序存储的标准图形文件6，以及控制这些构成要素的控制部5而构成的汉语声音认识装置1，信息处理装置7，和按发音记号及声调构成的组的顺序存储汉语的汉字/数字文字图形的汉字文字图形文件8。
其次，对使用了汉语声音认识装置1的汉语检索方式的动作详细地说明。
例如，要检索“我在日本国学习中文“这句子时，对声音输入部2，配合发音记号和声调，逐字地发音为“Wǒ zài ri běn guó xué xí zhōng wén”。
其次，参照图1、图2和图3对将这声音输入、认识的汉语声音认识装置1的构成和动作详细地说明。
作为声音认识的前提，必须作成标准图形文件6。这个标准图形文件6的作成是如下述那样进行的。
参照图2，例如发音记号“wo”与声调“第3声(
)”组合而发音为“wo”时，以键盘4将发音记号数据“wo”及声调记号数据“3”输入。这样，被输入的数据“wo”及“3”通过键盘控制部58的发音/声调记号数据部582而被送到文件控制部57，通过发音/声调记号写入部572而被存储到标准图形文件6的所定地址，例如图3所示的地址n7上。这时，在数据“wo”及“3”被送到文件控制部57的同时，表示文件作成的信号就被送到检索/文件作成检出部62。
在这样的状态下所发音的声音“wǒ”，在声音输入部2被变换为电信号并被放大，通过低通滤波器而进行模拟/数字变换。这一例子可参照美国专利公报4，239，936号的图3及第4栏的记载。这样被变换了数字形式的声音电信号，在声音编码控制部60，例如通过适应型差动脉冲码调制(ADPCM)方式而被编码。以这方式而被编码的声音编码数据被存储在存储部61中，然后被读出，再被送到检索/文件作成检出部62。检索/文件作成检出部62根据上述的信号检出了这是文件作成处理，所以就把收到的声音编码数据送到文件控制部57的声音编码数据写入部571。这个声音编码数据写入部571将声音编码数据存储在标准图形文件6的所定地址，例如图3所示的地址n7上。图3所示的「阿」、「日」、「在」、「本」、「中」、「习」、「国」、「文」、「学」、「熨」各自的声音编码数据、发音记号及声调的组分别被存储在所定的地址上，以作成标准图形文件6。
其次，就本发明的检索方式中的声音认识处理加以详细说明。
首先被发音的声音“wǒ”在声音输入部2被变换为数字信号，在声音编码控制部60被编码，然后作为声音编码数据而被存储在存储部61中。这时，由于没有数据从键盘4被输入，从存储部61被读出的声音编码数据在检索/文件作成检出部62被检索处理及检出，接着被送到比较控制部51。另一方面，从标准图形文件6通过声音编码数据读出部573顺次地读出声音编码数据，并将它送到比较控制部51。在比较控制部51，将来自检索/文件作成检出部62的数据与顺次来自声音编码数据读出部573的数据顺次地比较。一致判断部52根据比较结果，作出一致或不一致的判断。只要不被判断为一致，在比较完毕检出部53直到判断为标准图形文件6的最后数据为止，在比较控制部51的比较动作重复地进行。其结果，直至最后的数据继续地被判断为不一致时，在比较完毕检出部发出完毕信号。误差表示控制部55应答于这个信号而向误差信息读出部575送出误差信息读出指示。误差信息读出部575应答于这个指示从而标准图形文件6读出误差信息，并向误差信息表示部562送出该信息。误差表示控制部55应答于上述完毕信号对误差信息表示部562输出表示指示。误差信息表示部562则应答于这个表示指示，将来自误差信息读出部575的误差信息表示在CRT3上。这个误差信息表示出“汉语的发音不好，这是在标准图形文件6中没有存储的发音”。于是，以发音作检索的人就再一次以正确的汉语发音尝试发音。
另一方面，在上述一致判断部52判断为一致时，发音记号发生指示部分54就对文件控制部57的发音/声调记号读出部574发出读出指示。应答于这个读出指示，发音/声调记号读出部574，将标准文件6的发音记号“wo”及声调“3”读出，并通过通信控制部59的发信部591，送到信息处理装置7。同时，发音记号发生指示部54，对CRT控制部56的发音/声调记号表示部561提供表示指示，这个发音/声调记号表示部561将来自发音/声调记号读出部574的发音记号“wo”及声调“3”表示在CRT3上。
其次，对被提供了这个发音记号“wo”及声调“3”的信息处理装置及汉字文字图形文件8的构成及其动作，参照图1、图4及图5而详细地说明。参照图1及图4，由汉语声音认识装置1所提供的发音记号“wo”及声调“3”，通过信息处理装置7的通信控制部71而被存储在存储部72中。发音/声调比较部73将从存储部72被读出的发音记号“wo”及声调“3”，与汉字文字图形文件8的图5所示的发音记号“A”及声调“1”进行比较。由于比较的结果为不一致，将这不一致通知完毕检出部74。完毕检出部74判断在发音/声调比较部73汉字文字图形文件8的全部发音记号/声调与由存储部72所提供的发音记号/声调的比较是否完毕。如果还没有完毕，就对发音/声调比较部73发出指示，使它直至比较完毕，顺次地重复比较动作。在发音/声调比较部73，将从存储部72被读出的发音记号“wo”及声调“3”，与汉字文字图形文件8的图5所示的发音记号“wo”及声调“3”进行比较。由于比较结果显示一致，所以图5所示的发音记号“wo”及声调“3”和同组中的汉字文字图形“1.我”被存储于存储部72中。这个汉字文字图形“1.我”从存储部72通过通信控制部71而被送到控制部5。
在发音/声调比较部73，当汉字文字图形文件8的全部发音记号/声调被比较完毕，仍未有得到一致的结果，而在完毕检出部72检出了完毕时，误差信息发生部75就发生误差信息。这个误差信息通过通信控制部71而被送到控制部5。
以下就从信息处理装置7被读出的汉字文字图形及误差信息的选择表示处理，参照图1、图2和图5加以详细说明。
首先，对汉字图形的表示处理进行说明。
参照图1及图2，由信息处理装置7所提供的汉字文字图形“1.我”，通过通信控制部59的收信部592及CRT控制部56的汉字文字图形表示表示部563而被表示于CRT3上。这时，由于汉字文字图形“1.我”只是一个字，所以没有选择的必要。再者，在CRT画面上，除了这个汉字文字图形“1.我”之外，还通过发音/声调记号读出部574从标准图形文件6读出，通过发音/声调记号表示部561，将发音记号“wo”及声调记号“3”表示在CRT3上。因此，在CRT画面上，除了“wo”及“3”之外，还表示着“1.我”。
其次，说明为了表示汉字文字图形，须作选择处理的例子。
由于检索是“我在日本国学习中文”，所以在“我”之后，从键盘4输入发音记号数据“ZAI”及声调记号数据“4”，同时“zai”。被发音并在声音输入部2被输入。接着，以与上述相同的方式，从标准图形文件6的逻辑地址n2读出发音记号“ZAI”及声调“4”，并表示在CRT3上，同时被送到信息处理装置7。在信息处理装置7，与发音记号“AZI”及声调“4”相一致的汉字文字图形“1.再、2.在、3.载”从汉字文字图形文件8被读出并送到控制部5。在控制部5，通过收信部592及汉字文字图形表示部563，“1.再、2.在、3.载”被表示在CRT3上。检索者则看这个CRT3画面，从键盘4将数字数据“2”输入。这个数字数据“2”通过键盘控制部58的数字数据部581而被送到CRT控制部56的汉字文字图形选择部564。汉字文字图形选择部564对汉字文字图形表示部563发出选择指示，使它在由汉字文字图形部563所表示的图形“1.再、2.在、3.载”之中，只表示“2.在”。汉字文字图形表示部563应答于这个指示，只选择“2.在”，并表示在CRT3上。
其次，就当控制部5对信息处理装置7所发出的发音记号及声调不存在于汉字文字图形文件8中时所发生的误差信息在控制部5的处理加以说明。
参照图2，由图1的信息处理装置7所发出的误差信息通过通信控制部59的收信部592及CRT控制部56的汉字文字图形表示部563而被表示于CRT3上。这时，在CRT3上，表示着通过发音/声调记号读出部574而从标准图形文件6被读出的，并通过发音/声调记号表示部561而被传送的发音记号及声调。因此，在CRT3上，除了发音记号及声调外，还合成表示着误差信息。结果，检索者就认识到汉语的发音虽然正确，但在汉字文字图形文件8中的不存在所发音的汉语汉字文字图形。
利用上述方式，对“我在日本国学习中文”之中剩下的“日本国学习中文”也逐一字地进行检索。即在声音输入部输入“ri”的同时，从键盘4输入发音记号“RI”及声调记号“4”。应答于这个输入，控制部5读出了在标准图形文件6的地址n1的发音记号“RI”及声调“4”，并把它表示在CRT3上，同时送到信息处理装置7。信息处理装置7根据这个发音记号“RI”及声调“4”从汉字文字图形文件8中读出汉字文字图形“1.日”，并通过控制部5表示在CRT3上。
其次，从声音输入部2将“běn”输入，同时从键盘4将发音记号“BEN”及声调“3”输入。应答于这个输入，控制部5将标准图形文件6的地址n3中的发音记号“BEN”及声调“3”读出，并表示在CRT3上，同时送到信息处理装置7。信息处理装置7根据这个发音记号“BEN”及声调“3”从汉字文字图形文件8读出“1.本、2.畚、3.苯”，并通过控制部5将它表示在CRT3上。检索者从键盘4输入数字数据“1”，就只有汉字文字图形“1.本”被选择，并表示在CRT3上，而其余的汉字文字图形“2.畚、3.苯”则从CRT3的画面上被消去。
接着，从声音部2输入“guó”，同时从键盘4输入发音记号“GUO”及声调“2”。应答于这个输入，控制部5将在标准图形文件6的地址n上的发音“GUO”及声调“2”读出，并表示在CRT3上，同时送往信息处理装置7。信息处理装置7根据这个发音记号“GUO”及声调“2”，从汉字文字图形文件8读出汉字文字图形“1.国、2.
、3.掴、4.帼、5.虢、6.馘、7.腘”，并通过控制部5表示在CRT3上。通过检索者从键盘4输入数字数据“1”，就只有汉字文字图形“1.国”被选择，并表示在CRT3上，其他汉字图形“2.
、3.掴、4.帼、5.虢、6.馘、7.腘”则从CRT3的画面上被消去。
然后，从声音输入部2输入“xué”，同时从键盘4输入发音记号“XUE”及声调“2”。控制部5应答于这个输入，将在标准图形文件6的地址n9的发音记号“XUE”及声调“2”读出，并表示于CRT3上，同时送往信息处理装置7。信息处理装置7根据这个发音记号“XUE”及声调“2”，从汉字文字图形文件8中读出汉字文字图形“1.穴、2.茓、3.峃、4.学、5.鸴、6.踅、7.噱”，并通过控制部5表示在CRT3上。通过检索者从键盘4输入数字数据“4”，就只有“4.学”被选择，并表示在CRT3上，其他的汉字图形“1.穴、2.茓、3.峃、5.鸴、6.踅、7.噱”则从CRT3的画面上被消去。
其次，从声音输入部输入“xí”，同时从键盘4输入发音记号“XI”及声调“2”。控制部5应答于这个输入，将在标准图形文件6的地址n5上的发音记号“XI”及声调“2”读出，并表示在CRT3上，同时送到信息处理装置7。信息处理装置7根据这个发音记号“XI”及声调“2”从汉字文字图形文件8中读出汉字文字图形“1.习、2.嶍、3.鳛、4.席、5.覡、6.袭、7.媳、8.隰、9.檄”，并通过控制部5表示在CRT3上。通过检索者从键盘4输入数字数据“1”，就只有“1.习”被选择，并表示在CRT3上，其他的汉字图形“2.嶍、3.鳛、4.席、5.覡、6.袭、7.媳、8.隰、9.檄”则从CRT3的画面上被消去。
接着，从声音输入部2输入“zhōng”，同时从键盘4输入发音记号“ZHONG”及声调“1”。控制部5应答于这一输入，将在标准图形文件6的地址n4上的发音记号“ZHONG”及声调“1”读出，并表示在CRT3上，同时送到信息处理装置7。信息处理装置7根据这个发音记号“ZHONG”及声调“1”，从汉字文字图形文件8中读出汉字文字图形“1.中、2.忠、3.盅、4.钟、5.衷、6.忪、7.终、8.螽”，并通过控制部5表示在CRT3上。通过检索者从键盘4输入数字数据“1”，就只有汉字文字图形“1.中”被选择，并表示在CRT3上，其他汉字图形“2.忠、3.盅、4.钟、5.衷、6.忪、7.终、8.螽”9.檄”则从CRT3的画面上被消去。
最后，从声音输入部2输入“wén”，同时从键盘4输入发音记号“WEN”及声调“2”。控制部5应答于这个输入，将在标准图形文件6的地址n8上的发音记号“WEN”及声调“2”读出，并表示于CRT3上，同时送到信息处理装置7。信息处理7根据这个发音记号“WEN”及声调“2”，从汉字文字图形文件8读出汉字文字图形“1.文、2.纹、3.文、4.蚊、5.雯、6.闻、7.阌”，并通过控制部5表示在CRT3上。通过检索者从键盘4输入数字数据“1”，就只有汉字文字图形“1.文”被选择，并表示在CRT3上，其他汉字图形“2.纹、3.文、4.蚊、5.雯、6.闻、7.阌”则从CRT3的画面上被消去。
根据本发明的检索方式，只要以中国国内使用着的普通话发音，就具有能简单地检索汉语的汉字文字/数字的效果。
还有，本发明的检索方式，通过利用汉语的声音认识装置，就能高速地检索汉语的汉字。
权利要求
1.一种具有显示器和键盘，从文件中检索汉语的汉语检索方式，其特征在于包括应答于逐字发音的汉语的声音，将对应于该声音的发音记号和声调记号输出的汉语声音认识装置，与汉语的汉字/数字的发音记号和声调记号一起，将汉语的汉字/数字的文字图形存储的汉字文字图形文件，应答于来自上述汉语声音认识装置的声音记号及声调记号，将与该发音记号及声调记号相一致的汉字文字图形从上述汉字文字图形文件中读出，并在上述显示装置上将汉语的汉字/数字表示，同时从所表示的汉字/数字之中，通过从上述键盘的输入以选择目的汉字/数字的装置。
2.权利要求
1所述的汉语的检索方式，其特征在于所说的汉语声音认识装置包括将声音变换为电信号以进行模拟/数字变换的声音输入机构，将在该声音输入机构中被进行了模拟/数字变换的声音信号编码的声音编码控制机构，将在这声音编码控制机构中而被编码的声音编码数据存储的存储机构，将汉语的发音记号、声调及与这些发音记号和声调相一致地发音的声音对应的声音编码数据作为标准图形而预先存储的标准图形文件，将该标准图形文件的标准图形的声音编码数据与上述存储机构的声音编码数据相比较的比较机构，当这比较机构的比较结果显示一致时，将对应于上述标准图形文件机构的一致的声音编码数据的发音记号及声调作为认识结果而输出的输出机构。
专利摘要
本发明是关于具有显示装置和键盘、把按照汉语拼音及声调而发音的声音信号变换为发音记号及声调记号，以检索汉语、输出中文的根据汉语的声音认识的汉语检索方式。该汉语检索方式包括汉语的声音认识装置，存储汉语的发音记号、声调记号及文字图形的汉字文字图形文件，以及根据汉语发音记号和声调，从汉字文字图形文件中读出与该发音和声调相符的汉字文字图形，并把它表示在显示装置上，通过从键盘的输入以选择目的汉字的选择装置。
文档编号G06F3/16GK87101946SQ87101946
公开日1987年9月23日申请日期1987年3月12日
发明者高桥忠进申请人:日本电气株式会社导出引文BiBTeX, EndNote, RefMan

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高桥忠进
技术所有人：日本电气株式会社
我是此专利的发明人

上一篇：感应设备的改进的制作方法
上一篇：磁性录制和再现装置的制动系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。