上下文识别增强消息转换系统和方法

文档序号:7636041阅读:145来源:国知局
专利名称:上下文识别增强消息转换系统和方法
技术领域
本发明涉及一种上下文识别增强消息转换系统及方法。在本消息转换系统及 方法中,文本信息的上下文识别被认为是在转换文本信息中能最有效的避免逻辑 错误的方法。
背景技术
己经发展进歩的涉及消息内容的附加服务,由于在识别难度上存在高识别错 误率,单个词识别的错误识别情况,生成错误结果的原因没有被普遍性的应用。也就是说,当一个自动生成的含有相反意思的用户消息被传送的话,对于过 去的服务来说是致命的打击。即使在目前的普通消息服务中,当负责消息服务的 管理员发现哪怕一个错误的话执行识别进程就会被终止。在中文消息一 个汉字可 以表示一个词的时候,这个问题就变得严峻了,因为相同的汉字可以表示不同的思思。技术问题本发明的优点在于它提供了一个能够解决难题的消息转换系统和方法,它能 解决难题例如难点识别中发生的高识别错误率、简单词语识别中发生的错误别 和错误结果的产生。技术解决根据本发明的一方面,消息转换系统包括一个构成/筛选数据库存储至少包括图像、声音、影像数据的MMS数据和各种字符SMS数据其中之一; 一个鉴 别信息存储单元存储根据消息转换服务器和移动通信终端(发送/接受消息终端 信息)的终端信息; 一个消息接收单元用来接收来自另一个终端订户的消息(订户消息); 一个订户鉴定单元检査终端信息目的移动通信终端接收消息并使用 SMS或者MMS消息转换装置组合起来; 一个消息鉴别单元用存储在构成/筛选
数据中的筛选数据来检验订户消息是否通过筛选,消息鉴定单元至少包含如下中 的一个第一筛选单元用来将一个主题的大量句子与订户消息比较,其中每个句子由一个或多个词组成;第二筛选单元用来比较订户消息与多数句子,每个句子 由一个或多个词(包含可替代词)组成;第三筛选单元分析来自每个订户的消息, 提取经常性重复利用的短语; 一个构成提取单元,当订户消息经由消息鉴定单元 筛选后,从构成/筛选数据库中提取订户消息中相应的MMS数据或者SMS数据;一个构成合并单元,用来将MMS或者SMS数据组合成订户消息或者用依照移 动通信终端显示规范的MMS或者SMS消息替代接收的消息,然后生成MMS 或者SMS消息; 一个消息传输单元用来把生成的MMS或者SMS消息传输到 目的移动通信终端。一个互联网匹配单元,用来通过网页接收SMS或MMS消息转换服务的订 阅,提供所有或者部分无线传送消息功能,SMS或MMS消息转换服务功能, SMS或MMS消息转换服务的相关设置功能。依照本发明的一个增强方面,消息转换系统包含一个互联网匹配单元,用来 通过网页接收SMS或MMS消息转换服务的订阅,提供所有或者部分无线传送 消息功能,SMS或MMS消息转换服务功能,SMS或MMS消息转换服务的相 关设置功能。依照本发明的一个增强方面,构成提取单元提取一个构成包含一个比构成存 储单元中的订户消息还要大的空白区域,构成组合单元将订户消息取代和插入到完整部分或者提取构成的一部分空白区域中。依照本发明的一个增强方面,构成合并单元用特定的SMS或者MMS消息 替换订户消息,从而与被选择的构成合并。依照本发明的一个增强方面,构成合并单元将构成插入到订户消息的之前或 之后。依照本发明的一个增强方面,构成/筛选数据库当要写入或更新的时候将数 据加载到存储器中,消息识别单元和构成提取单元在选择MMS数据,SMS数 据和筛选数据时读取存储在存储器中的数据。依照本发明的一个增强方面,构成/筛选数据库建立一个数据文件夹来存储 被写入或更新的数据,消息鉴别单元和构成提取单元则在选择MMS数据,SMS
数据,筛选数据时读取在数据文件夹中的数据。依照本发明的一个增强方面,消息鉴别单元或者构成提取单元通过存储映射 I/O单元读取数据文件,存储映射I/O单元是一块预先提供的存储区域将部分或 者完整的构成/筛选数据能够被存储并映射从而被用来读取。依照本发明的一个增强方面,消息鉴别单元或者构成提取单元通过存储映射I/O单元读取数据文件,存储映射I/O单元是一块预先提供的存储区域将部分或者完整的数据文件加载到存储器中,是一块预先提供的存储区域将部分或者完整 的数据能够被存储并映射从而被用来读取。 '依照本发明的一个增强方面, 一个消息转换方法从一个订户终端收到消息时 比较并检验接收消息的目的移动通信终端的终端信息和涉及消息转换服务的设置项目;通过第一筛选单元掌握上下文的意思结构,第一筛选单元用每个主题的 大量的句子与消息进行比较,每个句子由一个或多个词组成;第二筛选单元使用 一个句子与消息进行比较,这个句子由一个或多个词包括可替换的词组成;第三筛选单元通过掌握上下文和提取重复使用的短语或句子和符号来堆积私人用户 传送的消息,第三筛选单元使用统计方法成为一个鉴别单元;生成订户消息需要 通过进程上下文意思结构被筛选单元掌握;进程上下文意思结构被鉴别单元采用 统计方法掌握;当消息转换经过上下文识别在经过第一筛选单元后没有产生效果 时,执行第二筛选单元的操作;当消息转换经过上下文识别在经过第二筛选单元 后也没有产生效果时,执行采用统计方法进行个性分析的第三筛选单元的操作; 同时将提取构成合并后的订户消息传送到目的移动通信终端。依照本发明的一个增强方面,鉴别单元采用统计方法包含分析每一个用户的 消息,提取周期内重复性的短语,利用重复性使用的短语生成或分配内容,并应 用到服务中。有益效果根据本发明,筛选方法和鉴别单元采用统计学方法来识别上下文。从而,降 低了文本识别的错误率。进一步地,内容管理模块应用数据库,内容使用模块利用存储映射i/o单元调用数据文件。因此,同样的数据会显示在数据库和数据文件中。此外,当内容 使用模块映射数据文件到初始存储器中时,数据被高效地利用。更进一步地,当内容管理模块同歩更新数据库和数据文件时,内容使用模块 能够即时地使用到最新数据。


图1和图2举例说明了现有技术下的文本体现。图3描述了一个应用本发明的一个通讯网络。图4描述了依据本发明的一个消息转换系统的结构图。图5描述了本发明中消息转换系统的筛选部分。图6描述了本发明中的统计处理系统。图7—10描述了本发明中的存储映射I/O单元。图11描述了依照本发明的消息转换方法流程图。图12描述了依照本发明的统计处理方法流程图。图13 — 14举例说明了应用本发明的消息示例。附图标记12 SMS或者MMS中心13信息转换服务器14构成/筛选数据库15订户数据库20信息接收单元21订户认证单元22信息鉴别单元23构成提取单元24构成合并单元25信息传送单元26互联网匹配单元27筛选单元28采用统计方法的鉴别单元
具体实施方式
在下文中,本发明的首选示例会由涉及到的附图描述。当一个对现有功能或 构造的细节描述被判断有能够遮盖到本发明的发明点,这个描述会被省略。接下 来描述的术语会被定义进本发明的功能考虑中,同时会不同于一致紧张用户或操 作者或练习者。因此,术语的意思会在说明书中进行解释。图1和图2展示了一个依照现有技术的示例。依照一个传统的消息转换系统, 当一个词例如"爱"或者"生气"在文本消息中出现时,文本消息会由准备好的 内容转换,传送者的表情会被识别使得一个兴趣发生,如图1所示。然而,这 个转换由一些简单的词识别完成,这里面包含了很多逻辑错误,如图2所示。 也就是说,用户的文本消息中在自动转换的过程中会产生与文本消息打算表示的 意思正好相反的意思,这个结果对过去的服务是致命的。即使在目前的普通消息 服务中,当负责消息服务的管理员发现哪怕一个错误的话执行识别进程就会被终 止。在中文消息一个汉字可以表示一个词的时候,这个问题就变得严峻了,因为 相同的汉字能够表达很多不同的意思。图3图解说明了一个应用本发明的通信网络。如图3所示,这个通信网络包 括一个提供服务的服务器, 一个接收方, 一个发送方, 一个SMS网关,和一个 SMSC (短消息服务中心), 一个MMSC (多媒体消息系统中心), 一个MMS 手机接收方, 一个其他移动通信服务提供者的MMS服务器。特别的,当一个来 自接收方的消息经过SMSC (短消息服务中心)和MMSC (多媒体消息系统中 心)传输后,提供服务的服务器合并消息相应的构成以便传送到发送者。然而, 每个服务供应商使用它自己的MMSC (多媒体消息系统中心)。也就是说, 一个 由A移动通信服务供应商生成的多媒体消息不能传送到B移动通信服务供应商。 因此,MMSC (多媒体消息系统中心)与其他移动通信服务供应商的MMS服务 器相连,MMS手机接收方也是如此。图4图解说明了依照本发明的一个消息转换系统的结构。如图4所示,本发 明的消息转换系统13包含一个消息接收单元20用于接收来自SMS中心和 MMS中心12的订户消息; 一个订户认证单元21通过订户数据库来检验这个 订户是否已加入消息转换服务,核实订户制定的消息转换服务,确认接收这个消 息的目的移动通信终端的终端信息; 一个消息鉴别单元22包含一个筛选单元 27和一个应用统计方法的鉴别单元27,这个筛选单元27分析消息是否通过筛 选单元。进一步地,消息转换系统13包含一个构成提取单元23,它用来提取 构成,指出验证的消息转换服务属性或者分析结果,这个分析结果来自一个构成 /筛选数据库14和一个构成合并单元24,它合并提取自订户消息的构成。由这 些构成合并后的消息经过消息传送单元25传送到SMS或者MMS中心12。更 进一步地,消息转换系统13包含互联网匹配单元26用来接收从一个移动通信 订户通过移动通信终端和/或计算机16和互联网的订户消息转换服务,同时通 过网页用一个短消息经无线进程提供消息转换服务的订户,这个进程设置消息转 换中涉及配置项目,以及相应的设置/咨询功能。SMS中心或者MMS中心12传送来自一个移动通信终端的消息到消息转换 服务器13中的消息接收单元20,需要消息转换服务器将订户消息转换为SMS 或者MMS消息,传送转换后的SMS消息或者MMS消息到目的移动通信终端。构成/筛选数据库14存储MMS数据,例如图像、声音、影像、由各种各样 字符组成的SMS数据,消息鉴别单元的筛选单元提到的多种数据。订户数据库15存储移动通信终端的手机号码,移动通信服务订户的名字, SMS或者MMS自动插入选项,移动通信终端的终端信息(移动通信终端的终 端信息采用短消息的形式发送和接收)(举个例子,是否支持MMS服务,像这 样的信息会在终端上详细显示)。通过存储在订户数据库15中的移动通信订户的个人信息(举个例子,移动 通信终端的手机号码,订户是否加入消息转换服务,订户的用户名和密码),订 户认证单元21检查这个移动通信订户是否加入消息转换服务。此外,订户认证 单元21校验存储于订户数据库中的消息转换服务事项,目的移动通信终端的转 终端信息接收SMS或者MMS消息。然后,订户认证单元21提供消息转换中 需要的相应信息。当SMS中心或者MMS中心接收到一条来自一个移动通信终端的消息时, 如果相应的移动通信订户加入了消息转换服务,SMS中心或者MMS中心需要 由消息转换系统13将此条消息转换为SMS或者MMS消息。同时,如果移动 通信订户没有加入消息转换服务,这条消息会通过传统方式传送到移动通信终 端。
消息鉴别单元22用于执行消息转换的预处理的操作,具体如下消息鉴别单元22的预处理包括校验接收消息的目的移动通信终端的终端信息,当消息从一个订户终端接收到后设置消息转换服务;并且通过第一到第三筛选单元掌握上 下文的意思结构。第一筛选单元使用一个主题的大量句子,每个句子由一个或多 个词组成。第二筛选单元使用一个由一个或多个词其中包括可替换词组成的句 子。第三筛选单元通过掌握的上下文堆积传送的消息内容以便提取重复性的短语 或句子和符号,第三筛选单元是一个使用统计方法的鉴别单元。鉴别单元28使用统计方法分析每个用户的消息,提取周期内重复性的短语,从重复性使用的短语中生成或分配内容,并应用到服务之中。当订户消息经由消息鉴别单元鉴别并通过筛选单元后,构成提取单元23从 构成/筛选数据库中提取订户消息中相应的MMS数据或SMS数据。依靠对目的移动通信终端的显示规则,构成合并单元24将MMS数据或 SMS数据合并成订户消息或者用MMS数据或SMS数据取代接收到的消息,然 后生成一条MMS或SMS消息。互联网匹配单元26通过互联网和移动通信终端和/或计算机16相连,并提 供一个订阅消息转换服务的网页,这个网页可用来书写消息,也可以是包含涉及 消息转换中的各种环境的设置的网页,并且可以是一个SMS或者MMS设定/ 咨询网页。于此同时,这个消息能够被本领域的普通技术人员很容易地理解,移动通信 订户可以把消息书写在互联网匹配单元26提供的网页上,并向上面描述的一样, 要经过各自的单元进行相同形式的处理。此外,依照订户的要求,移动通信终端 会被告知消息转换在正常地进行。消息转换服务可以采用按每月固定的价格或者 按照传送SMS消息的数量或MMS消息的数量来进行收费。图5图解说明了依照本发明的消息转换系统中的筛选单元。如图5所示,筛 选单元包含第一筛选单元,第二筛选单元,第三筛选单元。其中,第一筛选单元 使用大量的短语和子句,第二筛选单元使用短语和子句的结构,第三筛选单元像 鉴别单元一样使用统计方法工作。特别地,当一个词通过简词识别后被设置为一个主题,第一筛选单元设置将 这个词或这个词的意思应用其中的大量的短语和子句。举个例子,如果假定一个
主题"公共汽车"被设定并且这个词的简单识别也被使用。假如这样的话,如果 一条消息说"我现在在步行因为我不想坐公共汽车"以一个乘坐公共汽车的人的 图片来表示的话,这就会发生错误。在这里,由一个或多个词组成的清楚的筛选 数据,例如"坐公共汽车","在公共汽车里",和"我打算坐公共汽车"会被使 用。这是因为多数的筛选数据应该被使用在一个主题中以便增加识别率。
第二筛选单元使用由一个或多个词组成的筛选数据,并且一部分能够被替代 以便增加识别率。举个例子,当一个筛选如"A,我爱你"作为一个主题其中"爱"
被使用,A就相当于"甜心"或者特定的名字。其他的例子,当一个筛选如"A 和已在打架"作为一个主题其中"打架"被使用,A和B相当于很多或没有特 别指明的人的名字。使用包含可替代的词的短语和子句的筛选能够构造的比上述 例子更复杂。此外,尽管所有的词不能一一对应,识别还是能被执行,从而弥补 由短语和子句组成的筛选数据的低识别率。
尽管第一和第二筛选单元使用一个或多个词来减少错误发生,但相对于简单 的词识别而言识别率已经有了下降。第三筛选单元能够使用统计方法进行鉴别来 弥补错误发生率。这个鉴别使用统计方法从大量堆积的传送的私人用户的消息内 容中自动提取出重复使用的短语或句子和符号以便进行相应消息转换。在假定被 用户经常性地使用的词和符号非常可能被重新使用,鉴别会对用户消息识别起到 增强效果和提高服务成功率。鉴别采用统计方法大致分以下几步,第一步分析每 个用户的消息,第二步提取周期内重复性使用的短语,第三步使用重复性使用的 短语生成或分配内容,第四步应用到服务器中。分析来自每个用户消息的步骤和 提取周期内重复性使用的短语的步骤采用自动化程序,生成或分配内容到重复性 使用的短语的步骤和应用到服务器中的步骤被存储在一个CMS数据库中并由管 理员进行操作。
图6图解说明了依照本发明的统计处理系统。图12是依照本发明的统计操 作方法的流程图。在上面描述的词识别方法中, 一个或多个词被使用以便减少错 误发生率。然而,与单个词识别相比识别率会下降。既然这样,采用统计方法的 鉴别单元会弥补这一缺点。这个鉴别使用统计方法从大量堆积的传送的私人用户 的消息内容中自动提取出重复使用的短语或句子和符号以便进行相应消息转换。 在假定被用户经常性地使用的词和符号非常可能被重新使用,鉴定会对用户消息
识别起到增强效果和提高服务成功率。鉴定采用统计方法大致分以下几歩,第一 步分析每个用户的消息,第二步提取周期内重复性使用的短语,第三歩使用重复 性使用的短语生成或分配内容,第四步应用到服务器中。分析来自每个用户消息 的步骤和提取周期内重复性使用的短语的步骤采用自动化程序,生成或分配内容
到重复性使用的短语的步骤和应用到服务器中的步骤被存储在一个CMS数据库 中并由管理员进行操作。
图7到图10说明了依照本发明的存储映射I/O单元。如前面所述的筛选单 元执行比简单词识别更为复杂的操作。也就是说,当筛选单元在通常方式下实现 时,高水平的操作能力是必须的。因此,存储映射I/O单元能够有效地增强效 率。为了检验用户消息中的上下文或词以便匹配适合的构成,内容列表和词/短 语列表是必须的,在相应的列表中的映射信息也是必须的。代表性地,像增加/ 删除/更新日期这样的操作经常会由数据库轻松管理执行。在这个服务之中,为 了增加顾客的满意度,适合上下文的内容被匹配,这个内容和词/短语数据会通 过用户的反馈不断地增加和更新。因此,为了实现服务,减少内容管理应当是最 重要的考虑因素。
当数据库被使用时,增加/删除/更新内容和词/短语数据的管理功能能够由 一个简单的SQL语句实现。如上所述,内容管理模块是很容易完成的。然而, 如果一个模块(在下文中,以"内容管理模块"提及)使用如上数据将内容匹配 到一个文本消息的话必须访问数据库而且是无论什么时候选择内容都必须访问
数据库,内容使用模块的效率被降低了。 一般需要数百兆秒来访问数据库,这个 数据库访问不适合内容管理模块。因为内容管理模块需要每秒处理的文本消息多
于100条。这个方法如图7所示。
如图7所示的方法,内容管理模块直接更新数据库,并且内容使用模块从数 据库中直接读取数据。这样就确保了内容、词/短语数据和相关数据的一致性。 尽管这样做效率较低,但是内容管理模块和内容使用模块都可不必顾及其他模块 的状态而分别访问数据库。
为了避免当数据库正在使用的时候内容使用模块访问数据库,使用了如下方 法。当内容使用模块被写入,内容使用模块与数据库连接以便将所有数据加载到 存储器中。然后,无论何时选择内容,存储器中的数据都在被使用。尽管在这个
方法中,无论什么时候内容或者词/短语数据被更新,内容使用模块都需要与数 据库连接以便将更新的数据加载到存储器中。因此,无论什么时候数据被更新,
性能不可避免地退化。如图8所示的方法。
本发明主张一个方法,当内容使用模块使用数据库时能够维持减轻管理内容 和词/短语数据,内容使用模块使用最新的内容和词/短语数据以便在不使用数据 库的情况下保持最大性能。在本发明中,存储映射I/O技术被应用到这一方法 中。存储映射I/O技术用于将全部或部分文件映射到存储器中以便使用。当一 个映射存储区域被读取时,相同的数据文件中的数据能够被读取。也就是说,当 内容管理模块更新数据文件时,内容使用模块的映射存储区也同时更新。因此, 在本发明中,内容使用模块能够立即识别服务中需要的更新的数据,像内容、词 /短语,不需要通过其他单独的操作。使用这个技术的方法如图9所示。
在存储映射I/0单元中,存储器不是直接被访问的。但是文件会以提高了的 速度被访问。通过存储映射I/O单元进行读/写数据的速率是当文件被读取时的 速度的3倍,也就是说,通过存储映射I/O单元读写的速度低于存储器直接被 访问的速度。因此,图9所示的方法在服务性能速度是要低于图10所示方法的。 在图8中,当内容使用模块被分析时,所有的内容和词/语句数据都会被加载到 存储器中,为了维持一个高速度。因此,当大量的内容和词/语句数据的数量大 于存储器的容量时,图8所示的方法就无法实现了。然而,存储映射I/0单元 在这种情况下仍能够使用,这是因为只有实际使用中的数据才会被映射到存储器 中。
在本发明中,图9的方法实现了在一个系统中包含一个不能存储所有内容和 词或语句数据的存储器,图10的方法实现了一个系统中包含一个能够存储所有 内容和词/短语数据的存储器。
图10的方法是结合了图8和图9的方法得到的。在这个方法中,内容使用 模块在初始化的时候把所有的内容和词/短语数据加载到存储器中,同时,利用 存储映射I/O单元完成映射。之后,当数据在服务中被使用时,数据仅仅从存 储器中读取。从而,内容使用模块能够显示出最好的性能。既然这样,内容管理 模块周期性地检查 个区域的内容是否在映射区域进行了更新。以后这个区域如 果仅仅需要一个字节,每秒访问一次不会在性能上有任何作用。
当内容和词/短语数据的更新之后,内容管理模块将更新的内容和数据信息 加载到数据库和数据文件中,然后检査这个区域的内容是否做了更新。同时,内 容使用模块侦测升级的内容和词/短语数据,并将映射区域的数据复制到存储器 中。
图11是根据本发明所产生的消息转换方法的流程图。如图11所示, 一条
信息被接收(Sll),随后检査订户信总和FI的终端的终端信息(S120)。之后, 判断这个订户是否加入了信息转换服务(S13)。如果这个订户已经加入了信息 转换服务,信息会被检查是否通过了筛选单元(S14)。如果这条信息通过了筛 选单元,适合订户信息的构成被提取出來然后与订户消息合并(S16)。与构成 合并的这条消息通过信息转换单元进行传输。
图13和14阐明了应用本发明的消息示例。图13展示了一条信息包含了图 片构成,图14展示了一条信息包含了影像构成和图片构成。
权利要求
1、一种信息转换系统包括一个构成/筛选数据库,它存储MMS数据,至少包括图像、声音、影像和由各种字符组成的SMS数据其中之一;一个认证信息存储单元,它存储消息转换服务中的相关设置和移动通信终端的终端信息(发出/接入消息终端信息);一个信息接收单元,它接收来自于终端订户的消息(订户消息);一个订户认证单元,它核实接收消息的目的移动通信终端的终端信息和SMS或者MMS消息转换服务的相关设置;一个消息鉴别单元,它通过使用存储在构成/筛选数据库中的数据执行筛选操作,以便检查订户消息是否通过筛选,这个消息鉴别单元至少包括下列单元中的一个第一筛选单元,将订户消息与一个主题的大量句子组成进行比较,每个句子由一个或多个词组成;第二筛选单元,将订户消息与大量的句子进行比较,每个句子由一个或多个词组成,并且其中包含可替换的词;第三筛选单元,用于分析每个订户的消息,提取周期内重复使用的短语,利用重复使用的短语生成或指定内容;一个构成提取单元,当订户消息经由订户鉴别单元筛选后,从构成/筛选数据库提取出与订户消息相应的MMS数据或者SMS数据;一个构成合并单元,用MMS或者SMS数据合并订户消息,或者将接收到的消息用依照详细描述的目的移动通信终端的MMS或者SMS数据替换,然后生成一条MMS或者SMS消息;一个消息传送单元,用于把生成的MMS或者SMS消息传送到目的移动通信终端。
2、 根据权利要求1所述的信息转换系统,其特征在于,还包括 一个互联网匹配单元,用来通过网页接收SMS或MMS消息转换服务的订阅,提供所有或者部分无线传送消息功能,SMS或MMS消息转换服务功能, SMS或MMS消息转换服务的相关设置功能。
3、 根据权利要求1所述的信息转换系统,其特征在于,当构成提取单元从构成存储单元提取出一个包含一个空白区域远大于订户消息的构成,同时构成合 并单元将订户消息替换和插入到提取的构成的全部或部分空白区域中。
4、 根据权利要求1所述的信息转换系统,其特征在于,构成合并单元用精确的SMS或MMS消息替换订户消息并与,选定的构成合并。
5、 根据权利要求1所述的信息转换系统,其特征在于,构成合并单元将构 成插入到订户消息的之前或之后。
6、 根据权利要求l一5中的任何一项所述的信息转换系统,其特征在于, 构成/筛选单元数据库在数据被写入或更新的时候将数据库中的数据加载到存储 器中,消息鉴别单元和构成提取单元在选择MMS数据、SMS数据和筛选数据 时读取加载到存储器中的数据。
7、 根据权利要求l一5中的任何一项所述的信息转换系统,其特征在于, 构成/筛选数据库在数据被写入或更新的时候建立包含数据的数据文件,消息鉴 别单元和构成提取单元在选择MMS数据,SMS数据和筛选数据时读取加载到数据文件中的数据。
8、 根据权利要求7所述的信息转换系统,其特征在于,消息鉴别单元或者 构成提取单元通过存储映射I/O单元读取数据文件,存储映射I/O单元是系统 提供的一块预定的存储区域以便于全部或部分构成/筛选数据库能够被存储和映 射以至于被读取。
9、 根据权利要求7所述的信息转换系统,其特征在于,消息鉴别单元或者 构成提取单元通过存储映射I/O单元读取数据文件,存储映射I/O单元是系统 提供的一块预定的存储区域以便于全部或部分数据文件能够被加载到存储器中, 一块预定的存储区域便于全部或部分加载到存储器中的数据被存储和映射以至 于被读取。
10、 一种消息转换方法包括在从一个订户终端接收到信息时,检查接收消息的目的移动通信终端的终端 信息和涉及消息转换服务的设置;第一筛选单元使用一个主题的大量句子与消息进行比较,掌握上下文的意思 结构,每个句子由一个或多个词组成;第二筛选单元使用一个句子与消息进行比 较,这个句子由一个或多个包含可替换词的词组成;第三筛选单元通过堆积私人 用户传送的大量的消息掌握上下文,提取重复使用的短语或句子和符号,第三筛 选单元采用统计方法成为 一个鉴别单元;通过筛选单元掌握的上下文意思结构和通过采用统计方法的鉴别单元掌握 的上下文意思结构后生成订户消息;当消息转换在经过第一筛选单元操作后没有完成上下文识别,第二筛选单元 开始进行识别操作;当消息转换在经过第二筛选单元操作后也没有完成上下文识别,采用统计方 法进行鉴别的第三筛选单元开始进行识别操作;将提取构成的订户消息传送到目的移动通信终端。
11、根据权利要求10所述的信息转换方法,其特征在于,采用统计方法的 鉴别包括分析给每个用户的每条消息,提取周期内重复使用的短语,将重复使用 的短语生成或指定内容,并应用到服务中。
全文摘要
提供一种在上下文识别上被增强的消息转换系统及方法。在这个消息转换系统及方法中,文字信息中的文本内容能够有效地识别从而避免了在文字信息的转换中的逻辑错误。根据本发明,筛选方法和采用统计学方法的鉴别单元用来作为识别上下文的方法。因此,可以有效地减少上下文识别中的错误。此外,内容管理模块使用数据库,利用数据文件实现的内容使用模块采用存储映射I/O单元。因此,同样的数据会出现在数据库和数据文件中。进一步地,在初始化的同时,内容使用模块将数据文件映射到存储器中,数据被高效地利用。
文档编号H04W4/18GK101116349SQ200680003971
公开日2008年1月30日 申请日期2006年8月14日 优先权日2005年9月15日
发明者宋世赫, 李相雨 申请人:普利电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1