用于电子书的自定义字典的制作方法

文档序号:8516092阅读:477来源:国知局
用于电子书的自定义字典的制作方法
【技术领域】
[0001]本公开总的来说涉及文本处理领域,具体地,涉及自定义电子书字典的自动生成。
【背景技术】
[0002]许多用户利用他们的数字设备来阅读诸如小说、新闻文章、短故事等材料。例如,电子阅读器和平板计算机通常被用来阅读电子书,电子书是数字格式的书。大多数电子书不包含任何定义电子书内的术语的字典、词汇表等。较弱的阅读者可能在电子书的文本中的某些术语上遇到困难。例如,用户可能对理解很少在电子书的文本中使用的术语存在问题。
[0003]在一些情况下,数字设备具有自带的通用字典,用户可使用该通用字典来查找术语。但是,不管电子书的内容如何,通用字典的内容都是相同的。因此,存在电子书中的术语不在通用字典中的可能性。例如,电子书可能包含一些在通用字典中找不到的拉丁术语。缺失的术语可能导致用户对文本理解不够,并且可能迫使用户进行通用字典外的搜索来确定术语的定义。

【发明内容】

[0004]上述和其他需求通过计算机实施方法、存储可执行代码的非瞬态计算机可读存储介质以及用于生成用于电子书的自定义字典来满足。
[0005]用于生成用于电子书的自定义字典的计算机实施的方法的一个实施例,包括:从由用户操作的用户客户端接收自定义字典请求,该自定义字典请求标识该电子书并且包括字典管理信息,该字典管理信息描述该用户。基于字典管理信息来选择针对用户的组阅读简档,该组阅读简档具有相关联的组阅读得分,以及在所标识的电子书中标识用于包括在自定义字典中的候选词。响应于用于选择的组阅读简档的相关联的组阅读得分,从候选词中选择用于包括在自定义字典中的词。使用选择的词来生成自定义字典,并且向用户客户端提供该自定义字典。
[0006]非瞬态计算机可读存储介质的一个实施例,该计算机可读存储介质存储用于生成用于电子书的自定义字典的可执行计算机程序指令,包括:从由用户操作的用户客户端接收自定义字典请求,该自定义字典请求标识该电子书并且包括字典管理信息,该字典管理信息描述该用户。基于字典管理信息来选择针对用户的组阅读简档,该组阅读简档具有相关联的组阅读得分,以及在所标识的电子书中标识用于包括在自定义字典中的候选词。响应于用于选择的组阅读简档的相关联的组阅读得分,从候选词中选择用于包括在自定义字典中的词。使用选择的词来生成自定义字典,并且向用户客户端提供该自定义字典。
[0007]用于生成用于电子书的自定义字典的系统的一个实施例,包括:处理器,该处理器被配置为执行模块;以及存储模块的存储器。该模块包括:用户账户管理模块,被配置为从由用户操作的用户客户端接收自定义字典请求,该自定义字典请求标识该电子书并且包括字典管理信息,该字典管理信息描述该用户。该模块还包括组分析器模块,被配置为基于字典管理信息来选择针对用户的组阅读简档,该组阅读简档具有相关联的组阅读得分;以及词标识器模块,该词标识器模块被配置为在所标识的电子书中标识用于包括在自定义字典中的候选词。该模块还包括字典生成器模块,该字典生成器模块被配置为响应于用于选择的组阅读简档的相关联的组阅读得分,从候选词中选择用于包括在自定义字典中的词,并且使用选择的词来生成自定义字典。该模块还包括字典服务器模块,该字典服务器模块被配置为向用户客户端提供生成的自定义字典。
【附图说明】
[0008]图1是图示了用于生成自定义字典的环境的实施例的高级别框图。
[0009]图2是图示了用于实施图1中所示的实体的示例计算机的高级别框图。
[0010]图3是图示了根据一个实施例的电子书管理系统内的模块的详细视图的高级别框图。
[0011]图4是图示了根据一个实施例的在电子书管理系统中生成自定义字典的过程的流程图。
【具体实施方式】
[0012]附图和以下描述仅通过说明的方式描述了某些实施例。本领域技术人员从以下描述中将容易理解到,本文所示的结构和方法的备选实施例可以被利用而不偏离本文描述的原理。现在将详细参照若干实施例,在附图中图示了这些实施例的示例。应当注意,只要可行,类似或相同的参考标号可以被使用在附图中并且可以指示类似或相同的功能。
[0013]图1是图示了用于生成自定义字典的环境的实施例的高级别框图。该环境包括字典生成系统(DGS) 102,该字典生成系统(DGS) 102通过网络103连接至用户客户端100、电子书数据库101和定义源104。这里仅图示了一个用户客户端100、DGS 102、电子书数据库101和定义源104,但是可以存在这些实体中的每种实体的多个实例。例如,可以存在数千个或数百万个用户客户端与多个DGS 102、定义源104和电子书数据库101通信。
[0014]网络103在用户客户端100、电子书数据库101、DGS 102和数据源104之间提供通信基础设备。网络103通常为因特网,但是也可以是任何网络,包括但不限于局域网(LAN)、城域网(MAN)、广域网(WAN)、移动有线或无线网络、专用网络或虚拟专用网络。
[0015]用户客户端100是执行运行允许用户查看电子书以及消费其他媒介的计算机程序模块(例如,网页浏览器或其他客户端应用)的计算设备。例如,用户客户端100可以是个人计算机、平板计算机、智能电话、膝上型计算机、专用电子阅读器或其他类型的能够联网的设备,诸如联网的电视或机顶盒。用户客户端100还可以允许用户利用DGS102建立用户简档。
[0016]在一个实施例中,用户客户端100包括阅读指标模块105、电子书阅读器106和服务器交互模块107。在一个实施例中,这些实体是在用户客户端100上执行的软件应用模块。例如,模块105、106、107可以被集成到在智能电话上执行的智能电话应用中。
[0017]阅读指标模块105收集描述用户和关于用户的当前电子书使用的字典管理信息。例如,字典管理信息可以包括用户的当前阅读位置、用户人口统计信息、阅读速度(例如,基于他们翻页的速率)、书签位置、电子书标识符、可用于检索电子书标识符的电子书元数据、阅读水平、阅读水平阈值、点击历史、阅读历史和以及关于阅读期间由用户跳过、突出或标注的文本的信息。字典管理信息还可以包括关于用户使用用户设备100查找的词的信息。例如,该信息可以包括用户查找的词、所查找的词是否被呈现在电子书的有效页(即,最后被用户阅读的页)上、用户查找词的方式(例如,用户是否使用第三方网站或本地字典软件包?)等。字典管理信息还可以包括关于用户的信息,诸如用户标识符,用户标识符可以由DGS 102使用以唯一地标识用户。
[0018]在这里所讨论的系统收集关于用户的个人信息或者可以利用个人信息的情况下,可以为用户提供控制程序或者特征是否收集用户信息(例如,关于用户的社交网络、社会行动或活动的信息、职业、用户的偏好或者用户的当前位置)的机会。此外,某些数据可以在其被存储或使用之前以一种或多种方式来处理,使得个人可标识的信息被去除。例如,用户的身份可以被处理,使得没有针对该用户可以确定的个人可标识信息,或者可以一般化获取位置信息的用户的地理位置(诸如城市、邮政编码或州等级),使得不能够确定用户的具体位置。因此,用户可以对关于用户的信息如何被收集以及如何被用户客户端100和DGS102使用进行控制。
[0019]电子书阅读器106使得操作用户客户端100的用户能够请求电子书的一部分(可以为整个电子书),并且一旦电子书数据已经被下载能够查看电子书的所请求的部分。例如,操作用户客户端100的用户可以从经由电子书阅读器106显示的电子书选择列表中选择要阅读的电子书,然后电子书阅读器向DGS 102发送针对所选择的电子书的请求。电子书请求包括电子书标识符,其标识电子书和用于用户的字典管理信息。例如,电子书标识符可以包括标识书的信息,诸如名称、作者、出版日期、国际标准书号(ISBN)或DGS 102已知的另一标识符。在另一实施例中,电子书标识符是从与电子书相关联的数据中计算的哈希,并且其唯一地标识电子书。哈希可以由电子书阅读器106从电子书中计算得到或者其可以从DGS 102、电子书数据库101或电子书数据的其他源接收到。电子书请求还可以被用于请求针对用户客户端1
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1