一种用于提取文本摘要的方法与设备与流程

文档序号:12157899阅读:352来源:国知局
一种用于提取文本摘要的方法与设备与流程

本发明涉及自动文本摘要技术领域,尤其涉及一种用于提取文本摘要的技术。



背景技术:

文摘以简明扼要且语义连贯的语言,确切、准确地记述原始文献的中心内容,极大地节省了人们的阅读时间。现有技术中常常利用计算机,通过诸如将文本作为句子的线性序列、将句子视为词的线性序列等方法,自动地从原始文献中提取文摘,而该等方法对于文本语法、语义及句法的分析及自动摘要常常是基于全文内容或章节相关的段落内容而进行的,并不能很好地突出原始文献的重点。



技术实现要素:

本发明的一个目的是提供一种用于提取文本摘要的方法与设备。

根据本发明的一个方面,提供了一种用于提取文本摘要的方法,其中,该方法包括:

获取用户关于目标原始文本的阅读操作信息;

根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;

根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。

根据本发明的另一方面,还提供了一种用于提取文本摘要的摘要提取设备,其中,该摘要提取设备包括:

用于获取用户关于目标原始文本的阅读操作信息的装置;

用于根据所述阅读操作信息,确定所述用户关于所述目标原始文 本的关注文本的装置;

用于根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要的装置。

与现有技术相比,本发明的一个实施例通过根据用户关于目标原始文本的关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要,从而使得本发明提取的文本摘要更能突出原始文献的重点,提高了文本摘要的准确度和有效性,相应地,也提升了用户的阅读浏览体验。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1示出根据本发明一个方面的一种用于提取文本摘要的摘要提取设备的设备示意图;

图2示出根据本发明另一个方面的一种用于提取文本摘要的方法流程图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

图1示出根据本发明一个方面的一种用于提取文本摘要的摘要提取设备1的设备示意图,其中,摘要提取设备1包括用于获取用户关于目标原始文本的阅读操作信息的装置(以下简称“操作获取装置11”);用于根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本的装置(以下简称“关注文本确定装置12”);用于根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要的装置(以下简称“摘要提取装置13”)。

具体地,操作获取装置11获取用户关于目标原始文本的阅读操作信息;关注文本确定装置12根据所述阅读操作信息,确定所述用 户关于所述目标原始文本的关注文本;摘要提取装置13根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。

在此,摘要提取设备1包括但不限于网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、智能手机、PDA、可穿戴设备、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述摘要提取设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。

具体地,操作获取装置11通过调用用户设备自身提供的应用程序接口(API),或者,通过文库等阅读APP提供的应用程序接口(API),获取用户关于目标原始文本的阅读操作信息。

在此,所述目标原始文本可以是文章、文献、新闻、小说等任何体裁的以文字为主要描述手段而独立成篇的内容。

在此,所述阅读操作信息是指用户在阅读所述目标原始文本过程中表现或执行的阅读相关操作信息,诸如设置阅读模式、更改阅读模式、停留页面、段落内容收藏等。优选地,所述阅读操作信息包括但 不限于以下至少任一项:

-所述用户阅读所述目标原始文本过程中执行的停留操作;

-所述用户阅读所述目标原始文本过程中执行的收藏相关操作;

-所述用户阅读所述目标原始文本过程中的阅读模式信息;

-所述用户阅读所述目标原始文本过程中的阅读速度。

在此,所述收藏相关操作包括但不限于如复制、收藏、分享等操作。在具体实施例中,若用户在阅读文档过程中执行了收藏相关操作,说明用户对收藏的内容部分关注度较高,在一定程度上也说明了用户收藏的内容部分是文档的重要内容。

在此,所述阅读模式信息包括但不限于:1)浏览模式,即以快于正常阅读速度的、每次翻多页;2)阅读模式,即以正常阅读速度的、每次翻一页;3)关键词搜索模式,该模式下用户可通过套索(Lasso)触摸操作以对应选中内容为关键词进行搜索,该搜索可以是转至搜索引擎进行搜索,也可以是在用户正在阅读的文章中进行搜索。在此,所述套索触摸操作的“套索”的功能,是指用户通过与触摸输入装置接触的手指在网页上的任何一个或多个单词的周围画一个圈,或者任何预定义的其它圈中操作,即可对选定内容进行搜索;其中,所述套索触摸操作包括但不限于画圈操作、括弧操作,本领域技术人员应能理解上述套索触摸操作仅为举例,其他现有的或今后可能出现的套索触摸操作如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。例如,用户正在阅读《人间词话》中在词的境界部分有关“可堪孤馆闭春寒,杜鹃声里斜阳暮”的评述,其可搜索秦观《踏沙行》的词句解析。

本领域技术人员应能理解上述目标原始文本和阅读操作信息仅为举例,其他现有的或今后可能出现的目标原始文本或阅读操作信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。

例如,假设用户A通过其ipad2在文库APP中正阅读文章《LTE物理下行控制信道盲检过程研究》,且阅读至其中关于“搜索空间”部分的 描述时,用户A通过滑动显示出“搜索空间”部分相应段落的内容后,停留的时间超过预定时间阈值后才进行滑动以继续阅读,则操作获取装置11可通过文库等阅读APP提供的应用程序接口(API),获取到用户A在阅读目标原始文本《LTE物理下行控制信道盲检过程研究》过程中执行的停留操作。

再如,假设用户A在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,将当前阅读模式由浏览模式修改为关键词搜索模式,并执行了在其ipad2的触摸屏上执行了用一个手指在词语“CCE”周围画一个圈的触摸操作,则操作获取装置11可通过文库等阅读APP提供的应用程序接口(API),获取到用户A在阅读目标原始文本《LTE物理下行控制信道盲检过程研究》过程中执行的阅读模式更改操作以及搜索操作。

本领域技术人员应能理解上述获取用户关于目标原始文本的阅读操作信息的方式仅为举例,其他现有的或今后可能出现的获取用户关于目标原始文本的阅读操作信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。

接着,关注文本确定装置12根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本。

在此,所述关注文本是指用户对所述目标原始文本中关注、感兴趣的段落、词语,其也体现了所述目标原始文本中的重要内容。在具体实施例中,用户在阅读文档中的其关注的内容部分时,通常具有与阅读其他内容部分不一样的表现,如停留时间较长、阅读速度放慢、进行收藏等操作。

在此,关注文本确定装置12确定所述关注文本的方式包括但不限于以下至少任一项:

1)若所述用户阅读操作信息包括所述用户阅读所述目标原始文本过程中的停留操作,则关注文本确定装置12可根据所述用户执行所述停留操作所对应的段落的停留时间,将停留时间大于预定时间阈值的段落作为所述关注文本。

例如,对于用户A,其在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,在“搜索空间”部分相应段落如该文章的第[5-7]段停留的时间大于预定时间阈值,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-7]段作为所述关注文本。

2)若所述用户阅读所述目标原始文本过程中由所述浏览模式变换为所述关键词搜索模式,则关注文本确定装置12可将所述目标原始文本中在所述关键词搜索模式下被浏览的段落作为所述关注文本。

例如,对于用户A,其在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,将当前阅读模式由浏览模式修改为关键词搜索模式,在关键词搜索模式下阅读的“搜索空间”部分对应的段落为该文章的第[5-10]段,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-10]段作为所述关注文本。

3)若所述阅读操作信息包括所述用户阅读所述目标原始文本过程中执行的收藏相关操作,则关注文本确定装置12可将所述用户执行所述收藏相关操作所对应的段落,作为所述关注文本。

例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,在“搜索空间”部分相应段落如该文章的第[5-7]段中的每一段均执行了收藏操作,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-7]段作为所述关注文本。

4)若所述阅读操作信息包括所述用户阅读所述目标原始文本过程中的阅读速度,则关注文本确定装置12可将所述目标原始文本中所述用户以低于预定阅读速度阈值的阅读速度浏览的段落作为所述关注文本。

例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,用户A通过滑动操作显示出“搜索空间”部分相应段落的内容如该文章的第[5]段后,停留了20min, 才进行滑动以继续阅读该文章的第[6]段,假设该文章第[5]段共有文字400字,则说明用A阅读第[5]段的阅读速度为20字/min,其低于预定阅读速度阈值如500字/min,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5]段作为所述关注文本。

本领域技术人员应能理解上述确定所述关注文本的方式仅为举例,其他现有的或今后可能出现的确定所述关注文本的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。

在此,本领域技术人员应当理解,本发明在根据所述阅读操作信息确定所述关注文本时,可根据前述所述阅读操作信息中的任意一项或多项的组合来确定所述关注文本。例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,假设“搜索空间”部分的全部内容为该文章的第[5-12]段,用户A阅读第[5]段的阅读速度低于预定阅读速度阈值如500字/min,其在阅读该文章的第[7]段时执行了收藏操作,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5]段和第[7]段均作为所述关注文本;再如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,其在阅读该文章的第[7]段时执行了收藏操作,而其在关键词搜索模式下阅读的“搜索空间”部分对应的段落为该文章的第[5-10]段,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-10]段作为所述关注文本。

在此,需要说明的是,本发明还可获取多个用户关于目标原始文本的阅读操作信息,进而可得到每一用户关于所述目标原始文本的关注文本,从而本发明可根据每一用户的所述关注文本,确定所述多个用户关于所述目标原始文本的公共关注文本,以作为最终的关注文本,可进一步提高文本摘要的准确度和有效性,也进一步提升了用户的阅读浏览体验。

接着,摘要提取装置13根据所述关注文本,结合所述目标原始文本的内容信息,通过诸如将文本作为句子的线性序列、将句子视为 词的线性序列等方法,提取所述目标原始文本的文本摘要。

例如,假设文章《LTE物理下行控制信道盲检过程研究》通过现有技术中的自动文本摘要方法,也即基于全文内容或章节相关的段落内容而得到的文本摘要为“LTE物理下行控制信道为整个系统上下行阐述分配各种资源,对系统起着非常关键的调度作用。基于PDCCH信道发送与接收流程,根据PDCCH信道结构,详细分析了信道的调度过程,为终端PDCCH信道接收制定了一种详细的盲检方法,为LTE系统的实际实现提供了理论依据”,而摘要提取装置13根据关注文本确定装置12确定的所述关注文本,如“搜索空间”部分对应的第[5-10]段,结合所述目标原始文本的内容信息,通过诸如将文本作为句子的线性序列、将句子视为词的线性序列等方法,提取得到文章《LTE物理下行控制信道盲检过程研究》的文本摘要为“LTE物理下行控制信道为整个系统上下行阐述分配各种资源,对系统起着非常关键的调度作用。基于PDCCH信道发送与接收流程,根据PDCCH信道结构,详细分析了信道的调度过程、专用搜索空间和公共搜索空间,为终端PDCCH信道接收制定了一种详细的盲检方法,为LTE系统的实际实现提供了理论依据”。

在此,本发明提取的文本摘要不同于现有技术中得到文本摘要,相对于现有技术,本发明提取的文本摘要更能突出原始文献的重点,提高了文本摘要的准确度和有效性,相应地,也提升了用户的阅读浏览体验。

摘要提取设备1的各装置之间是持续不断工作的。具体地,操作获取装置11持续获取用户关于目标原始文本的阅读操作信息;关注文本确定装置12持续根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;摘要提取装置13持续根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。在此,本领域技术人员应当理解所述“持续”是指摘要提取设备1的各个装置之间分别不断地进行阅读操作信息的获取、关注文本的确定与文本摘要提取,直至摘要提取设备1在较长时间内停止获 取阅读操作信息。

优选地,若所述用户阅读所述目标原始文本过程中的停留时间大于预定阈值的段落为多个,或者,若所述目标原始文本中在所述关键词搜索模式下被浏览的段落为多个,其中,摘要提取设备1还包括:用于根据多个所述段落之间的内容关联度,从所述多个段落中确定优选关注文本的装置(以下简称“优选确定装置”,未示出),其中,摘要提取装置13根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。

例如,对于文章《LTE物理下行控制信道盲检过程研究》,用户A在阅读该文章过程中停留时间大于预定阈值的段落为该文章的第[5-7]段,假设第[5-6]段的内容分别为专用搜索空间和公共搜索空间,而第[7]段的内容为盲检过程,则第[7]段的内容与第[5-6]段的内容之间的关联度比较小,则优选确定装置可确定第[5-6]段作为优选关注文本。

接着,摘要提取装置13根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。在此,摘要提取装置13根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述文本摘要的方式与前述摘要提取装置13根据所述关注文本,结合所述目标原始文本的内容信息,提取所述文本摘要的方式相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。

在此,本发明通过根据优选关注文本,结合所述目标原始文本的内容信息,来提取文本摘要,使得本发明提取的文本摘要更一步突出原始文献的重点,提高文本摘要的准确度和有效性,提升用户的阅读浏览体验。

优选地,所述阅读操作信息还包括所述用户关于所述目标原始文本的历史阅读记录,其中,关注文本确定装置12根据所述历史阅读记录,确定所述关注文本。

优选地,所述历史阅读记录包括以下至少任一项:

-所述用户关于所述目标原始文本中段落的历史阅读频率信息;

-所述用户关于所述目标原始文本中段落的历史阅读平均时长。

例如,对于文章《LTE物理下行控制信道盲检过程研究》,假设用户A关于该文章的历史阅读记录中,经常阅读该文章中的第[5-6]段的内容,则关注文本确定装置12根据该历史阅读记录,确定所述关注文本为该文章的第[5-6]段。

再如,对于用户A,假设其关于文章《LTE物理下行控制信道盲检过程研究》的历史阅读记录中,对第[6]段的历史阅读平均时长超过预定阈值,则关注文本确定装置12根据该历史阅读记录,确定所述关注文本为该文章的第[6]段。

图2示出根据本发明另一个方面的一种用于提取文本摘要的方法流程图。

其中,该方法包括步骤S1、步骤S2和步骤S3。具体地,在步骤S1中,摘要提取设备1获取用户关于目标原始文本的阅读操作信息;在步骤S2中,摘要提取设备1根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;在步骤S3中,摘要提取设备1根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。

在此,摘要提取设备1包括但不限于网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、智能手机、PDA、可穿戴设备、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述摘要提取设备1仅为举例,其他现有的或今后 可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。

具体地,在步骤S1中,摘要提取设备1通过调用用户设备自身提供的应用程序接口(API),或者,通过文库等阅读APP提供的应用程序接口(API),获取用户关于目标原始文本的阅读操作信息。

在此,所述目标原始文本可以是文章、文献、新闻、小说等任何体裁的以文字为主要描述手段而独立成篇的内容。

在此,所述阅读操作信息是指用户在阅读所述目标原始文本过程中表现或执行的阅读相关操作信息,诸如设置阅读模式、更改阅读模式、停留页面、段落内容收藏等。优选地,所述阅读操作信息包括但不限于以下至少任一项:

-所述用户阅读所述目标原始文本过程中执行的停留操作;

-所述用户阅读所述目标原始文本过程中执行的收藏相关操作;

-所述用户阅读所述目标原始文本过程中的阅读模式信息;

-所述用户阅读所述目标原始文本过程中的阅读速度。

在此,所述收藏相关操作包括但不限于如复制、收藏、分享等操作。在具体实施例中,若用户在阅读文档过程中执行了收藏相关操作,说明用户对收藏的内容部分关注度较高,在一定程度上也说明了用户收藏的内容部分是文档的重要内容。

在此,所述阅读模式信息包括但不限于:1)浏览模式,即以快于正常阅读速度的、每次翻多页;2)阅读模式,即以正常阅读速度的、每次翻一页;3)关键词搜索模式,该模式下用户可通过套索(Lasso)触摸操作以对应选中内容为关键词进行搜索,该搜索可以是转至搜索引擎进行搜索,也可以是在用户正在阅读的文章中进行搜索。在此,所述套索触摸操作的“套索”的功能,是指用户通过与触 摸输入装置接触的手指在网页上的任何一个或多个单词的周围画一个圈,或者任何预定义的其它圈中操作,即可对选定内容进行搜索;其中,所述套索触摸操作包括但不限于画圈操作、括弧操作,本领域技术人员应能理解上述套索触摸操作仅为举例,其他现有的或今后可能出现的套索触摸操作如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。例如,用户正在阅读《人间词话》中在词的境界部分有关“可堪孤馆闭春寒,杜鹃声里斜阳暮”的评述,其可搜索秦观《踏沙行》的词句解析。

本领域技术人员应能理解上述目标原始文本和阅读操作信息仅为举例,其他现有的或今后可能出现的目标原始文本或阅读操作信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。

例如,假设用户A通过其ipad2在文库APP中正阅读文章《LTE物理下行控制信道盲检过程研究》,且阅读至其中关于“搜索空间”部分的描述时,用户A通过滑动显示出“搜索空间”部分相应段落的内容后,停留的时间超过预定时间阈值后才进行滑动以继续阅读,则在步骤S1中,摘要提取设备1可通过文库等阅读APP提供的应用程序接口(API),获取到用户A在阅读目标原始文本《LTE物理下行控制信道盲检过程研究》过程中执行的停留操作。

再如,假设用户A在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,将当前阅读模式由浏览模式修改为关键词搜索模式,并执行了在其ipad2的触摸屏上执行了用一个手指在词语“CCE”周围画一个圈的触摸操作,则在步骤S1中,摘要提取设备1可通过文库等阅读APP提供的应用程序接口(API),获取到用户A在阅读目标原始文本《LTE物理下行控制信道盲检过程研究》过程中执行的阅读模式更改操作以及搜索操作。

本领域技术人员应能理解上述获取用户关于目标原始文本的阅读操作信息的方式仅为举例,其他现有的或今后可能出现的获取用户关于目标原始文本的阅读操作信息的方式如可适用于本发明,也应包含 在本发明保护范围以内,并在此以引用方式包含于此。

接着,在步骤S2中,摘要提取设备1根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本。

在此,所述关注文本是指用户对所述目标原始文本中关注、感兴趣的段落、词语,其也体现了所述目标原始文本中的重要内容。在具体实施例中,用户在阅读文档中的其关注的内容部分时,通常具有与阅读其他内容部分不一样的表现,如停留时间较长、阅读速度放慢、进行收藏等操作。

在此,在步骤S2中,摘要提取设备1确定所述关注文本的方式包括但不限于以下至少任一项:

1)若所述用户阅读操作信息包括所述用户阅读所述目标原始文本过程中的停留操作,则在步骤S2中,摘要提取设备1可根据所述用户执行所述停留操作所对应的段落的停留时间,将停留时间大于预定时间阈值的段落作为所述关注文本。

例如,对于用户A,其在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,在“搜索空间”部分相应段落如该文章的第[5-7]段停留的时间大于预定时间阈值,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-7]段作为所述关注文本。

2)若所述用户阅读所述目标原始文本过程中由所述浏览模式变换为所述关键词搜索模式,则在步骤S2中,摘要提取设备1可将所述目标原始文本中在所述关键词搜索模式下被浏览的段落作为所述关注文本。

例如,对于用户A,其在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,将当前阅读模式由浏览模式修改为关键词搜索模式,在关键词搜索模式下阅读的“搜索空间”部分对应的段落为该文章的第[5-10]段,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-10]段作为所述关注文本。

3)若所述阅读操作信息包括所述用户阅读所述目标原始文本过程中执行的收藏相关操作,则在步骤S2中,摘要提取设备1可将所述用户执行所述收藏相关操作所对应的段落,作为所述关注文本。

例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,在“搜索空间”部分相应段落如该文章的第[5-7]段中的每一段均执行了收藏操作,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-7]段作为所述关注文本。

4)若所述阅读操作信息包括所述用户阅读所述目标原始文本过程中的阅读速度,则在步骤S2中,摘要提取设备1可将所述目标原始文本中所述用户以低于预定阅读速度阈值的阅读速度浏览的段落作为所述关注文本。

例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,用户A通过滑动操作显示出“搜索空间”部分相应段落的内容如该文章的第[5]段后,停留了20min,才进行滑动以继续阅读该文章的第[6]段,假设该文章第[5]段共有文字400字,则说明用A阅读第[5]段的阅读速度为20字/min,其低于预定阅读速度阈值如500字/min,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5]段作为所述关注文本。

本领域技术人员应能理解上述确定所述关注文本的方式仅为举例,其他现有的或今后可能出现的确定所述关注文本的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。

在此,本领域技术人员应当理解,本发明在根据所述阅读操作信息确定所述关注文本时,可根据前述所述阅读操作信息中的任意一项或多项的组合来确定所述关注文本。例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,假设“搜索空间”部分的全部内容为该文章的第[5-12]段,用户A阅读第[5]段的阅读速度低于预定阅读速度阈值如500字/min,其在阅读该 文章的第[7]段时执行了收藏操作,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5]段和第[7]段均作为所述关注文本;再如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,其在阅读该文章的第[7]段时执行了收藏操作,而其在关键词搜索模式下阅读的“搜索空间”部分对应的段落为该文章的第[5-10]段,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-10]段作为所述关注文本。

在此,需要说明的是,本发明还可获取多个用户关于目标原始文本的阅读操作信息,进而可得到每一用户关于所述目标原始文本的关注文本,从而本发明可根据每一用户的所述关注文本,确定所述多个用户关于所述目标原始文本的公共关注文本,以作为最终的关注文本,可进一步提高文本摘要的准确度和有效性,也进一步提升了用户的阅读浏览体验。

接着,在步骤S3中,摘要提取设备1根据所述关注文本,结合所述目标原始文本的内容信息,通过诸如将文本作为句子的线性序列、将句子视为词的线性序列等方法,提取所述目标原始文本的文本摘要。

例如,假设文章《LTE物理下行控制信道盲检过程研究》通过现有技术中的自动文本摘要方法,也即基于全文内容或章节相关的段落内容而得到的文本摘要为“LTE物理下行控制信道为整个系统上下行阐述分配各种资源,对系统起着非常关键的调度作用。基于PDCCH信道发送与接收流程,根据PDCCH信道结构,详细分析了信道的调度过程,为终端PDCCH信道接收制定了一种详细的盲检方法,为LTE系统的实际实现提供了理论依据”,而在步骤S3中,摘要提取设备1根据在步骤S2中,摘要提取设备1确定的所述关注文本,如“搜索空间”部分对应的第[5-10]段,结合所述目标原始文本的内容信息,通过诸如将文本作为句子的线性序列、将句子视为词的线性序列等方法,提取得到文章《LTE物理下行控制信道盲检过程研究》的文本摘要 为“LTE物理下行控制信道为整个系统上下行阐述分配各种资源,对系统起着非常关键的调度作用。基于PDCCH信道发送与接收流程,根据PDCCH信道结构,详细分析了信道的调度过程、专用搜索空间和公共搜索空间,为终端PDCCH信道接收制定了一种详细的盲检方法,为LTE系统的实际实现提供了理论依据”。

在此,本发明提取的文本摘要不同于现有技术中得到文本摘要,相对于现有技术,本发明提取的文本摘要更能突出原始文献的重点,提高了文本摘要的准确度和有效性,相应地,也提升了用户的阅读浏览体验。

摘要提取设备1的各步骤之间是持续不断工作的。具体地,在步骤S1中,摘要提取设备1持续获取用户关于目标原始文本的阅读操作信息;在步骤S2中,摘要提取设备1持续根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;在步骤S3中,摘要提取设备1持续根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。在此,本领域技术人员应当理解所述“持续”是指摘要提取设备1的各个步骤之间分别不断地进行阅读操作信息的获取、关注文本的确定与文本摘要提取,直至摘要提取设备1在较长时间内停止获取阅读操作信息。

优选地,若所述用户阅读所述目标原始文本过程中的停留时间大于预定阈值的段落为多个,或者,若所述目标原始文本中在所述关键词搜索模式下被浏览的段落为多个,其中,摘要提取设备1还包括步骤S4(未示出)。具体地,在步骤S4中,摘要提取设备1根据多个所述段落之间的内容关联度,从所述多个段落中确定优选关注文本,其中,在步骤S3中,摘要提取设备1根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。

例如,对于文章《LTE物理下行控制信道盲检过程研究》,用户A在阅读该文章过程中停留时间大于预定阈值的段落为该文章的第[5-7]段,假设第[5-6]段的内容分别为专用搜索空间和公共搜索空间,而第[7]段的内容为盲检过程,则第[7]段的内容与第[5-6]段的内容之间的关联 度比较小,则优选确定装置可确定第[5-6]段作为优选关注文本。

接着,在步骤S3中,摘要提取设备1根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。在此,在步骤S3中,摘要提取设备1根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述文本摘要的方式与前述在步骤S3中,摘要提取设备1根据所述关注文本,结合所述目标原始文本的内容信息,提取所述文本摘要的方式相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。

在此,本发明通过根据优选关注文本,结合所述目标原始文本的内容信息,来提取文本摘要,使得本发明提取的文本摘要更一步突出原始文献的重点,提高文本摘要的准确度和有效性,提升用户的阅读浏览体验。

优选地,所述阅读操作信息还包括所述用户关于所述目标原始文本的历史阅读记录,其中,在步骤S2中,摘要提取设备1根据所述历史阅读记录,确定所述关注文本。

优选地,所述历史阅读记录包括以下至少任一项:

-所述用户关于所述目标原始文本中段落的历史阅读频率信息;

-所述用户关于所述目标原始文本中段落的历史阅读平均时长。

例如,对于文章《LTE物理下行控制信道盲检过程研究》,假设用户A关于该文章的历史阅读记录中,经常阅读该文章中的第[5-6]段的内容,则在步骤S2中,摘要提取设备1根据该历史阅读记录,确定所述关注文本为该文章的第[5-6]段。

再如,对于用户A,假设其关于文章《LTE物理下行控制信道盲检过程研究》的历史阅读记录中,对第[6]段的历史阅读平均时长超过预定阈值,则在步骤S2中,摘要提取设备1根据该历史阅读记录,确定所述关注文本为该文章的第[6]段。

需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处 理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。

另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1