本申请总体涉及机器学习模型和神经网络,并且更具体地涉及一种可控文本概述框架。
背景技术:
1、文本概述将文档压缩成短段落或句子作为文档的“概述”,同时预期概述保存来自文档的核心信息。一些现有的概述系统从文档中提取重要的句子以形成概述,而一些其他现有的概述系统通过制定他们自己选择的句子从头开始产生概述。这些概述系统产生的概述仅依赖于输入文档,因此经常导致输入文档的概述的一个版本。概述的通用版本有时可能无法捕获请求概述的用户的不同兴趣。
技术实现思路
1.一种对文档进行可控文本概述的方法,所述方法包括:
2.根据权利要求1所述的方法,其中所述概述的特征包括如下任意一项:
3.根据权利要求2所述的方法,其中所述一个或多个控制参数包括对应于所述输入文本文档的类型的提示。
4.根据权利要求3所述的方法,其中所述提示选自如下的组:
5.根据权利要求1所述的方法,还包括:
6.根据权利要求1所述的方法,其中所述语言模型是通过如下训练的:
7.根据权利要求6所述的方法,还包括:
8.一种对文档进行可控文本概述的系统,所述系统包括:
9.根据权利要求8所述的系统,其中所述概述的特征包括如下任意一项:
10.根据权利要求9所述的系统,其中所述一个或多个控制参数包括对应于所述输入文本文档的类型的提示。
11.根据权利要求10所述的系统,其中所述提示选自如下的组:
12.根据权利要求8所述的系统,其中所述一个或多个硬件处理器还:
13.根据权利要求8所述的系统,其中所述语言模型是通过如下训练的:
14.根据权利要求13所述的系统,其中所述一个或多个硬件处理器还:
15.一种非瞬态处理器可读介质,其存储用于文档的可控文本概述的多个处理器可执行指令,所述指令由一个或多个处理器运行以执行包括如下的操作:
16.根据权利要求15的非瞬态处理器可读介质,其中所述概述的特征包括如下任意一项:
17.根据权利要求16所述的非瞬态处理器可读介质,其中所述一个或多个控制参数包括对应于所述输入文本文档的类型的提示。
18.根据权利要求17所述的非瞬态处理器可读介质,其中所述提示选自如下的组:
19.根据权利要求16所述的非瞬态处理器可读介质,其中所述操作还包括:
20.根据权利要求15所述的非瞬态处理器可读介质,其中所述语言模型是通过如下训练的: