一种智能报告生成方法、系统及设备与流程

文档序号:14489595阅读:214来源:国知局
一种智能报告生成方法、系统及设备与流程

本发明涉及语音识别和文本分析技术领域,更具体地说,涉及一种智能报告生成方法、系统及设备。



背景技术:

在人们进行会议或者谈话等重要会谈的过程中,经常需要对会谈内容进行记录并生成对应的报告,以供后续查询和使用。目前通常是安排有专门的记录人员负责会谈内容的记录及对应报告的生成,但是由于语音速度是高于记录人员的记录速度的,所以很容易出现记录人员无法及时记录进而丢失部分会谈内容及由于听错会谈内容导致记录出现错误的情况,最终导致生成的报告缺少部分会谈内容且不够准确。

综上所述,如何提供一种能够完整且准确的体现会谈内容的报告生成的技术方案,是目前本领域技术人员亟待解决的问题。



技术实现要素:

本发明的目的是提供一种智能报告生成方法、系统及设备,使得生成的报告能够完整且准确的体现会谈内容。

为了实现上述目的,本发明提供如下技术方案:

一种智能报告生成方法,包括:

在外界的会谈过程中进行录音得到对应的会谈语音;

对所述会谈语音进行文本解析得到对应的会谈文本;

获取报告名称,得到名称为所述报告名称、内容包括所述会谈文本的会谈报告。

优选的,得到所述会谈文本之后,得到所述会谈报告之前,还包括:

将所述会谈语音及所述会谈文本以预设时间间隔为单位划分为多份子会谈语音及子会谈文本,使用众包的方式利用人工基于所述子会谈语音对对应子会谈文本进行修正,并将修正后的子会谈文本组合得到修正后的会谈文本。

优选的,得到修正后的会谈文本之后,还包括:

以所述会谈语音及修正后的会谈文本作为训练语料对实现会谈语音解析的模型进行增量学习,以利用进行增量学习后的模型实现会谈语音的解析。

优选的,得到所述会谈文本之后,得到所述会谈报告之前,还包括:

将所述会谈文本导入至可编辑区域;

确定数据库预先存储的信息中与所述会谈文本具有关联的关联信息,并在外界触发下将外界由所述关联信息中选取的内容插入至所述会谈文本中。

优选的,确定数据库预先存储的信息中与所述会谈文本具有关联的关联信息,包括:

对所述会谈文本进行实体、属性及事件识别,得到包含有该会谈文本的实体、属性及事件的实体元组;

将所述实体元组构造成子图输入至数据库预先存储的知识图谱中进行子图匹配,如果匹配得到的相似度大于预设相似度阈值,则确定匹配成功,并对知识图谱中匹配成功的信息作为关联信息按照相似度由大到小进行排序及显示。

优选的,对所述知识图谱中匹配成功的信息进行显示,包括:

使用浮动弹框形式对所述知识图谱中匹配成功的信息进行显示。

优选的,在外界触发下将外界由所述关联信息中选取的内容插入至所述会谈文本中之后,还包括:

将所述会谈文本与外界选取的内容之间的子图匹配模式、所述会谈文本及所述外界选取的内容记录至记录集。

优选的,得到名称为所述报告名称、内容包括所述会谈文本的会谈报告之后,还包括:

在外界触发下对所述会谈报告包括的内容进行文本编辑处理;

基于对所述会谈报告的表示学习结合主题模型生成对应的关键字,并将该关键字加入至所述会谈报告中;

将所述关键字加入至所述会谈报告中之后,还包括:

将所述会谈报告保存为模板,供调取该模板作为会谈报告模板进行使用。

一种智能报告生成系统,包括:

录音模块,用于:在外界的会谈过程中进行录音得到对应的会谈语音;

解析模块,用于:对所述会谈语音进行文本解析得到对应的会谈文本;

报告生成模块,用于:获取报告名称,得到名称为所述报告名称、内容包括所述会谈文本的会谈报告。

一种智能报告生成设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如上任一项所述智能报告生成方法的步骤。

本发明提供了一种智能报告生成方法、系统及设备,其中该方法包括:在外界的会谈过程中进行录音得到对应的会谈语音;对所述会谈语音进行文本解析得到对应的会谈文本;获取报告名称,得到名称为所述报告名称、内容包括所述会谈文本的会谈报告。本发明实施例公开的上述技术方案中,在外界会谈的过程中进行录音得到对应会谈语音,进而对该会谈语音进行文本解析得到对应会谈文本,最终形成具有报告名称且内容包括会谈文本的会谈报告,从而无需记录人员人工记录会谈内容及生成对应报告,而是通过录音及文本解析实现会谈内容的记录及对应报告的生成,由此生成的报告避免了人工记录时出现的丢失会谈内容或者记录出错等情况的出现,能够完整且准确的体现会谈内容。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种智能报告生成方法的流程图;

图2为本发明实施例提供的一种智能报告生成系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,其示出了本发明实施例提供的一种智能报告生成方法的流程图,可以包括:

s11:在外界的会谈过程中进行录音得到对应的会谈语音。

在外界的会谈过程中,可以对会谈过程中产生的语音进行录音进而得到对应的会谈语音,具体来说,实现本申请公开的上述方法的系统可以提供有录音对应录音按钮,录音按钮初始状态为“开始录音”,外界点击“开始录音”后开始进行录音,且该录音按钮变成“暂停录音”;外界点击“暂停录音”后停止此次录音,且该录音按钮变成“开始录音”,对应得到的录音即为会谈语音。另外可以设置为语音自动保存,即得到会谈语音之后自动对该语音进行保存;还可以设置为语音人为保存,即上述系统可以设置有“保存”按钮,从而在开始录音后及录完完成后通过外界点击该按钮对录音得到的语音进行保存。另外对会谈过程中的录音可以是实时的,即只要需要录音,则实时实现录音并得到当前时刻对应会谈语音。

需要说明的是,在录音过程中还可以以时间轴将录音对应波形进行展示,供外界获取。

s12:对会谈语音进行文本解析得到对应的会谈文本。

本发明提供的上述方法对应系统还可以设置有“语音解析”按钮,从而当外界点击该按钮时对录音得到的会谈语音进行文本解析;还可以设置为自动实时解析,即进行录音的过程中对录音所得会谈语音进行实时文本解析,均在本发明的保护范围之内。另外在对会谈语音进行解析的过程中还可以显示解析的进度条,以使得外界工作人员可以通过该进度条获知语音解析的进度。需要说明的是,本申请中如只需保存会谈语音而不进行任何文本解析也可以通过外界点击预先设置的“暂不解析,仅保存录音”按钮或者上述“保存”按钮对会谈语音进行保存,并对保存的全部语音对应列表进行相应的更新,方便工作人员的查询及使用。

另外在对会谈语音进行实时解析的过程中还可以根据会谈语音的停顿划分成不同的段落或者做出对应标记,该停顿可以为录音过程中确定出未有人讲话且保持的时间不小于预先根据实际需要设定的预设停顿时长的停顿,即两个停顿之间的语音对应文本可以为一个段落或者在每个停顿位置加入预先设置的停顿标记;还可以根据会谈语音中讲话人物的改变划分段落或者作出对应标记,即可以通过对人物讲话时的音色、频率等进行判断以区分出不同的人物,从而将同一人物的语音对应文本作为一个段落或者在每次更换人物讲话时加入预先设定的换人标记,加入换人标记具体可以为根据人物讲话时的音色、频率等确定出参与会谈的人物数量,并给每个人物设置一个编号或名称等识别信息,从而在这个人物讲话时在其对应文本前加上该人物的识别信息。当然也可以综合考虑停顿及人物更换,如在每次更换人物讲话时加入对应换人标记的同时将每两次停顿间语音对应文本作为一个段落,等,均在本发明的保护范围之内。

s13:获取报告名称,得到名称为报告名称、内容包括会谈文本的会谈报告。

需要说明的是,该报告名称可以为用户点击“保存”按钮时弹出的供外界编辑报告名称的对话框,可以预先设置有默认报告名称,如“xx公司”;报告名称还可以通过智能联想由数据库预先已经存储的报告名称中选取出与当前会谈文本具有较高关联度的报告名称为当前的报告名称,其中关联度可以为报告名称出现在会谈文本中的次数越多则证明对应关联度越高等。通过上述方式,得到具有报告名称及报告内容的会谈报告,供后续使用及查询等。

本发明实施例公开的上述技术方案中,在外界会谈的过程中进行录音得到对应会谈语音,进而对该会谈语音进行文本解析得到对应会谈文本,最终形成具有报告名称且内容包括会谈文本的会谈报告,从而无需记录人员人工记录会谈内容及生成对应报告,而是通过录音及文本解析实现会谈内容的记录及对应报告的生成,由此生成的报告避免了人工记录时出现的丢失会谈内容或者记录出错等情况的出现,能够完整且准确的体现会谈内容。

本发明实施例提供的一种智能报告生成方法,得到会谈文本之后,得到会谈报告之前,还可以包括:

将会谈语音及会谈文本以预设时间间隔为单位划分为多份子会谈语音及子会谈文本,使用众包的方式利用人工基于子会谈语音对对应子会谈文本进行修正,并将修正后的子会谈文本组合得到修正后的会谈文本。

其中预设时间间隔可以根据实际需要进行设定,如10分钟,将会谈语音及会谈文本以预设时间间隔为单位划分成多份子会谈语音及对应的多份子会谈文本,其中子会谈语音与子会谈文本一一对应且互相对应的子会谈语音与子会谈文本所属的时间段相同。使用众包的方式利用人工基于子会谈语音对对应的子会谈文本进行修正,不仅保证了修正后会谈文本的准确性,且由于使用了众包的方式还有效避免了重要信息泄露。具体来说,使用众包的方式利用人工基于子会谈语音对对应的子会谈文本进行修正可以包括:将得到的子会谈语音及对应子会谈文本发送给不同的终端(每份子会谈语音及对应子会谈文本对应一个终端),每个终端对应工作人员基于接收到的子会谈语音对接收到的子会谈文本进行人工干预和修正,如由人工回听接收到的子会谈录音的内容与对应子会谈文本的内容是否相同,并对不同的地方以子会谈录音的内容为准作出修正,可以在子会谈文本上保留修正的记录或者直接在另外的存储空间记录下修正的过程。

本发明实施例提供的一种智能报告生成方法,得到修正后的会谈文本之后,还可以包括:

以会谈语音及修正后的会谈文本作为训练语料对实现会谈语音解析的模型进行增量学习,以利用进行增量学习后的模型实现会谈语音的解析。由于修正后的会谈文本相对于修正前更加准确,更加符合对应会谈语音,因此可以将会谈语音及修正后的会谈文本作为训练语料对实现语音解析的模型进行增量学习,以在后续需要实现语音解析时通过增量学习后的模型实现,提高了语音自动解析的准确率。

本发明实施例提供的一种智能报告生成方法,得到会谈文本之后,得到会谈报告之前,还可以包括:

将会谈文本导入至可编辑区域;

确定数据库预先存储的信息中与会谈文本具有关联的关联信息,并在外界触发下将外界由关联信息中选取的内容插入至会谈文本中。

本申请公开的上述方法对应系统中还可以设置有如笔记栏之类的可编辑区域,可以在外界点击会谈文本整体或者其中某部分时将对应文本导入至可编辑区域(具体可以为可编辑区域末尾),还可以设置成生成会谈文本后自动将该文本导入至可编辑区域,均在本发明的保护范围之内。且可编码区域作为一个文本编辑工具,具备基本的字体、段落、颜色、标注等文本编辑功能。预先设置的数据库中存储有对应的信息,可在外界触发下将外界选取的数据库中的信息插入至外界在会谈文本中指定的位置,具体可以由外界点击“插入按钮”实现需要插入的信息的选取及插入等;还可以自动筛选出数据库中与会谈文本具有关联的关联信息,以供外界查看或者从中选取需要插入至会谈文本的信息并在外界触发下将该信息插入至会谈文本,如一段语音中包括当前公司的股东,则可以将股东对应信息作为关联信息供外界选取。从而通过这种智能联想提示功能加快了报告的准确生成。

本发明实施例提供的一种智能报告生成方法,确定数据库预先存储的信息中与会谈文本具有关联的关联信息,可以包括:

对会谈文本进行实体、属性及事件识别,得到包含有该会谈文本的实体、属性及事件的实体元组;

将实体元组构造成子图输入至数据库预先存储的知识图谱中进行子图匹配,如果匹配得到的相似度大于预设相似度阈值,则确定匹配成功,并对知识图谱中匹配成功的信息作为关联信息按照相似度由大到小进行排序及显示。

对会谈文本进行动态实时解析,包括对其进行分词、词性识别、命名实体识别以及句法依存分析,从而获取文本中的包含的实体和成分结构,其中成分结构包括会谈文本中实体的属性及事件,具体来说,本申请中的实体的定义为独立存在的金融证券活动参与者,包括企业和投资者等;而实体属性是对实体要素的静态表达,以企业为例进行说明,企业的属性包括工商信息、行业属性、关联企业、个人、关键行为人及财务属性等,其中企业的关键行为人属性中包含有实际控制人,实际控制人可以包括企业的股东及并不是企业的股东但是通过投资关系、协议或者其他安排能够支配企业行为的人员;而事件则为实体对应的事件,以企业为例进行说明,实体的事件是企业动态行为的集合,包括融资、经营活动、信息披露等,事件本身也具有相应的属性,比如事件的时间、地点、人物、事由、经过、结果和影响;从而通过识别会谈文本中包含的实体、属性、概念及事件,得到包含该会谈文本中实体、属性及事件的元组形式、即实体元组;把实体元组构造成的子图输入数据库中存储的知识图谱中进行子图匹配,如果匹配的相似度超过预先根据实际需要设定的预设相似度阈值,则认为匹配到内容,进而将匹配到的内容作为关联信息按照相似度由大到小进行排序及显示,其中知识图谱中存储有多个子图,将实体元组的子图与知识图谱中的每个子图依次进行比对,比对得到的相似度大于预设相似度阈值则说明匹配成功。从而方便了外界的查看及使用。另外需要说明的是,进行子图匹配时一般可以先进行子图的模糊匹配从而会产生多个与会谈文本对应子图对应的多个候选子图,然后确定会谈文本对应子图与各候选子图中各节点和属性相似度,并确定该相似度最高的且高于预设相似度阈值的子图候选子图为最终匹配成功的子图。

本发明实施例提供的一种智能报告生成方法,对知识图谱中匹配成功的信息进行显示,可以包括:

使用浮动弹框形式对知识图谱中匹配成功的信息进行显示。

本申请中对于匹配成功的信息进行的显示可以使用浮动弹框形式实现,具体来说,当确定出匹配成功后可以将会谈文本中的实体部分进行高亮,并将需要展示的信息以浮动弹框形式展现出来,浮动弹框可以默认为关闭模式,当外界选中高亮实体(如将鼠标移动至高亮实体)则显示该浮动弹框。浮动弹框的内容在用户浏览后可以在外界触发下关闭,也可以在外界选取任一信息后将该信息加入至会谈文本中。从而不仅便于用户对相关信息的查看及插入,还能够避免过多占用页面资源。

本发明实施例提供的一种智能报告生成方法,在外界触发下将外界由关联信息中选取的内容插入至会谈文本中之后,还可以包括:

将会谈文本与外界选取的内容之间的子图匹配模式、会谈文本及外界选取的内容记录至记录集。

当外界选取出需要加入至会谈文本的内容后,可以将会谈文本、外界选取的内容及对应子图匹配模式记录至记录集,其中外界选取的内容及会谈文本之间的子图匹配模式可以包括外界选取的内容对应子图、会谈文本对应子图及两个子图之间的相似度;由此当需要为某会谈文本再次匹配的时候,可以由记录集中寻找到与该会谈文本对应的子图匹配模式,如果寻找到的子图匹配模式为多个,则选取其中相似度最高的子图匹配模式对应外界选取的内容为与该会谈文本对应的内容并通过进行显示等方式返回给外界用户。其中子图匹配模式的寻找可以通过深度学习中相关的表示学习、相似度计算以及分类方法等实现,在此不做具体限定。

本发明实施例提供的一种智能报告生成方法,得到名称为报告名称、内容包括会谈文本的会谈报告之后,还可以包括:

在外界触发下对会谈报告包括的内容进行文本编辑处理;

基于对会谈报告的表示学习结合主题模型生成对应的关键字,并将该关键字加入至会谈报告中。

得到会谈报告之后,该会谈报告支持基本的文本编辑能力,能进行增删改、调整各种格式等文本编辑处理,以便用户将其最终调整为自己需要的报告形式。另外,还可以通过会谈报告的报告名称及内容的表示学习结合主题模型生成对应的关键字,如行业、产业和区域等维度,并将这些关键字加入至会谈报告中,方便用户基于这些关键字实现报告的查找和分类。

本发明实施例提供的一种智能报告生成方法,将关键字加入至会谈报告中之后,还可以包括:

将会谈报告保存为模板,供调取该模板作为会谈报告模板进行使用。

将会谈报告保存为模板,系统本身也可以保存有一个或者多个常见标准的模板,从而在需要生成会谈报告时调用任一保存的模板,智能进行内容充足,快速形成新的报告。其中保存的会谈报告的模板仅包括该会谈报告的格式,如排版、目录结构等,不包括会谈文本等实质内容,以在模板的放入其他内容形成新的会谈报告。

另外还可以接收并保存外界输入的笔记或者文本,从而在需要插入内容至会谈文本的时候,可以供外界由保存的笔记或文本中选取对应内容以实现插入。

本申请支持用户导入笔记或文本,作为生成报告的候选材料,系统根据已经存储的模板中目录结构和候选材料目录结构、模板中段落和候选材料中段落的相似度,建立模板中目录和候选材料中目录、模板中段落及候选材料中段落之间的对应关系,以将候选材料的目录及段落均加入至模板中对应的位置处,从而自动进行报告生成,智能调整版式。

本发明实施例还提供了一种智能报告生成系统,如图2所示,可以包括:

录音模块11,用于:在外界的会谈过程中进行录音得到对应的会谈语音;

解析模块12,用于:对会谈语音进行文本解析得到对应的会谈文本;

报告生成模块13,用于:获取报告名称,得到名称为报告名称、内容包括会谈文本的会谈报告。

本发明实施例提供的一种智能报告生成系统,还可以包括:

修正模块,用于:得到会谈文本之后,得到会谈报告之前,将会谈语音及会谈文本以预设时间间隔为单位划分为多份子会谈语音及子会谈文本,使用众包的方式利用人工基于所述子会谈语音对对应子会谈文本进行修正,并将修正后的子会谈文本组合得到修正后的会谈文本。

本发明实施例提供的一种智能报告生成系统,还可以包括:

学习模块,用于:得到修正后的会谈文本之后,以会谈语音及修正后的会谈文本作为训练语料对实现会谈语音解析的模型进行增量学习,以利用进行增量学习后的模型实现会谈语音的解析。

本发明实施例提供的一种智能报告生成系统,还可以包括:

插入模块,用于:得到会谈文本之后,得到会谈报告之前,将会谈文本导入至可编辑区域;确定数据库预先存储的信息中与会谈文本具有关联的关联信息,并在外界触发下将外界由关联信息中选取的内容插入至会谈文本中。

本发明实施例提供的一种智能报告生成系统,插入模块可以包括:

匹配单元,用于:对会谈文本进行实体、属性及事件识别,得到包含有该会谈文本的实体、属性及事件的实体元组;将实体元组构造成子图输入至数据库预先存储的知识图谱中进行子图匹配,如果匹配得到的相似度大于预设相似度阈值,则确定匹配成功,并对知识图谱中匹配成功的信息作为关联信息按照相似度由大到小进行排序及显示。

本发明实施例提供的一种智能报告生成系统,匹配单元可以包括:

显示子单元,用于:使用浮动弹框形式对知识图谱中匹配成功的信息进行显示。

本发明实施例提供的一种智能报告生成系统,还可以包括:

记录模块,用于:在外界触发下将外界由关联信息中选取的内容插入至会谈文本中之后,将会谈文本与外界选取的内容之间的子图匹配模式、会谈文本及外界选取的内容记录至记录集。

本发明实施例提供的一种智能报告生成系统,还可以包括:

编辑模块,用于:得到名称为报告名称、内容包括会谈文本的会谈报告之后,在外界触发下对会谈报告包括的内容进行文本编辑处理;

关键字提取模块,用于:得到名称为报告名称、内容包括会谈文本的会谈报告之后,基于对会谈报告的表示学习结合主题模型生成对应的关键字,并将该关键字加入至会谈报告中。

本发明实施例提供的一种智能报告生成系统,还可以包括:

保存模块,用于:将关键字加入至会谈报告中之后,将会谈报告保存为模板,供调取该模板作为会谈报告模板进行使用。

本发明实施例还提供了一种智能报告生成设备,可以包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如上任一项所述智能报告生成方法的步骤。

本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时可以实现如上任一项所述智能报告生成方法的步骤。

本发明实施例提供的一种智能报告生成系统、设备及计算机可读存储介质中相关部分的说明请参见本发明实施例提供的一种智能报告生成方法中对应部分的详细说明,在此不再赘述。另外本发明实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。

对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1