本发明涉及计算机技术领域,特别涉及一种电子装置、访谈辅助方法和计算机可读存储介质。
背景技术:
稽核是指对公司有关业务数据(例如,报表、凭证、业务单据、业务对象、操作日志等)、企业流程运作等进行审核、复查。在稽核过程中,稽核人员往往需要与相关人员进行访谈,该访谈以稽核人员提问,受访者回答的方式进行,稽核人员通过受访者回答问题的内容确认相关数据及事件的真伪。
目前访谈过程中对访谈问题的选择依赖于稽核人员的经验完成,且由于稽核人员的经验难以量化和传导,对于经验较为欠缺的稽核人员,则难以保障访谈的完成质量。因此,如何在访谈过程中为经验欠缺的稽核人员提供辅助成为一个亟待解决的问题。
技术实现要素:
本发明的主要目的是提供一种电子装置、访谈辅助方法和计算机可读存储介质,旨在解决如何在访谈过程中为经验欠缺的稽核人员提供辅助的问题。
为实现上述目的,本发明提出一种电子装置,所述电子装置包括存储器和处理器,所述存储器上存储有访谈辅助程序,所述访谈辅助程序被所述处理器执行时实现如下步骤:
第一获取步骤:在接收到访谈开始请求后,实时或定时获取用户输入的问答对,所述问答对包括问题文本及对应的答案文本;
推送步骤:根据获取的所述问答对,于预先建立的问答库中查询所述问答对对应的关联信息,当在所述问答库中查询到所述问答对对应的关联信息时,根据预先确定的推送规则,从所述关联信息对应的所有关联问题文本中选择第一预设数量的关联问题文本推送给用户。
优选地,所述问答库中预先存储有多个问答对,每一个所述问答对均包括有问题文本和答案文本,且各问答对的问题文本携带有预先设置的权重值信息;
所述推送步骤包括:
判断所述问答库中是否存在与用户所输入问答对中的问题文本之间语义相似度大于或等于预设相似度阈值的若干个问题文本,当存在时,查询所述若干个问题文本对应的所有答案文本;
判断查询到的所有答案文本中是否存在与获取的所述问答对中答案文本之间语义相似度大于或等于预设相似度阈值的若干个答案文本;
当存在时,查询所述若干个答案文本所属问答对的关联信息,当查询到时,获取查询到的所有所述关联信息对应的所有关联问题文本,根据各个所述关联问题文本的权重值信息,按照权重值由大到小的顺序选择第一预设数量的关联问题文本推送给用户。
优选地,所述处理器执行所述访谈辅助程序,在所述推送步骤之后,还实现如下步骤:
第二获取步骤:在接收到访谈结束请求后,获取用户输入的访谈记录,所述访谈记录包括问答对序列,所述问答对序列包括多个按顺序排列的问答对;
提取步骤:从所述访谈记录中提取出所述问答对序列,按照预先确定的关联规则,确定至少一个所述问答对的关联问题文本,并生成所述问答对的关联信息;
存储步骤:将所述问答对序列中的问答对及生成的所述关联信息存储至所述问答库中。
优选地,所述预先确定的关联规则包括:
将所述问答对序列中两相邻的问答对作为一问答对组;
在获取所述问答对序列中所有问答对组后,将各个所述问答对组中排序在后的问答对中的问题文本确定为排序在前的问答对的关联问题文本。
优选地,所述处理器执行所述访谈辅助程序,在所述存储步骤之后,还实现以下步骤:
实时或定时,或接收到更新请求时,判断所述问答库中是否存在一组或多组相同的问题文本,当存在时,分别在各组相同的问题文本中选择一个问题文本作为保留问题文本,每当确定一组相同的问题文本对应的保留问题文本时,将该组相同的问题文本对应的答案文本作为所述保留问题文本的答案文本,重新设置所述保留问题文本的权重值信息,并将除所述保留问题文本之外的其他相同的问题文本进行删除;
确定所述问答库中所有问题文本之间的语义相似度,并判断所述问答库中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个问题文本,当存在时,将相互之间语义相似度大于或等于预设相似度阈值的多个问题文本组成问题文本组,并将所述问题文本组中所有所述问题文本对应的答案文本作为该问题文本组对应的答案文本。
此外,为实现上述目的,本发明还提出一种访谈辅助方法,该方法包括步骤:
第一获取步骤:在接收到访谈开始请求后,实时或定时获取用户输入的问答对,所述问答对包括问题文本及其对应的答案文本;
推送步骤:根据获取的所述问答对,于预先建立的问答库中查询所述问答对对应的关联信息,当在所述问答库中查询到所述问答对对应的关联信息时,根据预先确定的推送规则,从所述关联信息对应的所有关联问题文本中选择第一预设数量的关联问题文本推送给用户。
优选地,所述问答库中预先存储有多个问答对,每一个所述问答对均包括有问题文本和答案文本,且各问答对的问题文本携带有预先设置的权重值信息;
所述推送步骤包括:
判断所述问答库中是否存在与用户所输入问答对中的问题文本之间语义相似度大于或等于预设相似度阈值的若干个问题文本,当存在时,查询所述若干个问题文本对应的所有答案文本;
判断查询到的所有答案文本中是否存在与获取的所述问答对中答案文本之间语义相似度大于或等于预设相似度阈值的若干个答案文本;
当存在时,查询所述若干个答案文本所属问答对的关联信息,当查询到时,获取查询到的所有所述关联信息对应的所有关联问题文本,根据各个所述关联问题文本的权重值信息,按照权重值由大到小的顺序选择第一预设数量的关联问题文本推送给用户。
优选地,在所述推送步骤之后,该方法还包括:
第二获取步骤:在接收到访谈结束请求后,获取用户输入的访谈记录,所述访谈记录包括问答对序列,所述问答对序列包括多个按顺序排列的问答对;
提取步骤:从所述访谈记录中提取出所述问答对序列,按照预先确定的关联规则,确定至少一个所述问答对的关联问题文本,并生成所述问答对的关联信息;
存储步骤:将所述问答对序列中的问答对及生成的所述关联信息存储至所述问答库中。
优选地,在所述存储步骤之后,该方法还包括:
实时或定时,或接收到更新请求时,判断所述问答库中是否存在一组或多组相同的问题文本,当存在时,分别在各组相同的问题文本中选择一个问题文本作为保留问题文本,每当确定一组相同的问题文本对应的保留问题文本时,将该组相同的问题文本对应的答案文本作为所述保留问题文本的答案文本,重新设置所述保留问题文本的权重值信息,并将除所述保留问题文本之外的其他相同的问题文本进行删除;
确定所述问答库中所有问题文本之间的语义相似度,并判断所述问答库中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个问题文本,当存在时,将相互之间语义相似度大于或等于预设相似度阈值的多个问题文本组成问题文本组,并将所述问题文本组中所有所述问题文本对应的答案文本作为该问题文本组对应的答案文本。
此外,为实现上述目的,本发明还提出一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有访谈辅助程序,所述访谈辅助程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述任一项所述的访谈辅助方法的步骤。
本发明实时或定时获取用户输入的问答对;根据获取的所述问答对,于预先建立的问答库中查询所述问答对对应的关联信息,当查询到时,根据预先确定的推送规则,从关联信息对应的所有关联问题文本中选择第一预设数量的关联问题文本推送给用户。相较于现有技术,本发明在访谈过程中,根据用户输入的问答对,可为用户推送问题,稽核人员可参照推送的问题进行提问,因此,本发明可在访谈过程中为经验欠缺的稽核人员提供良好的辅助。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明访谈辅助程序第一、第二、第三实施例的运行环境示意图;
图2为本发明访谈辅助程序第一实施例的程序模块图;
图3为图2中推送模块的细化程序模块图;
图4为本发明访谈辅助程序第二实施例的程序模块图;
图5为本发明访谈辅助程序第三实施例的程序模块图;
图6为本发明访谈辅助方法第一实施例的流程示意图;
图7为图6中步骤s20的细化流程示意图;
图8为本发明访谈辅助方法第二实施例的流程示意图;
图9为本发明访谈辅助方法第三实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
本发明提出一种访谈辅助程序。
请参阅图1,是本发明访谈辅助程序10第一、第二、第三实施例的运行环境示意图。
在本实施例中,访谈辅助程序10安装并运行于电子装置1中。电子装置1可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该电子装置1可包括,但不仅限于,存储器11、处理器12及显示器13。图1仅示出了具有组件11-13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
存储器11在一些实施例中可以是电子装置1的内部存储单元,例如该电子装置1的硬盘或内存。存储器11在另一些实施例中也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器11还可以既包括电子装置1的内部存储单元也包括外部存储设备。存储器11用于存储安装于电子装置1的应用软件及各类数据,例如访谈辅助程序10的程序代码等。存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行访谈辅助程序10等。
显示器13在一些实施例中可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。显示器13用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。电子装置1的部件11-13通过程序总线相互通信。
请参阅图2,是本发明访谈辅助程序10第一实施例的程序模块图。在本实施例中,访谈辅助程序10可以被分割成一个或多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行,以完成本发明。例如,在图2中,访谈辅助程序10可以被分割成第一获取模块101及推送模块102。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述访谈辅助程序10在电子装置1中的执行过程,其中:
第一获取模块101,用于在接收到访谈开始请求后,实时或定时获取用户输入的问答对。
其中,所述问答对包括问题文本及对应的答案文本。
具体地,在接收到访谈开始请求后,第一获取模块101实时或定时获取提问者输入的语音数据,将获取的所述语音数据转换为问题文本,实时或定时获取受访者输入的语音数据,并将获取的所述语音数据转换为答案文本。或者,在接收到访谈开始请求后,实时或定时获取提问者输入的问题文本,且实时或定时获取受访者输入的答案文本。
优选地,本实施例中,该程序还用于:
根据预先确定的选择规则从预先建立的问答库中选取出第二预设数量的第一类问题文本及第三预设数量的第二类问题文本,并根据所述第二预设数量的第一类问题文本及第三预设数量的第二类问题文本,生成访谈问题列表。
具体地,上述问答库中的问题文本携带有类别信息,所述类别信息用于标识所述问题文本的类别,所述问题文本的类别包括第一类问题文本及第二类问题文本。
第一类问题文本为与访谈目的无关的问题文本,例如,“请问你是哪所大学毕业的?”、“请问你的年龄多大?”等,第二类问题文本为与访谈目的相关的问题文本,例如,“你手头负责的工作有哪些?”、“业务费用报销都是你负责的吗?”等。
在一些应用场景中,还将第二类问题文本进一步划分成多个子类问题文本,并根据子类的划分结果生成多个问题文本关系树。各个问题文本关系树的主干按照机构划分(例如,机构a、机构b、机构c等)。主分支按照多个一级子类划分,例如,财务、业务、人事行政等。子分支按照多个二级子类划分,例如,一级子类财务进一步划分为两个二级子类,分别为财务风险a及财务风险b,叶子则是各个问题文本关系树的最末层。其中,一级子类问题文本和二级子类问题文本通常是通用问题文本,例如,“请简单介绍你在公司的工作履历。”、“你手头负责工作主要有哪些?”等,而叶子部分则设置细分问题文本,例如,“业务费用报销都是你负责吗?”、“是否可以提供银行流水供我们核实费用去向?”等。
此外,上述预先确定的选择规则包括:
从所述问答库中随机选取第二预设数量的第一类问题文本,或者,根据问答库中各第一类问题文本的权重值信息,按照权重值从大到小的顺序选取第二预设数量的第一类问题文本。
从所述问答库中个随机选取第三预设数量的第二类问题文本,或者,根据问答库中各第二类问题文本的权重值信息,按照权重值从大到小的顺序选取第三预设数量的第二类问题文本。
需要注意的是,本实施例可按照上述选择规则先选择出第一类问题文本,再选择出第二类问题文本,也可以按照上述选择规则先选择出第二类问题文本,再选择出第一类问题文本,本发明对此不作限定。
此外,上述第二预设数量及第三预设数量可由用户在用户交互界面中设置,也可以根据默认值设置。在一些应用场景中,若第二类问题文本被进一步划分成多个子类问题文本,则还需设置各子类问题文本对应的选取数量。
上述权重值信息可根据用户的需要设置,也可按照预设规则进行设置,例如,根据该问题文本对应的问题被提问者提出的次数设置,被提出次数越多,其权重值越大,被提出次数越少,其权重值越小。
推送模块102,用于根据获取的所述问答对,于预先建立的问答库中查询所述问答对对应的关联信息,当查询到所述问答对对应的关联信息时,根据预先确定的推送规则,从所述关联信息对应的所有关联问题文本中选择第一预设数量的关联问题文本推送给用户(例如,提问者)。
上述问答对的关联信息包括该问答对对应的关联问题文本的标识信息。
本实施例实时或定时获取用户输入的问答对;根据获取的所述问答对,于预先建立的问答库中查询所述问答对对应的关联信息,当查询到时,根据预先确定的推送规则,从关联信息对应的所有关联问题文本中选择第一预设数量的关联问题文本推送给用户。相较于现有技术,本实施例在访谈过程中,根据用户输入的问答对,可为用户推送问题,稽核人员可参照推送的问题进行提问,因此,本实施例可在访谈过程中为经验欠缺的稽核人员提供良好的辅助。
进一步地,参照图3,本实施例中,所述问答库中预先存储有多个问答对,每一个所述问答对均包括有问题文本和答案文本,且各问答对的问题文本携带有预先设置的权重值信息。
上述推送模块102包括判断单元1021、第一查询单元1022、第二查询单元1023。
判断单元1021,用于判断所述问答库中是否存在与用户所输入问答对中的问题文本之间语义相似度大于或等于预设相似度阈值的若干个问题文本,当存在时,调用第一查询单元1022,当不存在时,不执行推送。
第一查询单元1022,用于查询所述若干个问题文本对应的所有答案文本,判断查询到的所有答案文本中是否存在与获取的所述问答对中答案文本之间语义相似度大于或等于预设相似度阈值的若干个答案文本,当存在时,调用第二判断单元1023,当不存在时,不执行推送。
第二查询单元1023,用于查询所述若干个答案文本所属问答对的关联信息,当查询到时,获取查询到的所有关联信息对应的所有关联问题文本,根据各个所述关联问题文本的权重值信息,按照权重值由大到小的顺序选择第一预设数量的关联问题文本推送给用户。
本实施例中,由于权重值根据问题文本被提出的次数设置,因此,可为用户推送被提出频次较高的关联问题,由于这些关联问题在历史上的多次访谈中被提出频次较高,因此,这些关联问题应当与当前获取的问答对存在更为紧密的逻辑关系,此时推送该关联问题,可为经验较为欠缺的稽核人员提供更为准确的指导。
参照图4,图4为本发明访谈辅助程序10第二实施例的程序模块图。
本实施例在第一实施例的基础上,该程序还包括第二获取模块103、提取模块104、存储模块105。
第二获取模块103,用于在接收到访谈结束请求后,获取用户输入的访谈记录,所述访谈记录包括问答对序列,所述问答对序列包括多个按顺序排列的问答对。
提取模块104,用于从所述访谈记录中提取出所述问答对序列,按照预先确定的关联规则,确定至少一个问答对的关联问题文本,并生成所述问答对的关联信息。
优选地,本实施例中,所述预先确定的关联规则包括:
首先,将所述问答对序列中两相邻的问答对作为一问答对组。
然后,在获取所述问答对序列中所有问答对组后,将各个所述问答对组中排序在后的问答对中的问题文本确定为排序在前的问答对的关联问题文本。
在访谈过程中,一问答对组中排序在后的问答对中的问题通常是提问者针对排序在前的问答对中的答案提出的,因此,将该排序在后的问答对中的问题作为排序在前的问答对的关联问题,使得程序在向提问者推送关联问题时,可模拟提问者的思维实现更为精准的推送。
存储模块105,用于将所述问答对序列中的问答对及生成的所述关联信息存储至所述问答库中。
本实施例在访谈结束后,根据用户输入的访谈记录,将该访谈记录中的问答对及其关联信息存储至问答库中,确保问答库中存储的关联信息得到及时的更新,提高了后续关联问题文本推送的精确度。
参照图5,图5为本发明访谈辅助程序10第三实施例的程序模块图。
本实施例在第一、第二实施例的基础上,该程序还包括第一判断模块106、删除模块107、第二判断模块108、确定模块109。
第一判断模块106,用于实时或定时,或接收到更新请求时,判断所述问答库中是否存在一组或多组相同的问题文本,当存在时,调用删除模块107,当不存在时,结束执行。
删除模块107,用于分别在各组相同的问题文本中选择一个问题文本作为保留问题文本,每当确定一组相同的问题文本对应的保留问题文本时,将该组相同的问题文本对应的答案文本作为所述保留问题文本的答案文本,重新设置所述保留问题文本的权重值信息,并将除所述保留问题文本之外的其他相同的问题文本进行删除。
上述分别在各组相同的问题文本中选择一个问题文本作为保留问题文本的步骤包括:
分别在各组相同的问题文本中随机选择一个问题文本作为保留问题文本,或者,分别在各组相同的问题文本中选择权重值最大的一个问题文本作为保留问题文本。
上述重新设置所述保留问题文本的权重值信息的步骤包括:
将各相同的问题文本对应的权重值进行加和计算,将该计算结果作为该组相同的问题文本对应的保留问题文本的权重值。
第二判断模块108,用于确定所述问答库中所有问题文本之间的语义相似度,并判断所述问答库中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个问题文本,当存在时,调用确定模块109,当不存在时,停止执行。
上述语义相似度可通过预先建立的语义相似度模型计算得到,该语义相似度模型计算语义相似度的方法有很多,例如基于向量空间模型的计算方法,该方法将文本转换成向量,通过内积法、余弦法等计算向量之间的相似度。又例如基于汉明距离的计算方法,该方法通过计算两文本之间的汉明距离来计算两文本的相似度。还例如基于语义理解的计算方法,该方法基于一个具有层次结构关系的语义磁链,依据概念之间的上下位关系或同义关系进行两文本的相似度计算。
确定模块109,用于将相互之间语义相似度大于或等于预设相似度阈值的多个问题文本组成问题文本组,并将所述问题文本组中所有问题文本对应的答案文本作为该问题文本组对应的答案文本。
上述确定模块109还用于重新设置问题文本组中各问题文本的权重信息,具体地,将问题文本组中各问题文本的权重值进行加和计算,将该计算结果作为该问题文本组中各问题文本的新的权重值。
进一步地,本实施例中,该程序还用于:
首先,分别判断各所述问题文本组或除所述问题文本组以外的其他各问题文本对应的答案文本中是否存在一组或多组相同的答案文本,当存在时,分别在各组相同的答案文本中选择一答案文本作为保留答案文本,每当确定一组相同的答案文本对应的保留答案文本时,重新生成所述保留答案文本的权重值信息及所述保留答案文本所属的问答对对应的关联信息(例如,将一组相同的答案文本中各答案文本所属的问答对对应的关联信息进行合并,将合并后的关联信息作为该组相同的答案文本对应的保留答案文本所属的问答对对应的关联信息),并将除所述保留答案文本之外的其他相同的答案文本进行删除。
然后,分别判断各所述问题文本组或除所述问题文本组以外的其他各问题文本对应的答案文本中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个答案文本,当存在时,将相互之间语义相似度大于或等于预设相似度阈值的多个答案文本组成答案文本组。
进一步地,本实施例中,该程序还用于:将问题文本组合答案文本组保存至问答库中的复述库中。
进一步地,本实施例中,该程序还包括问答库建立模块(图中未示出)。
所述问答库的建立模块用于:
首先,从历史访谈数据中提取多个问答对,按照上述关联规则,确定至少一个问答对的关联问题文本,并生成该问答对的关联信息,将该多个问答对及生成的关联信息存储至问答库中。
然后,分别将提取的多个问答进行拆分,得到该多个问答对对应的问题文本集合和答案文本集合。由于在拆分过程中,一些问题文本(例如,“请简单介绍你在公司的工作履历。”)中未出现问号,因此,在初步拆分过程中,将其确定为答案文本,因此,需要通过后续步骤进行进一步地确定。
接着,判断答案文本集合中是否存在与问题文本集合中的问题文本之间的语义相似度大于或等于预设相似度阈值的一个或多个答案文本,若存在,则将该一个或多个答案文本重新标注为问题文本并添加至问题文本集合中。
接着,判断问题文本集合中是否存在一组或多组相同的问题文本,当存在时,分别在各组相同的问题文本中选择一个问题文本作为保留问题文本,每当确定一组相同的问题文本对应的保留问题文本时,将该组相同的问题文本对应的答案文本作为所述保留问题文本的答案文本,重新设置所述保留问题文本的权重值信息,并将除所述保留问题文本之外的其他相同的问题文本进行删除。
接着,判断所述问题文本集合中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个问题文本,当存在时,将相互之间语义相似度大于或等于预设相似度阈值的多个问题文本组成问题文本组,并将所述问题文本组中所有问题文本对应的答案文本作为该问题文本组对应的答案文本。
接着,分别判断各问题文本组或除所述问题文本组以外的其他各问题文本对应的答案文本中是否存在一组或多组相同的答案文本,当存在时,分别在各组相同的答案文本中选择一答案文本作为保留答案文本,每当确定一组相同的答案文本对应的保留答案文本时,重新生成所述保留答案文本的权重值信息及所述保留答案文本所属的问答对对应的关联信息,并将除所述保留答案文本之外的其他相同的答案文本进行删除。
接着,分别判断各所述问题文本组或除所述问题文本组以外的其他各问题文本对应的答案文本中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个答案文本,当存在时,将相互之间语义相似度大于或等于预设相似度阈值的多个答案文本组成答案文本组。
最后,判断问答库中问题文本组的数量及答案文本组的数量是否满足预设条件,若是,则停止执行,若否,则重复上述步骤直至问答库中问题文本组的数量及答案文本组的数量满足预设条件。
上述预设条件可以是问答库中问题文本组的数量和/或答案文本组的数量大于或等于预设文本组数量。
此外,本发明提出一种访谈辅助方法。
如图6所示,图6为本发明访谈辅助方法第一实施例的流程示意图。
本实施例中,该方法包括:
步骤s10,在接收到访谈开始请求后,实时或定时获取用户输入的问答对。
其中,所述问答对包括问题文本及对应的答案文本。
具体地,在接收到访谈开始请求后,实时或定时获取提问者输入的语音数据,将获取的所述语音数据转换为问题文本,实时或定时获取受访者输入的语音数据,并将获取的所述语音数据转换为答案文本。或者,在接收到访谈开始请求后,实时或定时获取提问者输入的问题文本,且实时或定时获取受访者输入的答案文本。
优选地,本实施例中,在步骤s10之前,该方法还包括:
根据预先确定的选择规则从预先建立的问答库中选取出第二预设数量的第一类问题文本及第三预设数量的第二类问题文本,并根据所述第二预设数量的第一类问题文本及第三预设数量的第二类问题文本,生成访谈问题列表。
具体地,上述问答库中的问题文本携带有类别信息,所述类别信息用于标识所述问题文本的类别,所述问题文本的类别包括第一类问题文本及第二类问题文本。
第一类问题文本为与访谈目的无关的问题文本,例如,“请问你是哪所大学毕业的?”、“请问你的年龄多大?”等,第二类问题文本为与访谈目的相关的问题文本,例如,“你手头负责的工作有哪些?”、“业务费用报销都是你负责的吗?”等。
在一些应用场景中,还将第二类问题文本进一步划分成多个子类问题文本,并根据子类的划分结果生成多个问题文本关系树。各个问题文本关系树的主干按照机构划分(例如,机构a、机构b、机构c等)。主分支按照多个一级子类划分,例如,财务、业务、人事行政等。子分支按照多个二级子类划分,例如,一级子类财务进一步划分为两个二级子类,分别为财务风险a及财务风险b,叶子则是各个问题文本关系树的最末层。其中,一级子类问题文本和二级子类问题文本通常是通用问题文本,例如,“请简单介绍你在公司的工作履历。”、“你手头负责工作主要有哪些?”等,而叶子部分则设置细分问题文本,例如,“业务费用报销都是你负责吗?”、“是否可以提供银行流水供我们核实费用去向?”等。
此外,上述预先确定的选择规则包括:
从所述问答库中随机选取第二预设数量的第一类问题文本,或者,根据问答库中各第一类问题文本的权重值信息,按照权重值从大到小的顺序选取第二预设数量的第一类问题文本。
从所述问答库中个随机选取第三预设数量的第二类问题文本,或者,根据问答库中各第二类问题文本的权重值信息,按照权重值从大到小的顺序选取第三预设数量的第二类问题文本。
需要注意的是,本实施例可按照上述选择规则先选择出第一类问题文本,再选择出第二类问题文本,也可以按照上述选择规则先选择出第二类问题文本,再选择出第一类问题文本,本发明对此不作限定。
此外,上述第二预设数量及第三预设数量可由用户在用户交互界面中设置,也可以根据默认值设置。在一些应用场景中,若第二类问题文本被进一步划分成多个子类问题文本,则还需设置各子类问题文本对应的选取数量。
上述权重值信息可根据用户的需要设置,也可按照预设规则进行设置,例如,根据该问题文本对应的问题被提问者提出的次数设置,被提出次数越多,其权重值越大,被提出次数越少,其权重值越小。
步骤s20,根据获取的所述问答对,于预先建立的问答库中查询所述问答对对应的关联信息,当查询到所述问答对对应的关联信息时,根据预先确定的推送规则,从所述关联信息对应的所有关联问题文本中选择第一预设数量的关联问题文本推送给用户(例如,提问者)。
上述问答对的关联信息包括该问答对对应的关联问题文本的标识信息。
本实施例实时或定时获取用户输入的问答对;根据获取的所述问答对,于预先建立的问答库中查询所述问答对对应的关联信息,当查询到时,根据预先确定的推送规则,从关联信息对应的所有关联问题文本中选择第一预设数量的关联问题文本推送给用户。相较于现有技术,本实施例在访谈过程中,根据用户输入的问答对,可为用户推送问题,稽核人员可参照推送的问题进行提问,因此,本实施例可在访谈过程中为经验欠缺的稽核人员提供良好的辅助。
进一步地,参照图7,本实施例中,所述问答库中预先存储有多个问答对,每一个所述问答对均包括有问题文本和答案文本,且各问答对的问题文本携带有预先设置的权重值信息,所述步骤s20包括:
步骤s21,判断所述问答库中是否存在与获取的所述问答对中问题文本之间语义相似度大于或等于预设相似度阈值的若干个问题文本,当存在时,转入步骤s22,当不存在时,转入步骤s26。
步骤s22,查询所述若干个问题文本对应的所有答案文本。
步骤s23,判断查询到的所有答案文本中是否存在与获取的所述问答对中答案文本之间语义相似度大于或等于预设相似度阈值的若干个答案文本,当存在时,转入步骤s24,当不存在时,转入步骤s26。
步骤s24,查询是否存在所述若干个答案文本所属问答对的关联信息,当查询到时,转入步骤s25,当未查询到时,转入步骤s26。
步骤s25,获取查询到的所有关联信息对应的所有关联问题文本,根据各个所述关联问题文本的权重值信息,按照权重值由大到小的顺序选择第一预设数量的关联问题文本进行推送。
步骤s26,不执行推送。
本实施例中,由于权重值根据问题文本对应的问题被提出的次数设置,因此,可为用户推送被提出频次较高的关联问题,由于这些关联问题在历史上的多次访谈中被提出频次较高,因此,这些关联问题应当与当前获取的问答对存在更为紧密的逻辑关系,此时推送该关联问题,可为经验较为欠缺的稽核人员提供更为准确的指导。
参照图8,图8为本发明访谈辅助方法第二实施例的流程示意图。
本实施例在第一实施例的基础上,该方法还包括如下步骤:
步骤s30,在接收到访谈结束请求后,获取用户输入的访谈记录。
所述访谈记录包括问答对序列,所述问答对序列包括多个按顺序排列的问答对。
步骤s40,从所述访谈记录中提取出所述问答对序列,按照预先确定的关联规则,确定至少一个问答对的关联问题文本,并生成所述问答对的关联信息。
优选地,本实施例中,所述预先确定的关联规则包括:
首先,将所述问答对序列中两相邻的问答对作为一问答对组。
然后,在获取所述问答对序列中所有问答对组后,将各个所述问答对组中排序在后的问答对中的问题文本确定为排序在前的问答对的关联问题文本。
在访谈过程中,一问答对组中排序在后的问答对中的问题通常是提问者针对排序在前的问答对中的答案提出的,因此,将该排序在后的问答对中的问题作为排序在前的问答对的关联问题,使得程序在向提问者推送关联问题时,可模拟提问者的思维实现更为精准的推送。
步骤s50,将所述问答对序列中的问答对及生成的所述关联信息存储至所述问答库中。
本实施例在访谈结束后,根据用户输入的访谈记录,将该访谈记录中的问答对及其关联信息存储至问答库中,确保问答库中存储的关联信息得到及时的更新,提高了后续关联问题文本推送的精确度。
参照图8,图8为本发明访谈辅助方法第三实施例的流程示意图。
本实施例在第一、第二实施例的基础上,在步骤s50之后,该方法还包括:
步骤s60,实时或定时,或接收到更新请求时,判断所述问答库中是否存在一组或多组相同的问题文本,当存在时,转入步骤s70,当不存在时,转入步骤s100。
步骤s70,分别在各组相同的问题文本中选择一个问题文本作为保留问题文本,每当确定一组相同的问题文本对应的保留问题文本时,将该组相同的问题文本对应的答案文本作为所述保留问题文本的答案文本,重新设置所述保留问题文本的权重值信息,并将除所述保留问题文本之外的其他相同的问题文本进行删除。
上述分别在各组相同的问题文本中选择一个问题文本作为保留问题文本的步骤包括:
分别在各组相同的问题文本中随机选择一个问题文本作为保留问题文本,或者,分别在各组相同的问题文本中选择权重值最大的一个问题文本作为保留问题文本。
上述重新设置所述保留问题文本的权重值信息的步骤包括:
将各相同的问题文本对应的权重值进行加和计算,将该计算结果作为该组相同的问题文本对应的保留问题文本的权重值。
步骤s80,确定所述问答库中所有问题文本之间的语义相似度,并判断所述问答库中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个问题文本,当存在时,转入步骤s90,当不存在时,转入步骤s100。
上述语义相似度可通过预先建立的语义相似度模型计算得到,该语义相似度模型计算语义相似度的方法有很多,例如基于向量空间模型的计算方法,该方法将文本转换成向量,通过内积法、余弦法等计算向量之间的相似度。又例如基于汉明距离的计算方法,该方法通过计算两文本之间的汉明距离来计算两文本的相似度。还例如基于语义理解的计算方法,该方法基于一个具有层次结构关系的语义磁链,依据概念之间的上下位关系或同义关系进行两文本的相似度计算。
步骤s90,将相互之间语义相似度大于或等于预设相似度阈值的多个问题文本组成问题文本组,并将所述问题文本组中所有问题文本对应的答案文本作为该问题文本组对应的答案文本。同时,还可重新设置问题文本组中各问题文本的权重信息,具体地,将问题文本组中各问题文本的权重值进行加和计算,将该计算结果作为该问题文本组中各问题文本的新的权重值。
步骤s100,结束执行。
进一步地,本实施例中,在步骤s90之后,该方法还包括:
首先,分别判断各所述问题文本组或除所述问题文本组以外的其他各问题文本对应的答案文本中是否存在一组或多组相同的答案文本,当存在时,分别在各组相同的答案文本中选择一答案文本作为保留答案文本,每当确定一组相同的答案文本对应的保留答案文本时,重新生成所述保留答案文本的权重值信息及所述保留答案文本所属的问答对对应的关联信息(例如,将一组相同的答案文本中各答案文本所属的问答对对应的关联信息进行合并,将合并后的关联信息作为该组相同的答案文本对应的保留答案文本所属的问答对对应的关联信息),并将除所述保留答案文本之外的其他相同的答案文本进行删除。
然后,分别判断各所述问题文本组或除所述问题文本组以外的其他各问题文本对应的答案文本中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个答案文本,当存在时,将相互之间语义相似度大于或等于预设相似度阈值的多个答案文本组成答案文本组。
进一步地,本实施例中,该方法还包括:将问题文本组合答案文本组保存至问答库中的复述库中。
进一步地,本实施例中,在所述步骤s10之前,该方法还包括:建立问答库。
所述建立问答库的步骤包括:
首先,从历史访谈数据中提取多个问答对,按照上述关联规则,确定至少一个问答对的关联问题文本,并生成该问答对的关联信息,将该多个问答对及生成的关联信息存储至问答库中。
然后,分别将提取的多个问答进行拆分,得到该多个问答对对应的问题文本集合和答案文本集合。由于在拆分过程中,一些问题文本(例如,“请简单介绍你在公司的工作履历。”)中未出现问号,因此,在初步拆分过程中,将其确定为答案文本,因此,需要通过后续步骤进行进一步地确定。
接着,判断答案文本集合中是否存在与问题文本集合中的问题文本之间的语义相似度大于或等于预设相似度阈值的一个或多个答案文本,若存在,则将该一个或多个答案文本重新标注为问题文本并添加至问题文本集合中。
接着,判断问题文本集合中是否存在一组或多组相同的问题文本,当存在时,分别在各组相同的问题文本中选择一个问题文本作为保留问题文本,每当确定一组相同的问题文本对应的保留问题文本时,将该组相同的问题文本对应的答案文本作为所述保留问题文本的答案文本,重新设置所述保留问题文本的权重值信息,并将除所述保留问题文本之外的其他相同的问题文本进行删除。
接着,判断所述问题文本集合中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个问题文本,当存在时,将相互之间语义相似度大于或等于预设相似度阈值的多个问题文本组成问题文本组,并将所述问题文本组中所有问题文本对应的答案文本作为该问题文本组对应的答案文本。
接着,分别判断各问题文本组或除所述问题文本组以外的其他各问题文本对应的答案文本中是否存在一组或多组相同的答案文本,当存在时,分别在各组相同的答案文本中选择一答案文本作为保留答案文本,每当确定一组相同的答案文本对应的保留答案文本时,重新生成所述保留答案文本的权重值信息及所述保留答案文本所属的问答对对应的关联信息,并将除所述保留答案文本之外的其他相同的答案文本进行删除。
接着,分别判断各所述问题文本组或除所述问题文本组以外的其他各问题文本对应的答案文本中是否存在相互之间语义相似度大于或等于预设相似度阈值的多个答案文本,当存在时,将相互之间语义相似度大于或等于预设相似度阈值的多个答案文本组成答案文本组。
最后,判断问答库中问题文本组的数量及答案文本组的数量是否满足预设条件,若是,则停止执行,若否,则重复上述步骤直至问答库中问题文本组的数量及答案文本组的数量满足预设条件。
上述预设条件可以是问答库中问题文本组的数量和/或答案文本组的数量大于或等于预设文本组数量。
进一步地,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有访谈辅助程序,所述访谈辅助程序可被至少一个处理器执行,以使所述至少一个处理器执行上述任一实施例中的访谈辅助方法的步骤。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。