文本信息发布方法、装置、可读存储介质和电子设备与流程

文档序号:20684657发布日期:2020-05-08 18:43阅读:155来源:国知局
文本信息发布方法、装置、可读存储介质和电子设备与流程

本发明涉及计算机技术领域,尤其涉及一种文本信息发布方法、装置、可读存储介质和电子设备。



背景技术:

随着互联网的迅速发展,人们可以获取信息的渠道越来越多,获取的信息数量越来越大,获取信息的速度也越来越快。因此,在瞬息万变的互联网环境下,对于针对各领域的新闻工作者来说,如何在短时间内获取到读者感兴趣的本领域信息,并根据其产出对应的新闻是一个问题。目前常规的做法是由人工通过对当前的信息进行筛选、整理、编辑后产出对应的新闻。这种方法生成这样的新闻需要耗费大量的人力成本,且时效性往往也得不到满足,同时通过人工获取的信息数量有限,以至于新闻内容的丰富度不够。



技术实现要素:

有鉴于此,本发明实施例公开了一种文本信息发布方法、装置、可读存储介质和电子设备,旨在快速、及时的自动生成各节点对应的文本信息,同时保证文本信息内容的实时性和丰富性。

第一方面,本发明实施例公开了一种文本信息发布方法,所述方法包括:

确定知识图谱,所述知识图谱中包括多个用于表征概念信息的节点;

从预设的数据源获取各节点对应的至少一个当前属性数据;

获取各节点对应的历史属性数据;

根据所述各节点对应的历史属性数据和当前属性数据确定各个节点的数据特征;

从预设的资讯源获取至少一个相关资讯信息,所述各相关资讯信息中包括至少一个与所述概念信息有对应关系的实体信息;

识别所述各相关资讯信息中的实体信息以确定所述各相关资讯信息与所述各节点的对应关系;

根据所述知识图谱中的各节点对应的所述相关资讯信息和所述数据特征自动生成待发布文本;

发布所述待发布文本。

进一步地,所述确定知识图谱包括:

确定多个用于表征概念信息的节点;

确定所述各概念信息之间的对应关系;

将每两个有对应关系的概念信息对应的节点连接在一起。

进一步地,所述从预设的数据源获取各节点对应的至少一个当前属性数据包括:

从预设的数据源获取各节点对应的数据信息;

从所述数据信息中提取当前属性数据。

进一步地,所述根据所述各节点对应的历史属性数据和当前属性数据确定各个节点的数据特征包括:

确定用于表征所述历史属性数据和当前属性数据差异的特征值;

根据所述特征值和预设规则确定所述节点对应的数据特征。

进一步地,所述从预设的资讯源获取至少一个相关资讯信息包括:

从预设的资讯源获取多个资讯信息;

对所述资讯信息进行筛选得到相关资讯信息。

进一步地,所述识别所述各相关资讯信息中的实体信息以确定所述各相关资讯信息与所述各节点的对应关系包括:

识别所述相关资讯信息中包括的实体信息:

根据所述各实体信息对应的概念信息确定所述相关资讯信息对应的节点。

进一步地,所述根据所述知识图谱中的各节点对应的交易资讯和数据特征生成待发布文本具体为:

将所述各节点对应的交易资讯和数据特征输入预设模板中得到对应的待发布文本。

第二方面,本发明实施例公开了一种文本信息发布装置,所述装置包括:

知识图谱确定模块,用于确定知识图谱,所述知识图谱中包括多个用于表征概念信息的节点;

当前数据确定模块,用于从预设的数据源获取各节点对应的至少一个当前属性数据;

历史数据确定模块,用于获取各节点对应的历史属性数据;

特征确定模块,用于根据所述各节点对应的历史属性数据和当前属性数据确定各个节点的数据特征;

资讯获取模块,用于从预设的资讯源获取至少一个相关资讯信息,所述各相关资讯信息中包括至少一个与所述概念信息有对应关系的实体信息;

实体识别模块,用于识别所述各相关资讯信息中的实体信息以确定所述各相关资讯信息与所述各节点的对应关系;

文本生成模块,用于根据所述知识图谱中的各节点对应的所述相关资讯信息和所述数据特征自动生成待发布文本;

文本发布模块,用于发布所述待发布文本。

第三方面,本发明实施例公开了一种计算机可读存储介质,用于存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面中任一项所述的方法。

第四方面,本发明实施例公开了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面中任一项所述的方法。

本发明实施例通过确定知识图谱,获取所述知识图谱中各节点对应的数据特征和相关资讯信息,最后基于所述各节点对应的数据特征和相关资讯信息生成对应的待发布文本信息并发布,可以快速、及时的自动生成各节点对应的文本信息,同时能够保证文本信息内容的实时性和丰富性。

附图说明

通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:

图1为本发明实施例的文本信息发布方法的流程图;

图2为本发明实施例的生成知识图谱的示意图;

图3为本发明实施例的文本信息发布方法的示意图;

图4为本发明实施例的文本信息发布装置的示意图;

图5为本发明实施例的电子设备的示意图。

具体实施方式

以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。

此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。

除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。

在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。

图1为本发明实施例的文本信息发布方法的流程图,如图1所示,所述文本信息发布方法包括:

步骤s100、确定知识图谱。

具体地,所述知识图谱中包括多个用于表征概念信息的节点。所述知识图谱在服务器中预先设定,或者由服务器通过客户端发送的知识图谱生成指令生成,所述知识图谱生成指令中包括至少一个概念信息。

因此,所述通过服务器自动生成知识图谱的方法确定知识图谱的过程可以包括:

步骤s110、确定多个用于表征概念信息的节点。

具体地,服务器接收客户端发送的知识图谱生成指令,并解析所述知识图谱生成指令的内容得到至少一个概念信息,将所述各概念信息确定为所述知识图谱中的一个节点。其中,所述概念信息用于表征某一领域的基本概念。例如,在金融领域,所述概念信息可以为外汇、信托、基金、股票、基准利率、拆借利率等。

步骤s120、确定所述各概念信息之间的对应关系。

具体地,所述各概念信息之间的对应关系可以包括因果关系、推理关系等。所述对应关系也可以通过客户端发送,即客户端发送的知识图谱生成指令中还包括各概念信息的对应关系。所述服务器在解析所述知识图谱生成指令的过程中即确定所述各概念信息之间的对应关系。所述各概念信息之间的对应关系还可以由所述服务器通过预先设定对应规则确定。仍以金融领域为例,基准利率的调整可以影响拆借利率的波动。因此,可以预先在服务器中设定基准利率和拆借利率之间的推理关系,当通过步骤s110确定的概念信息中包括基准利率和拆借利率时,确定所述基准利率和拆借利率的对应关系。

进一步地,还可以通过将步骤s110确定的每两个概念信息输入训练好的关联度模型中确定各概念信息的对应关系。例如,将每两个概念信息作为所述关联度模型的输入,将0-1之间的关联值作为所述关联度模型的输出,当输出的所述关联值大于预设的关联阈值时确定输入的两个概念信息之间有对应关系,当输出的所述关联值小于预设的关联阈值时确定输入的两个概念信息之间没有对应关系。

步骤s130、将每两个有对应关系的概念信息对应的节点连接在一起。

具体地,在通过步骤s120确定各概念信息的对应关系后,通过将每两个表征的概念信息对应的节点连接在一起,最终通过所述各节点和各节点之间的连接关系确定对应的知识图谱。可选的,所述知识图谱中的一个节点可以与一个或多个节点连接,同时还可以不与其他节点连接。进一步地,所述知识图谱在生成后可以进一步进行扩充、修改、删除等编辑。

图2为本发明实施例的生成知识图谱的示意图,如图2所示,所述生成知识图谱的过程需要先确定多个节点20,再确定所述各节点之间的对应关系,最后将每两个表征的概念信息对应的节点连接在一起得到知识图谱21。所述知识图谱21在生成后可以通过服务器发送到客户端显示,所述服务器还可以根据客户端发送的修改指令对所述知识图谱中的节点进行增加、删除、修改等操作。

步骤s200、从预设的数据源获取各节点对应的至少一个当前属性数据。

具体地,所述预设数据源可以根据需要预先设定,包括行业相关的官方数据发布、统计网站等。例如,在金融领域,所述预设数据源可以是中国外汇交易中心、中国期货市场监控中心等。

在本实施例中,所述获取各节点对应的当前属性数据包括:

步骤s210、从预设的数据源获取各节点对应的数据信息。

具体地,所述预设数据源中包括多个与所述各节点对应的数据信息。以预设的数据源为中国外汇交易中心为例进行说明,可以获取的数据信息包括人民币汇率中间价、贷款市场报价利率、人民币汇率指数、美元拆借加权成交利率、人民币外汇远调报价等多种数据信息。其中,所述数据信息中有与至少一个所述节点对应的数据信息,例如,所述美元拆解加权成交利率与节点:拆借利率对应;所述贷款市场报价利率与节点:报价利率对应等。同时,获取到的所述数据信息中还可以包括与所述各节点均无对应关系的内容。

步骤s220、从所述数据信息中提取当前属性数据。

具体地,所述获取当前属性数据的过程可以为周期性获取或实时获取。在获取所述当前属性数据的过程中,由于通过步骤s210获取的与各节点对应的数据信息数据源不同,所述各数据信息的格式也不相同,需要对所述各数据信息的格式进行处理将所述数据信息转化为可识别的信息。例如,当获取到的数据信息以html表格的方式呈现,则对所述html表格进行结构解析以确定所述表格内包含的信息。当获取到的数据信息以图片的方式呈现时,可以对所述图片进行ocr识别,以确定所述图片中包含的信息。

进一步地,所述各数据信息中还包括至少一个属性数据和与所述各属性数据的生成时间,通过对比所述各属性数据的生成时间和当前时间,所述服务器可以确定当前属性数据,例如可以确定与当前时间最接近的属性数据为当前属性数据。例如,当节点a对应的数据信息中包括属性数据1的生成时间为2019年11月11日下午3点,属性数据2的生成时间为2019年11月12日下午3点。服务器确定当前时间为2019年11月12日下午4点,则将所述属性数据2确定为当前属性数据。

步骤s300、获取各节点对应的历史属性数据。

具体地,作为本实施例的一个可选的实现方式,所述获取各节点对应的历史属性数据的方法可以为在通过步骤s220确定当前属性数据时,在所述各节点对应的数据信息中同时确定历史属性数据,例如,确定生成时间在所述当前属性数据生成时间之前的属性数据为历史属性数据。例如,当节点a对应的数据信息中包括属性数据1的生成时间为2019年11月11日下午3点,属性数据2的生成时间为2019年11月12日下午3点。服务器确定当前时间为2019年11月12日下午4点,则将所述属性数据1确定为历史属性数据。

作为本实施例的另一个可选的实现方式,还可以将所述各节点历史时刻获取的当前属性数据作为当前的历史属性数据。例如,当以天为周期确定属性数据时,服务器确定节点a在2019年11月11日下午3点确定的当前属性数据为属性数据1,在2019年11月12日下午3点确定的当前属性数据为属性数据2,则在2019年11月12日下午3点将所述属性数据1确定为历史属性数据。可选的,所述历史属性数据为上一个周期的当前属性数据,或在当前时间之前一段时间内确定的全部当前属性数据。

步骤s400、根据所述各节点对应的历史属性数据和当前属性数据确定各个节点的数据特征。

具体地,所述数据特征可以用于表征所述各节点当前或一段时间内的数据波动情况。

在本实施例中,所述确定各节点的数据特征包括:

步骤s500、确定用于表征所述历史属性数据和当前属性数据差异的特征值。

具体地,在通过步骤s200和s300确定各节点对应的当前属性数据和历史属性数据后,将所述当前属性数据和历史属性数据结构化存储,并通过计算特征值的方式确定所述当前属性数据和历史属性数据之间的差异。所述特征值例如可以是同比增长率、环比增长率等用于表征当前数据波动情况的值。可选的,所述特征值还可以是将所述当前属性数据和历史属性数据输入训练好的特征模型,输出对应的特征值。

步骤s510、根据所述特征值和预设规则确定所述节点对应的数据特征。

具体地,服务器预先设定预设规则来确定所述特征值和数据特征的对应关系,所述数据特征例如可以是缓慢、急剧、突降、激增等用于表征数据波动情况及程度的词。当所述特征值数值时,可以设定不同范围的数值对应的数据特征。例如当所述特征值为0-1时,可以设定0-0.33对应缓慢,0.33-0.67对应急剧,0.67-1对应激增。当所述特征值为-1-1时,可以设定0-0.33和-0.33-0对应缓慢,0.33-0.67和-0.33-(-0.67)对应急剧,-0.67-(-1)对应突降,0.67-1对应激增。因此,当根据步骤s500确定各节点对应的特征值后可以得到所述各节点对应的数据特征。

步骤s500、从预设的资讯源获取至少一个相关资讯信息。

具体地,所述预设的资讯源可以是所述知识图谱对应领域的官方信息发布平台、行业媒体论坛、业内专家博客等。

在本实施例中,所述获取相关资讯信息的过程可以包括:

步骤s510、从预设的资讯源获取多个资讯信息。

具体地,所述服务器根据预设周期在资讯源中获取多个资讯信息,所述资讯信息包括所述资讯源上一个获取周期到当前时刻内产生的全部或部分资讯。例如,对于金融行业,所述获取到的资讯信息包括时长资讯、交易资讯、政策资讯、评论员评论、以及资讯源中与所述金融行业无关的政策新闻、社交资讯或业内专家关于其他无关内容发布的博客等信息。

步骤s520、对所述资讯信息进行筛选得到相关资讯信息。

具体地,在通过步骤s510从多个预设资讯源获取资讯信息后,可以对所述相关资讯信息进行筛选,得到与所述知识图谱中各节点相关的相关资讯信息。所述筛选过程例如可以是通过关键词筛选,即预先构建关键词词库,当服务器在所述资讯信息中可以检索到关键词词库中包括的关键词时,确定所述资讯信息为相关资讯信息,当服务器在所述资讯信息中未检索到关键词词库中包括的关键词时,确定所述资讯信息为非相关资讯信息。进一步地,所述资讯信息的筛选还可以通过将所述各资讯信息输入训练好的相关模型,输出所述资讯信息的相关度。当所述相关度大于相关阈值时,确定所述资讯信息为相关资讯信息。

步骤s600、识别所述各相关资讯信息中的实体信息以确定所述各资讯信息与所述各节点的对应关系。

具体地,所述各相关资讯信息中包括至少一个与所述概念信息有对应关系的实体信息。

在本实施例中,所述确定资讯信息和节点对应关系的过程包括:

步骤s610、识别所述相关资讯信息中包括的实体信息。

具体地,所述实体信息用于表征一个实体的概念信息。例如,对于金融行业,所述实体信息可以为汇率、成交率、收盘价、加权利率等信息。每个所述相关资讯信息中可以包括一个或多个与概念信息对应的实体信息。因此,服务器识别所述各相关资讯信息的内容得到一个或多个与概念信息对应的实体信息,所述识别方法例如可以是通过与实体信息对应的关键词进行实体信息识别。

步骤s620、根据所述各实体信息对应的概念信息确定所述相关资讯信息对应的节点。

具体地,当通过步骤s610识别各相关资讯信息得到对应的实体信息后,需要进一步确定所述各实体信息和概念信息的对应关系。在本实施例中,所述相关资讯信息和所述概念信息的对应关系可以预先设定。所述对应关系可以为所述实体信息与节点表征的概念信息相同和相关,其中相关关系包括推理相关和因果相关。因此,所述服务器每识别到一个与概念信息对应的实体信息,建立与表征所述概念信息的节点之间的对应关系。通过上述步骤可以确定各相关资讯信息和所述知识图谱中至少一个节点的对应关系。例如,可以预先设定概念信息a对应实体信息a、实体信息b和实体信息c,概念信息b对应实体信息d、实体信息e,概念信息c对应实体信息f。当一个相关资讯信息中包括实体信息a,实体信息b和实体信息f时,所述服务器可以确定所述相关资讯信息与概念信息a和概念信息c,最终确定所述相关资讯信息对应的节点为用于表征所述概念信息a和概念信息c的节点。

步骤s700、根据所述知识图谱中的各节点对应的所述相关资讯信息和所述数据特征自动生成待发布文本。

具体地,在通过上述步骤s100-s600确定知识图谱、知识图谱中各节点对应的数据特征和相关资讯信息后,服务器将所述各节点对应的相关资讯信息和数据特征输入预设模板中自动生成对应的待发布文本。例如,对于金融领域,当所述知识图谱中的一个节点为成交利率,对应的数据特征为激增、相关资讯信息为成交利率相关资讯,则对应生成与成交利率激增相关的交易市场新闻。

步骤s800、发布所述待发布文本。

具体地,所述服务器通过步骤s700自动生成待发布文本后,自动发布所述待发布文本,或在接收到客户端发送的发布指令后发布所述待发布文本。

本发明实施例所述的方法通过确定知识图谱,获取所述知识图谱中各节点对应的数据特征和相关资讯信息,并基于所述各节点对应的数据特征和相关资讯信息生成对应的待发布文本信息并发布,可以快速、及时的自动生成各节点对应的文本信息,同时能够保证文本信息内容的实时性和丰富性。

图3为本发明为本发明实施例的文本信息发布方法的示意图,如图3所示,所述方法先通过服务器确定预设的资讯源30和数据源30’,并分别根据预设的周期在所述资讯源中获取资讯信息31,实时在所述数据源中获取服务器中的知识图谱节点对应的当前属性数据31’。所述服务器再对获取的资讯信息进行筛选得到相关资讯信息32,以及确定各节点对应的历史属性信息32’,分别处理所述相关资讯信息和当前属性数据,得到各相关资讯信息中包括的实体信息、各实体信息对应的节点33,以及各节点当前的数据特征33’。在确定各节点对应的实体信息和当前数据特征后,判断所述各节点对应的数据特征和实体信息之间是否存在因果事件,所述过程可以通过预设的因果事件规则判断。当所述数据特征和实体信息之间存在因果事件34’时,确定包括所述实体信息的相关资讯信息,当所述数据特征和实体信息之间不存在因果事件时34,确定与所述数据信息对应节点相同的相关资讯信息。在通过上述过程确定数据特征和相关资讯信息后,汇总与所述数据特征和相关资讯信息对应的信息35,例如表格、图片、摘要、评论等,将所述信息输入预设模板自动生成待发布文本,最后通过服务器自动发布所述待发布文本36。

所述方法可以快速、及时的自动生成各节点对应的文本信息,同时通过在数据特征和实体信息之间建立因果关系使生成的文本信息内容更加准确。

图4为本发明实施例的文本信息发布装置的示意图,如图4所示,所述装置包括知识图谱确定模块40、当前数据确定模块41、历史数据确定模块42、特征确定模块43、资讯获取模块44、实体识别模块45、文本生成模块46和文本发布模块47。

具体地,所述知识图谱确定模块40用于确定知识图谱,所述知识图谱中包括多个用于表征概念信息的节点。所述当前数据确定模块41用于从预设的数据源获取各节点对应的至少一个当前属性数据。所述历史数据确定模块42用于获取各节点对应的历史属性数据。所述特征确定模块43用于根据所述各节点对应的历史属性数据和当前属性数据确定各个节点的数据特征。所述资讯获取模块44用于从预设的资讯源获取至少一个相关资讯信息,所述各相关资讯信息中包括至少一个与所述概念信息有对应关系的实体信息。所述实体识别模块45用于识别所述各相关资讯信息中的实体信息以确定所述各相关资讯信息与所述各节点的对应关系。所述文本生成模块46用于根据所述知识图谱中的各节点对应的所述相关资讯信息和所述数据特征自动生成待发布文本。所述文本发布模块47用于发布所述待发布文本。

本发明实施例所述的装置可以通过确定知识图谱,获取所述知识图谱中各节点对应的数据特征和相关资讯信息,并基于所述各节点对应的数据特征和相关资讯信息生成对应的待发布文本信息并发布,可以快速、及时的自动生成各节点对应的文本信息,同时能够保证文本信息内容的实时性和丰富性。

图5为本发明实施例的电子设备的示意图,如图5所示,在本实施例中,所述电子设备可以为服务器或终端等,所述终端例如可以是手机、电脑、平板电脑等智能设备。如图所示,所述电子设备包括:至少一个处理器51;与至少一个处理器通信连接的存储器50;以及与存储介质通信连接的通信组件52,所述通信组件52在处理器的控制下接收和发送数据;其中,存储器50存储有可被至少一个处理器51执行的指令,指令被至少一个处理器51执行以实现如本发明实施例所述的文本信息发布方法。

具体地,所述存储器50作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器51通过运行存储在存储器中的非易失性软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述文本信息发布方法。

存储器50可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储选项列表等。此外,存储器50可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器50可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

一个或者多个模块存储在存储器50中,当被一个或者多个处理器51执行时,执行上述任意方法实施例中的文本信息发布方法。

上述产品可执行本申请实施例所公开的方法,具备执行方法相应的功能模块和有益效果,未在本实施例中详尽描述的技术细节,可参见本申请实施例所公开的方法。

本发明还涉及一种计算机可读存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行上述部分或全部的方法实施例。

即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1