一种生成股票简讯模型的方法及装置与流程

文档序号:17149238发布日期:2019-03-19 23:16阅读:210来源:国知局
一种生成股票简讯模型的方法及装置与流程

本申请涉及信息处理技术领域,具体而言,涉及一种生成股票简讯模型的方法及装置。



背景技术:

互联网络的迅速发展为人们提供了大量便利,而随着国家经济以及货币市场的繁荣,结合互联网络的便利性,使得越来越多的用户开始关注和投资股票。目前,用户一般通过互联网络,搜索并获取股票资讯进行分析,从而确定自己的投资策略。但该股票资讯获取方法,由于互联网络中存在大量的有关股票的网站、新闻等资讯,用户需要在不同的网站或网页之间进行频繁切换来浏览相关股票资讯,使得用户操作较为繁琐,需要耗费大量的时间拼接股票资讯,股票简讯生成效率较低。



技术实现要素:

有鉴于此,本申请的目的在于提供一种生成股票简讯模型的方法及装置,提升股票简讯的生成效率。

第一方面,本申请实施例提供了一种生成股票简讯模型的方法,该方法包括:

采集目标网站的股票资讯,提取所述股票资讯中包含的时间概念、对象概念与形势概念,构建时间概念、对象概念和形势概念之间的映射关系集;

针对所述映射关系集中的每一映射关系包含的运算类形势概念,设计对应的计算函数,构建函数库,以实现对所述运算类形势概念对应的股票指标数据进行数值计算;

针对所述映射关系集中的每一映射关系包含的判断类形势概念,依据所述股票资讯的发布时间,从股票交易市场中,获取与该映射关系和所述发布时间相匹配的股票指标数据;

依据所述股票指标数据,计算对应的股指趋势,构建所述股指趋势与所述映射关系的对应关系,基于各映射关系对应的股指趋势,构建股票趋势库,并建立包含所述函数库以及所述股票趋势库的股票简讯模型。

可选地,所述依据所述股票指标数据,计算对应的股指趋势,包括:

对所述股票指标数据进行归一化;

依据归一化的所述股票指标数据,计算对应的股指趋势。

可选地,在所述计算对应的股指趋势之后,构建所述股指趋势与所述映射关系的对应关系之前,所述方法还包括:

依据计算的股指趋势,与股票趋势库进行匹配;

若计算的股指趋势与股票趋势库中任一股指趋势相匹配,不作处理,若计算的股指趋势与股票趋势库中任一股指趋势均不匹配,执行所述构建所述股指趋势与所述映射关系的对应关系的步骤。

可选地,所述计算的股指趋势与股票趋势库中任一股指趋势相匹配,包括:

利用动态时间归整算法,分别计算计算的股指趋势与股票趋势库中每一股指趋势的相似程度,若有一相似程度高于预设相似度阈值,确认计算的股指趋势与股票趋势库中任一股指趋势相匹配。

可选地,所述股票简讯模型还包括股票知识库,所述方法还包括:

依据提取的时间概念,构建时间概念对应的时间区间,依据提取的对象概念,构建对象概念对应的股票代码,对提取的形势概念进行分类,得到股票知识库。

可选地,所述股票简讯模型还包括写作模板库,所述方法还包括:

对股票知识库中包含的时间概念、对象概念和形势概念进行组合,构建包含各写作元组模板的写作模板库。

可选地,所述方法还包括:

解析写作模板库中的写作元组模板,得到写作元组;

从股票知识库中,获取与所述写作元组相匹配的股票代码;

获取在所述写作元组的时间概念对应的时间区间进行交易的所述写作元组的对象概念对应的股票指标数据,依据所述交易的股票指标数据计算综合指标数据,依据综合指标数据计算待评估趋势;

从股票趋势库中,获取与待评估趋势相匹配的趋势,提取所述相匹配的趋势对应的判断类形势概念;

基于写作元组的运算类形势概念对应的运算逻辑,对所述运算类形势概念对应的股票指标数据进行运算,获取运算结果;

按照运算结果进行排序,获取满足待分析个股数量的待分析个股;

将所述综合指标数据、相匹配的趋势对应的判断类形势概念、运算结果以及待分析个股拼接到写作元组,基于各拼接的写作元组生成股票简讯。

可选地,所述从股票知识库中,获取与所述写作元组相匹配的股票代码,包括:

从股票知识库中获取所述写作元组的时间概念对应的时间区间;

从股票知识库中获取所述写作元组的对象概念对应的股票代码集合。

可选地,所述获取与待评估趋势相匹配的趋势,提取所述相匹配的趋势对应的判断类形势概念,包括:

利用动态时间归整算法,计算待评估趋势与股票趋势库中每一趋势的相似程度,提取相似程度高于预设相似度阈值的趋势对应的判断类形势概念;若计算的相似程度没有高于预设相似度阈值,将该待评估趋势存储至股票趋势库中,为该待评估趋势设置判断类形势概念,构建待评估趋势与对应判断类形势概念的映射关系。

第二方面,本申请实施例提供了一种生成股票简讯模型的装置,该装置包括:

股票资讯采集模块,用于采集目标网站的股票资讯,提取所述股票资讯中包含的时间概念、对象概念与形势概念,构建时间概念、对象概念和形势概念之间的映射关系集;

函数库构建模块,用于针对所述映射关系集中的每一映射关系包含的运算类形势概念,设计对应的计算函数,构建函数库,以实现对所述运算类形势概念对应的股票指标数据进行数值计算;

股票指标数据获取模块,用于针对所述映射关系集中的每一映射关系包含的判断类形势概念,依据所述股票资讯的发布时间,从股票交易市场中,获取与该映射关系和所述发布时间相匹配的股票指标数据;

股票简讯模型构建模块,用于依据所述股票指标数据,计算对应的股指趋势,构建所述股指趋势与所述映射关系的对应关系,基于各映射关系对应的股指趋势,构建股票趋势库,并建立包含所述函数库以及所述股票趋势库的股票简讯模型。

第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的方法的步骤。

本申请实施例提供的一种生成股票简讯模型的方法及装置,通过采集目标网站的股票资讯,提取所述股票资讯中包含的时间概念、对象概念与形势概念,构建时间概念、对象概念和形势概念之间的映射关系集;针对所述映射关系集中的每一映射关系包含的运算类形势概念,设计对应的计算函数,构建函数库,以实现对所述运算类形势概念对应的股票指标数据进行数值计算;针对所述映射关系集中的每一映射关系包含的判断类形势概念,依据所述股票资讯的发布时间,从股票交易市场中,获取与该映射关系和所述发布时间相匹配的股票指标数据;依据所述股票指标数据,计算对应的股指趋势,构建所述股指趋势与所述映射关系的对应关系,基于各映射关系对应的股指趋势,构建股票趋势库,并建立包含所述函数库以及所述股票趋势库的股票简讯模型。这样,可以利用股票资讯和股票简讯模型生成股票简讯,能够有效提升股票简讯的生成效率。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的股票简讯生成方法流程示意图;

图2为本申请实施例提供的一种生成股票简讯模型的方法另一流程示意图;

图3为本申请实施例提供的生成股票简讯模型的装置结构示意图;

图4为本申请实施例提供的一种计算机设备400的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

图1为本申请实施例提供的一种生成股票简讯模型的方法流程示意图。如图1所示,该方法包括:

步骤101,采集目标网站的股票资讯,提取所述股票资讯中包含的时间概念、对象概念与形势概念,构建时间概念、对象概念和形势概念之间的映射关系集;

本申请实施例中,作为一可选实施例,以新浪财经新闻为目标网站,定时采集该网站下的股票资讯,其中,股票资讯包括但不限于:标题、正文内容、网站名称、采集时间、新闻发布时间中的一种或其任意组合。

本申请实施例中,时间概念是表征时间的关键词,包括但不限于:截至收盘、早盘、上午盘、下午盘等。

对象概念是表征股市中股票的分类标签,作为一可选实施例,对象概念包括但不限于:a盘、b盘、两市、沪市、深市、天然气板块、通信行业、三大股指、创业板等。其中,若对象概念为“a盘”,则表示属于a盘的所有股票或股票代码。若对象概念为“两市”,则表示属于沪市和深市的所有股票或股票代码。

本申请实施例中,对象概念可以是按股市分类的分类标签,例如,“三大股指”、“深证成指”、“创业板”等,也可以是按行业板块分类的分类标签,例如,“石油化工板块”、“通信服务板块”等,还可以是按概念板块分类的分类标签,例如,“天然气板块”、“稀土永磁板块”。具体可依据实际需要确定。

形势概念,包括:判断类形势概念和运算类形势概念。其中,判断类形势概念表征股指趋势的关键词,表示股票指标数据变化趋势曲线的文本表述,包括但不限于:“低开低走”、“震荡”、“拉升”、“回落”等。运算类形势概念表征股指的具体数值,即表示股票指标数据统计计算结果的文本表述,包括但不限于:“下跌1.11%”、“涨幅2.85%”、“跌逾7%”、“击穿8000点”、“报1349.78点”等。

本申请实施例中,以目标网站中的一股票资讯为“截至收盘,盘面上,天然气板块午后拉升,南京公用、金鸿控股、长春燃气等涨停。券商板块表现强势、震荡回升,西部证券上涨2.85%,锦龙股份、国元证券涨逾1%。跌幅方面,有色金属板块领跌,震荡走低、持续低迷,罗平锌电、鼎胜新材跌逾7%”为例,包含的时间概念为“截至收盘”,对象概念为“天然气板块、券商板块、有色金属板块”,形势概念为“震荡走低、持续低迷、表现强势、震荡回升”。则基于时间概念、对象概念和形势概念构建的映射关系集包括如下三条映射关系:{下午盘,天然气板块,拉升}、{截至收盘,券商板块,强势、震荡回升}、{截至收盘,有色金属板块,震荡走低、持续低迷}。

步骤102,针对所述映射关系集中的每一映射关系包含的运算类形势概念,设计对应的计算函数,构建函数库,以实现对所述运算类形势概念对应的股票指标数据进行数值计算;

本申请实施例中,对于映射关系中的运算类形势概念,设计对应的计算函数,构建函数库,实现从股票指标数据中得到报多少点、涨幅多少这类数值类型的新闻内容。其中,不同的运算类形势概念,可以对应相同的计算函数,也可以对应不同的计算函数。

步骤103,针对所述映射关系集中的每一映射关系包含的判断类形势概念,依据所述股票资讯的发布时间,从股票交易市场中,获取与该映射关系和所述发布时间相匹配的股票指标数据;

本申请实施例中,获取的是与所述发布时间以及该映射关系中的时间概念和对象概念相匹配的股票指标数据。若股票资讯的发布时间为2016.10.25日,其中的一时间概念、对象概念与形势概念的映射关系为:{截至收盘,石油化工板块,低开低走},则从2016.10.25日的股市(股票交易市场)中,获取石油化工板块下的除停牌外的所有股票的股票指标数据。再例如,该股票资讯中包含的另一时间概念、对象概念与形势概念的映射关系为:{上午盘,稀土永磁板块,拉升},则获取9:30-11:30稀土永磁板块下的除停牌外的所有股票的股票指标数据。

本申请实施例中,作为一可选实施例,股票指标数据包括:股票属性数据以及股票交易数据,其中,股票属性数据包括但不限于:股票代码、股票名称、股票分类等。股票交易数据是指该股票在股票交易市场交易中的数据。例如,以5分钟频度,采集股票开盘时间区段连续数据,每条股票指标数据包括:股票代码、股票名称、股票分类、起止时间、起始值、结束值、最高值、最低值、交易量、价格波动等股票信息中的任意多项。

本申请实施例中,作为一可选实施例,利用开源接口采集股票交易市场的股票指标数据。例如,通过开源接口,从发布时间对应的各股票交易市场中,采集时间概念和对象概念对应的所有上市股票的股票属性数据以及股票交易数据。

步骤104,依据所述股票指标数据,计算对应的股指趋势,构建所述股指趋势与所述映射关系的对应关系,基于各映射关系对应的股指趋势,构建股票趋势库,并建立包含所述函数库以及所述股票趋势库的股票简讯模型。

本申请实施例中,股票趋势库存储:时间概念、对象概念和判断类形势概念对应的股指趋势。作为一可选实施例,对股票指标数据进行分析,得到该映射关系对应的股票趋势,从而得到时间概念、对象概念和判断类形式概念对应的股票行情类型。

作为一可选实施例,可以通过连续时间序列的股票资讯的变化趋势,例如,5分钟线、20分钟线、半小时线、小时线等,表征对应时间概念的股指趋势。

本申请实施例中,作为一可选实施例,依据所述股票指标数据,计算对应的股指趋势,包括:

对所述股票指标数据进行归一化;

依据归一化的所述股票指标数据,计算对应的股指趋势。

本申请实施例中,由于不同股票的股票指标数据,数值相差较大,为了避免数值差距较大影响股票简讯模型分析精准度,对获取到的股票指标数据进行归一化处理,以归一化到统一数据区间。作为一可选实施例,利用正态分布的方法,将股票指标数据归一化至(0,1)区间,然后再进行股指趋势计算。

本申请实施例中,作为另一可选实施例,在所述计算对应的股指趋势之后,构建所述股指趋势与所述映射关系的对应关系之前,该方法还包括:

依据计算的股指趋势,与股票趋势库进行匹配;

若计算的股指趋势与股票趋势库中任一股指趋势相匹配,不作处理,若计算的股指趋势与股票趋势库中任一股指趋势均不匹配,执行所述构建所述股指趋势与所述映射关系的对应关系的步骤。

本申请实施例中,例如,利用dtw算法,将计算的股指趋势与股票趋势库中各股指趋势比较,分别比较计算的股指趋势与股票趋势库中每一股指趋势的相似程度,若有一相似程度高于预设相似度阈值,确认计算的股指趋势与股票趋势库中任一股指趋势相匹配。

本申请实施例中,通过采集目标网站的股票资讯(股票历史资讯),提取股票历史资讯中包含的对象概念以及该对象概念对应的判断类形势概念,结合股票历史资讯的发布时间映射的股票指标数据,生成股指趋势,并基于股指趋势构建股票趋势库。例如,从股票历史资讯中,找出判断类形势概念,继而找到对应的时间概念和对象概念,以及股票历史资讯的发布时间;然后,以发布时间找到与时间概念和对象概念相匹配的股票指标数据进行分析,从而构建股票趋势库。

本申请实施例中,作为一可选实施例,股票简讯模型还包括股票知识库,该方法还包括:

依据提取的时间概念,构建时间概念对应的时间区间,依据提取的对象概念,构建对象概念对应的股票代码,对提取的形势概念进行分类,得到股票知识库。

本申请实施例中,股票知识库包括:时间概念对应的时间区间、对象概念对应的股票代码、形势概念;其中,

以中国股市为例,对于时间概念:截至收盘、早盘、上午盘、下午盘,对应的时间区间分别为:15:00、9:30-11:30、9:30-11:30、13:00-15:00。

本申请实施例中,通过从股票资讯中,收集时间概念,依据不同的股票交易市场,在股票知识库中,分别设置时间概念对应的时间区间。这样,通过获取股票资讯中的时间概念以及股票交易市场,查询股票知识库,可以获取时间概念对应的时间区间。例如,通过获取股票资讯中的时间概念“截至收盘”,查询股票知识库,得到收盘时刻“15:00”,再例如,通过时间概念“早盘”,得到早市的时间区间为9:30-11:30中的任一时间点。

对象概念对应的股票代码,是指该对象概念包含的股票代码。例如,对于对象概念“a盘”,则对应的股票代码为属于a盘的所有股票,在股票知识库中,存储各对象概念以及相应的该对象概念对应的股票代码。

形势概念包括:判断类形势概念以及运算类形势概念。

本申请实施例中,作为另一可选实施例,股票简讯模型还包括写作模板库,该方法还包括:

对股票知识库中包含的时间概念、对象概念和形势概念进行组合,构建包含各写作元组模板的写作模板库。

本申请实施例中,对于对象概念,经过分析和总结,可以归类为固定主体对象概念和非固定主体对象概念。其中,

固定主体对象是指类似指数类股票,由于深市、沪市、上证指数、两市、三大指数、创业板等出现在股票资讯中的模式较为固定。因而,可以作为固定主体对象分析,设计通用的几种写作元组模板,如“时间概念+对象概念+判断类形势概念”,“时间概念+对象概念+判断类形势概念+运算类形势概念”,“时间概念+对象概念+运算类形势概念”等。具体来说,可以是“今天+’,’+两市+判断类形势+’,‘+深成指+运算类形势”等。作为一可选实施例,一示例如下:

“{今天:今天},{两市:两市}{判断类形势:小幅低开,全日低位震荡},{深成指:深成指}{运算类形势:报7999.35点,跌幅1.41%,成交额1198亿元}”

上述示例中,一个花括号表示一个写作元组模板中一概念对应的生成结果,冒号之前为写作元组模板的概念,冒号之后为基于该概念生成的内容。

在写作元组模板中,固定句式内的字符可以使用“+”符号与上下文信息拼接,使用单引号“’”与写作元组模板中的概念相区别。

非固定主体对象是指行业板块、概念板块这类股票指标数据,通过归类到对应板块下的个股指标数据,依据股票公式计算得到综合指标数据,作为非固定主体对象的分析结果。

本申请实施例的生成股票简讯模型的方法,通过采集目标网站的股票资讯,提取所述股票资讯中包含的时间概念、对象概念与形势概念,构建时间概念、对象概念和形势概念之间的映射关系集;针对所述映射关系集中的每一映射关系包含的判断类形势概念,依据所述股票资讯的发布时间,从股票交易市场中,获取与该映射关系和所述发布时间相匹配的股票指标数据;依据所述股票指标数据,计算对应的股指趋势,构建所述股指趋势与所述映射关系的对应关系,基于各映射关系对应的股指趋势,构建包含股票趋势库的股票简讯模型。这样,后续应用中,可以基于股票交易市场中的股票指标数据,计算其趋势,与股票简讯模型进行匹配,从而可以快速确定股票简讯,无需用户在不同的网站或网页之间进行频繁切换来浏览相关股票资讯,可以有效提升股票简讯的生成效率,简化了用户操作,降低了用户的浏览时间。

图2为本申请实施例提供的一种生成股票简讯模型的方法另一流程示意图。在图1的基础上,该方法还包括:

步骤201,解析写作模板库中的写作元组模板,得到写作元组;

本申请实施例中,写作模板库包括有多个写作元组模板,每一写作元组模板对应预设的写作元组。其中,写作元组包括但不限于:时间概念、对象概念和形势概念。作为另一可选实施例,写作元组还可以包括:待分析个股数量以及待分析个股筛选规则。其中,在形势概念中,可以设置判断类形势概念和运算类形势概念的组合逻辑,也可以设置判断类形势概念或运算类形势概念,还可以设置为自动匹配所有形势概念。

本申请实施例中,作为一可选实施例,写作元组包括:时间概念、对象概念、形势概念、待分析个股数量以及待分析个股筛选规则。

假设写作模板库包括有如下第一写作元组模板和第二写作元组模板:

第一写作元组模板:<截至收盘+天然气板块+震荡走低、持续低迷、表现强势、震荡回升、震荡探底+个股:4:跌至>

第二写作元组模板:<截至收盘+有色金属板块+震荡走低、持续低迷、表现强势、震荡回升、震荡探底+个股:3:跌停>

第一写作元组模板的待分析个股数量为4,第二写作元组模板的待分析个股数量为3;

个股筛选规则均为运算类形势概念。具体来说,天然气板块筛选个股的规则为运算类形势概念:跌至,有色金属板块个股筛选规则为运算类形势概:跌停。

本申请实施例中,对于待分析的个股数量,在第一写作元组模板中,需要分析展示4个归类在天然气板块下的个股行情信息;在第二写作元组模板中,需要分析展示3个归类在有色金属板块下的个股行情信息。

步骤202,从股票知识库中,获取与所述写作元组相匹配的股票代码;

本申请实施例中,以中国股市为例,对于时间概念:截至收盘、早盘、上午盘、下午盘,股票知识库中对应的时间区间分别为:15:00、9:30-11:30、9:30-11:30、13:00-15:00。

本申请实施例中,股票知识库中,存储各对象概念以及该对象概念对应的股票代码。因而,作为一可选实施例,从股票知识库中,获取与所述写作元组相匹配的股票代码,包括:

从股票知识库中获取所述写作元组的时间概念对应的时间区间;

从股票知识库中获取所述写作元组的对象概念对应的股票代码集合。

本申请实施例中,基于写作元组的时间概念:截至收盘,通过股票知识库,获取从开盘到收盘的时间区间;基于写作元组的对象概念:天然气板块、有色金属板块,分别获取归类到天然气板块的股票代码集合以及归类到有色金属板块的股票代码集合。

步骤203,获取在所述写作元组的时间概念对应的时间区间进行交易的所述写作元组的对象概念对应的股票指标数据,依据所述交易的股票指标数据计算综合指标数据,依据综合指标数据计算待评估趋势;

本申请实施例中,作为一可选实施例,依据所述交易的股票指标数据计算综合指标数据,包括:

对交易的所述对象概念对应的股票指标数据进行归一化;

依据归一化的股票指标数据,计算所述对象概念的综合指标数据。

本申请实施例中,由于不同股票的股票指标数据,数值相差较大,为了避免数值差距较大影响股票简讯分析精准度,对获取到的交易的股票指标数据进行归一化处理,以归一化到统一数据区间。作为一可选实施例,利用正态分布的方法,将股票指标数据归一化至(0,1)区间。依据对象概念对应的所有归一化的股票指标数据,计算其归一化的股票指标数据的平均值,作为该对象概念的综合指标数据。

步骤204,从股票趋势库中,获取与待评估趋势相匹配的趋势,提取所述相匹配的趋势对应的判断类形势概念;

本申请实施例中,依据获取的股票指标数据,与股票趋势库进行匹配。例如,利用动态时间归整(dtw,dynamictimewarping)算法,将待评估趋势与股票趋势库中各趋势比较,计算待评估趋势与每一趋势的相似程度,将相似程度高于预设相似度阈值的趋势对应的判断类形势概念,作为该写作元组中的判断类形势概念;若计算的相似程度没有高于预设相似度阈值,则确认匹配失败,并将该待评估趋势存储至股票趋势库中,为该待评估趋势设置判断类形势概念,构建待评估趋势与对应判断类形势概念的映射关系。

步骤205,基于写作元组的运算类形势概念对应的运算逻辑,对所述运算类形势概念对应的股票指标数据进行运算,获取运算结果;

本申请实施例中,写作元组的待分析个股筛选规则一般为运算类形势概念,此外,写作元组的形势概念也包括运算类形势概念,以两者为同一运算类形势概念为例,获取该运算类形势概念对应的运算逻辑,即计算函数,对该运算类形势概念对应的股票指标数据按照对应的计算函数(运算逻辑)进行运算。例如,通过股票函数库,获取该运算类形势概念对应的运算逻辑,利用获取的运算逻辑对该运算类形势概念对应的对象概念映射的股票指标数据进行运算,得到运算结果,与该运算类形势概念进行拼接,作为该运算类形势概念的分析结果,展现在生成内容中。

本申请实施例中,股票函数库用于针对运算类形势概念、时间概念、对象概念,设置对应的运算逻辑,实现数值类内容生成业务逻辑。其中,可以从股票资讯中,收集运算类形势概念,并为收集的运算类形势概念设置运算逻辑,通过运行运算逻辑,得到对应运算结果(数值),与该运算类形势概念拼接,实现该运算类形势概念对应的内容自动生成功能。

本申请实施例中,作为一可选实施例,运算逻辑包括但不限于:“涨幅”+计算结果、“突破”+计算结果等。例如,通过运算逻辑运算后,拼接的分析结果为:“涨幅3.14%”、“突破8000点”。

本申请实施例中,作为一可选实施例,每一运算类形势概念对应一运算逻辑,不同的运算类形势概念,可以对应相同或不同的运算逻辑。

步骤206,按照运算结果进行排序,获取满足待分析个股数量的待分析个股;

本申请实施例中,可以指定待分析个股的排序规则,例如,成交量、交易金额、关键性指定判断类形势概念(如大幅拉升、持续走低)等。作为一可选实施例,排序规则为:下跌形势,默认使用跌幅降序,筛选跌幅排前的指定数量的个股数据,展现在生成内容中。上涨形势,默认使用涨幅降序,筛选涨幅排前的指定数量的个股数据。

该步骤为可选步骤。

步骤207,将所述综合指标数据、相匹配的趋势对应的判断类形势概念、运算结果以及待分析个股拼接到写作元组,基于各拼接的写作元组生成股票简讯。

本申请实施例中,依据逐一得到的写作元组的每个构成概念元素自动生成的文本内容,整合为完整句子内容(股票简讯)。作为一可选实施例,将相同时间概念、相同对象概念的不同形势概念对应的内容进行合并,拼接至同一时间概念、同一对象概念后,使之成为一个段落内容,从而实现股票简讯内容的自动优化,避免冗余内容。其中,一股票简讯的示例结果可以如下:

快讯:中证500短暂触底随后反弹

2018年11月02日早盘,中证500(000905)高开。午盘,中证500(000905)高走。当天,中证500(000905)高开,上演v型反转,大幅拉升,一举吹响反弹号角,涨幅3.23%,报4437.95点。

本申请实施例中,通过解析写作元组,自动生成写作元组中各元素对应的内容,拼接写作元组中相同时间概念和对象概念对应的内容,生成段落内容;组合段落内容,生成股票简讯。

本申请实施例中,作为一可选实施例,股票简讯默认为一个段落。实际应用中,也可以根据具体需要,股票简讯也可以自定义一个、两个或者三个段落,本实施例对此不作限定。以三个段落为例,首段可以是常见的指数类股票形势分析,第二段为行业板块股票综合指标数据分析结果,第三段为概念板块股票综合指标数据分析结果。

图3为本申请实施例提供的生成股票简讯模型的装置结构示意图。如图3所示,该装置包括:

股票资讯采集模块301,用于采集目标网站的股票资讯,提取所述股票资讯中包含的时间概念、对象概念与形势概念,构建时间概念、对象概念和形势概念之间的映射关系集;

本申请实施例中,股票资讯包括但不限于:标题、正文内容、网站名称、采集时间、新闻发布时间中的一种或其任意组合。

函数库构建模块302,用于针对所述映射关系集中的每一映射关系包含的运算类形势概念,设计对应的计算函数,构建函数库,以实现对所述运算类形势概念对应的股票指标数据进行数值计算;

股票指标数据获取模块303,用于针对所述映射关系集中的每一映射关系包含的判断类形势概念,依据所述股票资讯的发布时间,从股票交易市场中,获取与该映射关系和所述发布时间相匹配的股票指标数据;

本申请实施例中,获取的是与所述发布时间以及该映射关系中的时间概念和对象概念相匹配的股票指标数据。

本申请实施例中,作为一可选实施例,利用开源接口采集股票交易市场的股票指标数据。

股票简讯模型构建模块304,用于依据所述股票指标数据,计算对应的股指趋势,构建所述股指趋势与所述映射关系的对应关系,基于各映射关系对应的股指趋势,构建股票趋势库,并建立包含所述函数库以及所述股票趋势库的股票简讯模型。

本申请实施例中,作为一可选实施例,所述依据所述股票指标数据,计算对应的股指趋势,包括:

对所述股票指标数据进行归一化;

依据归一化的所述股票指标数据,计算对应的股指趋势。

本申请实施例中,作为一可选实施例,股票简讯模型构建模块303还用于:

依据计算的股指趋势,与股票趋势库进行匹配;

若计算的股指趋势与股票趋势库中任一股指趋势相匹配,不作处理,若计算的股指趋势与股票趋势库中任一股指趋势均不匹配,执行所述构建所述股指趋势与所述映射关系的对应关系的步骤。

本申请实施例中,作为一可选实施例,所述计算的股指趋势与股票趋势库中任一股指趋势相匹配,包括:

利用动态时间归整算法,分别计算计算的股指趋势与股票趋势库中每一股指趋势的相似程度,若有一相似程度高于预设相似度阈值,确认计算的股指趋势与股票趋势库中任一股指趋势相匹配。

本申请实施例中,作为另一可选实施例,股票简讯模型还包括股票知识库,股票简讯模型构建模块303还用于:

依据提取的时间概念,构建时间概念对应的时间区间,依据提取的对象概念,构建对象概念对应的股票代码,对提取的形势概念进行分类,得到股票知识库。

本申请实施例中,作为再一可选实施例,股票简讯模型还包括写作模板库,股票简讯模型构建模块303还用于:

对股票知识库中包含的时间概念、对象概念和形势概念进行组合,构建包含各写作元组模板的写作模板库。

本申请实施例中,作为另一可选实施例,该装置还包括:

股票简讯生成模块(图中未示出),用于解析写作模板库中的写作元组模板,得到写作元组;

从股票知识库中,获取与所述写作元组相匹配的股票代码;

获取在所述写作元组的时间概念对应的时间区间进行交易的所述写作元组的对象概念对应的股票指标数据,依据所述交易的股票指标数据计算综合指标数据,依据综合指标数据计算待评估趋势;

从股票趋势库中,获取与待评估趋势相匹配的趋势,提取所述相匹配的趋势对应的判断类形势概念;

基于写作元组的运算类形势概念对应的运算逻辑,对所述运算类形势概念对应的股票指标数据进行运算,获取运算结果;

按照运算结果进行排序,获取满足待分析个股数量的待分析个股;

将所述综合指标数据、相匹配的趋势对应的判断类形势概念、运算结果以及待分析个股拼接到写作元组,基于各拼接的写作元组生成股票简讯。

本申请实施例中,作为一可选实施例,所述从股票知识库中,获取与所述写作元组相匹配的股票代码,包括:

从股票知识库中获取所述写作元组的时间概念对应的时间区间;

从股票知识库中获取所述写作元组的对象概念对应的股票代码集合。

本申请实施例中,作为一可选实施例,所述获取与待评估趋势相匹配的趋势,提取所述相匹配的趋势对应的判断类形势概念,包括:

利用动态时间归整算法,计算待评估趋势与股票趋势库中每一趋势的相似程度,提取相似程度高于预设相似度阈值的趋势对应的判断类形势概念;若计算的相似程度没有高于预设相似度阈值,将该待评估趋势存储至股票趋势库中,为该待评估趋势设置判断类形势概念,构建待评估趋势与对应判断类形势概念的映射关系。

如图4所示,本申请一实施例提供了一种计算机设备400,用于执行图1和图2中的生成股票简讯模型的方法,该设备包括存储器401、处理器402及存储在该存储器401上并可在该处理器402上运行的计算机程序,其中,上述处理器402执行上述计算机程序时实现上述生成股票简讯模型的方法的步骤。

具体地,上述存储器401和处理器402能够为通用的存储器和处理器,这里不做具体限定,当处理器402运行存储器401存储的计算机程序时,能够执行上述生成股票简讯模型的方法。

对应于图1和图2中的生成股票简讯模型的方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述生成股票简讯模型的方法的步骤。

具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述解析便携式文档格式文档表格的方法。

在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1