一种信息确定方法和装置与流程

文档序号:12484945阅读:来源:国知局

技术特征:

1.一种信息确定方法,其特征在于,对历史新闻的内容进行数据结构化,获得所述历史新闻的至少一个语义特征;从所述历史新闻的至少一个语义特征中确定出所述历史新闻的热度值相关的语义特征集合;确定所述语义特征集合中的语义特征相对于所述热度值所占的权重并保存在回归模型中;所述方法包括:

获取网络中发布的信息,所述信息的发布时间具有新闻时效性;

对所述信息进行所述数据结构化,获取所述信息的至少一个语义特征;

将所述信息的至少一个语义特征输入到所述回归模型中,利用确定出的与所述信息的至少一个语义特征对应的权重,计算得到所述信息的热度值;

若所述信息的热度值大于预设热度值,确定所述信息为用于形成新闻素材的信息。

2.根据权利要求1所述的方法,其特征在于,若所述信息的热度值大于预设热度,还包括:

确定出所述信息的主题,并保存所述信息、所述信息的主题和所述信息的热度值三者之间的第一对应关系。

3.根据权利要求2所述的方法,其特征在于,还包括:

根据所述历史新闻确定出所述历史新闻的主题和对应所述历史新闻的主题的至少一个新闻模板的第二对应关系。

4.根据权利要求3所述的方法,其特征在于,在所述确定所述信息为用于形成新闻素材的信息后,还包括:

根据所述第一对应关系得到所述信息的主题;

确定出与所述信息的主题相同的所述历史新闻的主题;

通过与所述信息的主题相同的所述历史新闻的主题,根据所述第二对应关系选择相应的新闻模板;

使用所述相应的新闻模板将所述信息的内容生成新闻素材。

5.根据权利要求4所述的方法,其特征在于,若所述相应的新闻模板中包括待确认统计数据时,还包括:

根据所述信息和所述相应的新闻模板中的关键字在预先建立的包含关键字、数据集合和计算算法的映射关系的映射表中进行检索,通过对应的数据 集合和计算算法计算得到所述待确认统计数据;

使用所述相应的新闻模板将所述信息的内容和计算得到所述待确认统计数据生成新闻素材。

6.一种信息确定装置,其特征在于,包括:

回归模型建立单元,用于对历史新闻的内容进行数据结构化,获得所述历史新闻的至少一个语义特征;从所述历史新闻的至少一个语义特征中确定出所述历史新闻的热度值相关的语义特征集合;确定所述语义特征集合中的语义特征相对于所述热度值所占的权重并保存在回归模型中;

获取单元,用于获取网络中发布的信息,所述信息的发布时间具有新闻时效性;

结构化单元,用于对所述信息进行所述数据结构化,获取所述信息的至少一个语义特征;

计算单元,用于将所述信息的至少一个语义特征输入到所述回归模型中,利用确定出的与所述信息的至少一个语义特征对应的权重,计算得到所述信息的热度值;

第一确定单元,用于若所述信息的热度值大于预设热度值,确定所述信息为用于形成新闻素材的信息。

7.根据权利要求6所述的装置,其特征在于,还包括:

第二确定单元,用于若所述信息的热度值大于预设热度,确定出所述信息的主题,并保存所述信息、所述信息的主题和所述信息的热度值三者之间的第一对应关系。

8.根据权利要求7所述的装置,其特征在于,还包括:

第三确定单元,用于根据所述历史新闻确定出所述历史新闻的主题和对应所述历史新闻的主题的至少一个新闻模板的第二对应关系。

9.根据权利要求8所述的装置,其特征在于,还包括:

查询单元,用于在触发所述第一确定单元后,根据所述第一对应关系得到所述信息的主题;

比对单元,用于确定出与所述信息的主题相同的所述历史新闻的主题;

选择单元,用于通过与所述信息的主题相同的所述历史新闻的主题,根 据所述第二对应关系选择相应的新闻模板;

生成单元,用于使用所述相应的新闻模板将所述信息的内容生成新闻素材。

10.根据权利要求9所述的装置,其特征在于,还包括:

检索单元,用于若所述选择单元选择的所述相应的新闻模板中包括待确认统计数据时,根据所述信息和所述相应的新闻模板中的关键字在预先建立的包含关键字、数据集合和计算算法的映射关系的映射表中进行检索,通过对应的数据集合和计算算法计算得到所述待确认统计数据;

所述生成单元还用于使用所述相应的新闻模板将所述信息的内容和计算得到所述待确认统计数据生成新闻素材。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1