一种基于用户偏好的个性化新闻标题生成方法

文档序号：34308969发布日期：2023-05-31 20:04阅读：61来源：国知局

本发明涉及大数据，尤其涉及一种基于用户偏好的个性化新闻标题生成方法。

背景技术：

1、现代社会之中，新闻已经成为人们获取信息的重要途径之一，也是人们了解社会、了解世界的重要方式之一。然而，由于新闻数量过多，且每个人的阅读兴趣不同，使得用户很难找到自己感兴趣的新闻。因此，如何为用户提供个性化的新闻推荐服务成为了一个研究热点。而新闻标题作为新闻的重要组成部分之一，不仅可以概括新闻的主题，还可以吸引用户的注意力。因此，如何生成符合用户口味的新闻标题也成为了一个研究热点。

2、目前，已有一些研究通过分析用户的行为、兴趣等信息，为用户提供个性化的新闻推荐服务。例如，可以根据用户的点击历史、搜索历史、社交网络历史等信息，推荐用户可能感兴趣的新闻。然而，这种方法并不能完全解决问题。首先，用户的点击、搜索和社交网络历史不能完全反映用户的兴趣，因为用户可能没有点击、搜索或分享他们真正感兴趣的新闻，或者用户的行为数据并不充分。其次，即使给用户推荐了一些新闻，如果新闻标题不能吸引用户的注意力，用户也不会去点击查看。因此，如何生成符合用户口味的新闻标题仍然是一个挑战。

3、在现有方法中，大部分方法未考虑用户的个性化信息，为所有用户产生一致的标题，该标题仅仅与新闻陈述的事实有关，概括了新闻的主要内容，而没有着重突出新闻中用户感兴趣的部分。仅有的部分考虑个性化标题生成任务的模型未能明确的捕捉到用户对新闻标题的偏好，这些方法统一建模了新闻事实与用户偏好，导致两类信息相互混淆，对生成标题的质量产生了影响。此外，当前的个性化标题生成技术仍存在一些挑战和问题，不能在生成过程中充分考虑用户的兴趣偏好和新闻内容的细节，同时也不能平衡标题生成的准确性和可读性，也无法保证生成的速度与质量。

技术实现思路

1、为此，本发明提供一种基于用户偏好的个性化新闻标题生成方法，利用用户的偏好信息，生成与用户偏好匹配的标题。

2、本发明提供一种基于用户偏好的个性化新闻标题生成方法，包括如下步骤：

3、s100：采集用户的浏览记录，抽取所述浏览记录中的实体信息；

4、s200：抽取所述浏览记录中包括用户偏好的文字特征信息；

5、s300：将所述实体信息和所述文字特征信息融合并引入所需生成标题的新闻内容建模，获得生成模型，通过所述生成模型生成原始标题；

6、s400：强化学习所述生成模型，通过强化学习后的生成模型生成个性化标题。

7、根据本发明提供的一种基于用户偏好的个性化新闻标题生成方法，步骤s100包括：

8、s111：采集用户浏览记录；

9、s112：通过自然语言处理技术在所述浏览记录中分离实体词汇，生成实体信号；

10、s113：计算所有所述实体信号的嵌入平均值，生成实体级别用户表征；

11、s114：计算所述浏览记录中所述实体级别用户表征的平均值，生成实体信息。

12、根据本发明提供的一种基于用户偏好的个性化新闻标题生成方法，所述文字特征信息包括语法信息，抽取所述语法信息的步骤如下：

13、s211：分离所述浏览记录中的语法结构，生成语法信号；

14、s212：识别所述语法信号中各单词间的依赖关系，生成语法信息。

15、根据本发明提供的一种基于用户偏好的个性化新闻标题生成方法，所述文字特征信息包括语言风格信息，抽取所述语言风格信息的步骤如下：

16、s221：分离所述浏览记录中的语言风格词汇；

17、s222：基于语料库预训练语言风格分类模型，通过所述语言风格分类模型训练所述语言风格词汇，生成语言风格信号；

18、s223：计算所述语言风格信号在用户阅读历史中占比平均值，生成语言风格信息。

19、根据本发明提供的一种基于用户偏好的个性化新闻标题生成方法，步骤s300中通过所述生成模型生成原始标题时还包括，使用非确定性的实体标签替换所述原始标题中的实体词汇。

20、根据本发明提供的一种基于用户偏好的个性化新闻标题生成方法，步骤s300中通过基于指针的生成式网络，将所述实体信息和所述文字特征信息融合。

21、根据本发明提供的一种基于用户偏好的个性化新闻标题生成方法，步骤s400中强化学习所述生成模型包括：

22、s411：对所述原始标题进行质量评估，获得与所述原始标题对应的第一质量评估指标；

23、s412：融合所述第一质量评估指标和所述文字特征信息，获得第二质量评估指标；

24、s413：通过所述第二质量评估指标对所述生成模型生成的中间文本进行监督，通过监督反馈的信号，调整所述生成模型的参数，以获得所述生成模型最大化期望的总回报。

25、根据本发明提供的一种基于用户偏好的个性化新闻标题生成方法，步骤s413中，任一所述中间文本生成后，所述中间文本的个性化奖励表示如下：

26、

27、其中，为中间文本的个性化奖励，为通过实体信息和中间文本实体级别的相似度计算得到的奖励，为通过语法信息和中间文本语法结构的相似度计算得到的奖励，为通过语言风格信息和中间文本语言风格结构的相似度计算得到的奖励。

28、本发明提供的一种基于用户偏好的个性化新闻标题生成方法，通过抽取用户的浏览历史中对实体、语法和语言风格的偏好，基于用户偏好使用生成模型来为用户提供个性化的新闻标题，有效地利用了用户的偏好信息，同时平衡了个性化信息与标题，生成的标题更加符合用户的口味，另外也拥有了更高的准确率和流畅度。

29、本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

技术特征：

1.一种基于用户偏好的个性化新闻标题生成方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，步骤s100包括：

3.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，所述文字特征信息包括语法信息，抽取所述语法信息的步骤如下：

4.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，所述文字特征信息包括语言风格信息，抽取所述语言风格信息的步骤如下：

5.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，步骤s300中通过所述生成模型生成原始标题时还包括，使用非确定性的实体标签替换所述原始标题中的实体词汇。

6.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，步骤s300中通过基于指针的生成式网络，将所述实体信息和所述文字特征信息融合。

7.根据权利要求1所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，步骤s400中强化学习所述生成模型包括：

8.根据权利要求7所述的一种基于用户偏好的个性化新闻标题生成方法，其特征在于，步骤s413中，任一所述中间文本生成后，所述中间文本的个性化奖励表示如下：

技术总结
本发明涉及大数据技术领域，提供一种基于用户偏好的个性化新闻标题生成方法，该方法包括：采集用户浏览记录，抽取所述浏览记录中的实体信息；抽取所述浏览记录中包括用户偏好的文字特征信息；将所述实体信息和所述文字特征信息融合并引入所需生成标题的新闻内容建模，获得生成模型，通过所述生成模型生成原始标题；强化学习所述生成模型，通过强化学习后的生成模型生成个性化标题。该方法能够基于用户偏好使用生成模型来为用户提供个性化的新闻标题，有效地利用了用户的偏好信息，同时平衡了个性化信息与标题，生成的标题更加符合用户的口味，另外也拥有了更高的准确率和流畅度。

技术研发人员：张莹,于胜龙,郭文雅,袁晓洁
受保护的技术使用者：南开大学
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张莹于胜龙郭文雅袁晓洁
技术所有人：南开大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。