一种基于AIGC的文旅数据筛选方法与流程

文档序号:36920188发布日期:2024-02-02 21:47阅读:12来源:国知局
一种基于AIGC的文旅数据筛选方法与流程

本发明涉及文旅数据筛选,具体涉及一种基于aigc的文旅数据筛选方法。


背景技术:

1、aigc(artificial intelligence generated content)是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。

2、aigc技术的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习,aigc可以根据输入的条件或指导思路,生成与之相关的内容。例如,通过输入关键词、描述或样本,aigc可以生成与之相匹配的文章、图像、音频等。

3、文旅数据是基于云计算、大数据、机器学习、数据可视化等先进技术,面向文旅行业,汇聚资源分布、数据运营、人群画像、全周期分析等要素,实现针对景区、度假区、文化街区、交通枢纽、商圈等各类区域的动态客流监测,为客户提供基于客流分析的综合大数据平台。

4、经过我们大量的检索与参考发现现在已经开发出了很多文旅数据筛选方法,例如现有技术的有如公开号为cn116822503a所公开的文旅数据筛选方法,该方法一般包括:采集旅游路线的评价信息作为目标文本;基于目标文本中短词的一致性参数以及完整性参数获得候选词;基于候选词集合对目标文本进行分词;基于分词结果,采用tf-idf算法筛选权重最高的若干个特色词;基于特色词集合进行旅游路线聚合获得旅游路线群组;统计目标群体指数,根据出现于多个旅游路线群组的特色词集合,并去重;对各旅游线路的特色词进行标注;基于标注数据集和线路特色排序特征输入神经网络模型进行训练,以对目标路线进行特色词集合的预测。上述能够基于文本挖掘的线路特色化分析方法,更好的辅助用户决策,帮助用户更快更准的理解线路信息,提升用户体验。

5、然而现有技术中的处理速率较慢,用户使用时的体验感较差。


技术实现思路

1、本发明的目的在于提高数据筛选速度,针对上述存在的不足,提出一种基于aigc的文旅数据筛选方法。

2、本发明采用如下技术方案:

3、一种基于aigc的文旅数据筛选方法,包括以下步骤:

4、s1:数据统计模块统计数据且得出今年假期内前往省份的人流量、前一年假期内前往省份自驾游的人流量、前一年假期内前往省份的人流量和前一年假期内前往省份的车辆总数的信息,并传输至控制模块;

5、s2:数据预设模块设定统计自驾游人流量的准确率、数据平台的总数量、统计数据平台的准确率和车辆内的平均人数的信息,并传输至控制模块;

6、s3:数据分析模块基于aigc技术得出第个数据平台搜索关键词的总数量、第个数据平台搜索关键词时对应原文热度最高的好评总数量、第个数据平台搜索关键词时对应原文热度最高的总评论数量和第个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量的信息,并传输至控制模块;

7、s4:控制模块根据前一年假期内前往省份的车辆总数和车辆内的平均人数计算前一年假期内前往省份自驾游的人流量,根据相关信息计算省份热门程度因子,根据省份热门程度因子得出省份热门程度信息并传输至通信模块;

8、s5:通信模块将省份热门程度信息传输至用户端。

9、可选的,所述数据分析模块包括依次通信连接的数据采集子模块、数据转换子模块、数据筛选子模块和数据传输子模块,所述数据传输子模块与控制模块通信连接;

10、所述数据采集子模块用于采集相关的语音、图像和文字的信息,并传输至数据转换子模块;

11、所述数据转换子模块将相关的语音和图像的信息转换为文字信息,并将转换的文字信息和数据采集子模块采集的文字信息均传输至数据筛选子模块;

12、所述数据筛选子模块基于aigc技术筛选转换的文字信息、采集的文字信息且得出筛选的文字信息,并传输至数据传输子模块;

13、所述数据传输子模块基于aigc技术根据筛选的文字信息得出第个数据平台搜索关键词的总数量、第个数据平台搜索关键词时对应原文热度最高的好评总数量、第个数据平台搜索关键词时对应原文热度最高的总评论数量和第个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量的信息,并传输至控制模块。

14、可选的,所述控制模块计算省份热门程度因子时,满足以下式子:

15、;

16、;

17、其中,为省份热门程度因子,为今年假期内前往省份的人流量,为前一年假期内前往省份自驾游的人流量,为统计自驾游人流量的准确率,为前一年假期内前往省份的人流量,为数据平台的总数量,为第个数据平台搜索关键词的总数量,第个数据平台搜索关键词时对应原文热度最高的好评总数量,为第个数据平台搜索关键词时对应原文热度最高的总评论数量,为第个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量,为统计数据平台的准确率;

18、为前一年假期内前往省份的车辆总数,为车辆内的平均人数。

19、可选的,所述控制模块计算省份热门程度信息时,满足以下式子:

20、;

21、其中,为省份热门程度信息,为省份热门程度因子的选择阈值,当时为省份热门程度低,当时为省份热门程度高。

22、可选的,在步骤s1中,数据统计模块还得出前一年假期内前往景点的人流量和前一年假期内前往景点的旅游者设定的推荐指数的平均值的信息,并传输至控制模块;

23、在步骤s2中,数据预设模块还设定第个数据平台的信息准确指数和第个数据平台的权重指数的信息,并传输至控制模块;

24、在步骤s3中,数据分析模块还得出第个数据平台搜索景点出现的原文总数量的信息,并传输至控制模块;

25、在步骤s4中,控制模块根据省份热门程度因子计算省份热门程度参考指数,根据相关信息计算省份内景点的拥挤程度因子,根据省份内景点的拥挤程度因子得出省份内景点的拥挤程度信息并传输至通信模块;

26、在步骤s5中,通信模块将省份内景点的拥挤程度信息传输至用户端。

27、可选的,所述数据筛选子模块还得出第个数据平台搜索景点出现的原文总数量的信息,并传输至控制模块。

28、可选的,所述控制模块计算省份内景点的拥挤程度因子时,满足以下式子:

29、;

30、;

31、其中,为省份内景点的拥挤程度因子,为第个数据平台搜索景点出现的原文总数量,为第个数据平台的信息准确指数,为第个数据平台的权重指数,为前一年假期内前往景点的人流量,为前一年假期内前往景点的旅游者设定的推荐指数的平均值;

32、为省份热门程度参考指数,至为不同的省份热门程度参考指数的选择阈值,其中<<<,至为不同的省份热门程度因子的选择阈值。

33、可选的,所述控制模块计算省份内景点的拥挤程度信息时,满足以下式子:

34、;

35、其中,为省份内景点的拥挤程度信息,为省份内景点的拥挤程度因子的选择阈值,当时为省份内景点的拥挤程度低,时为省份内景点的拥挤程度高。

36、本发明所取得的有益效果是:

37、1、利用aigc技术能提高整体的处理效率以及信息提取的精准度,为旅游者提供更有价值的信息,且aigc技术是以大数据为基础,更好的反应大众的信息;

38、2、计算省份热门程度因子时,以今年假期内前往省份的人流量和前一年假期内前往省份的人流量形成的比例为基础,然后考虑前一年假期内前往省份自驾游的人流量以及数据平台中反应的数据,综合考虑到实际人流量与网络数据平台对旅游者产生的影响,从而有助于提高计算省份热门程度因子的精度;

39、3、假期出行的旅游者,多数会选择舒适且人少的旅游线路,当已经明确旅游的省份后,通过控制模块计算省份内景点的拥挤程度因子并得出省份内景点的拥挤程度信息,旅游者参考省份内景点的拥挤程度信息再选择是否前往该景点旅游,从而提高旅游的体验感;

40、4、且通过aigc技术还能过滤和识别一些恶意诋毁的原文、垃圾信息、诈骗信息和广告,从而提高计算的精度。

41、为使能更进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,然而所提供的附图仅用于提供参考与说明,并非用来对本发明加以限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1