一种基于大模型的短文本信息扩展方法和系统与流程

文档序号:37795589发布日期:2024-04-30 17:05阅读:9来源:国知局
一种基于大模型的短文本信息扩展方法和系统与流程

本技术涉及信息生成,尤其涉及一种基于大模型的短文本信息扩展方法和系统。


背景技术:

1、短文本信息是指字数较短的文本数据,通常字数在300以下。在日常生活中短文本数据无处不在,例如文本广告、微博、视频评论以及百度知道中。

2、随着信息技术的发展,短文本信息经常遇到需要丰富扩展,以丰富文本内容的情况。例如在人工智能领域,尤其是在chatgpt中,作为人工智能技术驱动的自然语言处理工具,给它一个短文本数据,chatgpt能够基于在预训练阶段所见的模式和统计规律来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码和写论文等任务。

3、目前常见的短文本信息丰富方法如下:

4、句法结构调整:通过调整句子的结构、语法和逻辑关系,使文本更加清晰、连贯和易读。

5、文本摘要生成:将短文本压缩为简洁的摘要,提取其中的核心信息。这种方法可以通过抽取式(提取原文中的关键句子)或生成式(使用语言模型生成摘要)的方式实现。

6、然而,上述方法基本上都停留在对已有信息的重复或有限拓展,导致短文本信息扩展的信息量有限。

7、申请内容

8、本技术提供一种基于大模型的短文本信息扩展方案,能够解决现有技术中短文本信息扩展的信息量有限的问题。

9、根据本技术的第一方面,本技术提供了一种基于大模型的短文本信息扩展方法,包括:

10、收集短文本信息和短文本信息的应用场景信息;

11、根据短文本信息和应用场景信息的匹配关系,对短文本信息进行数据标注;

12、基于应用场景训练得到多个场景大模型;

13、将短文本信息输入至对应应用场景类型的场景大模型进行扩展,分别得到多种不同应用场景类型的扩展文本内容。

14、优选的,上述短文本信息扩展方法中,收集短文本信息和短文本新的应用场景信息的步骤,包括:

15、获取短文本信息;

16、使用短文本信息丰富算法丰富短文本信息,得到多个相同类型的短文本信息;

17、获取短文本信息对应的应用场景信息;

18、搜集应用场景信息对应的多种媒体形式资料,补充至短文本信息中。

19、优选的,上述短文本信息扩展方法中,使用短文本信息丰富算法丰富短文本信息,得到多个相同类型的短文本信息的步骤,包括:

20、使用词向量替换算法替换短文本信息中的词向量,得到多个相同类型的短文本信息;

21、使用数据增强算法对短文本信息进行数据扩充,得到多个相同类型的短文本信息;

22、以及,使用机器翻译算法对短文本信息进行机器翻译,向短文本信息中引入新词汇和表达方式,得到多个相同类型的短文本信息。

23、优选的,上述短文本信息扩展方法中,根据短文本信息和应用场景信息的匹配关系,对短文本信息进行数据标注的步骤,包括:

24、对短文本信息和应用场景信息进行数据清洗;

25、将数据清洗后的短文本信息和应用场景信息进行数据格式化处理;

26、按照短文本信息和应用场景信息的匹配关系,对格式化后的短文本信息进行数据标注。

27、优选的,上述短文本信息扩展方法中,基于应用场景训练得到多个不同应用场景类型对应的场景大模型的步骤,包括:

28、将使用应用场景信息进行数据标注后的短文本信息,按照预定数据比例划分为文本训练集和文本测试集;

29、设置开源大模型的训练参数和损失函数,使用文本训练集训练开源大模型,得到多个场景大模型;

30、使用文本训练集中数据标注后的应用场景信息,持续验证场景大模型的分类结果,直至场景大模型的损失函数收敛;

31、使用文本测试集测试损失函数收敛的场景大模型的分类结果;

32、若场景大模型的分类结果测试失败,则重置场景大模型的训练参数,重新训练场景大模型,直至场景大模型的分类结果测试成功。

33、优选的,上述短文本信息扩展方法中,将短文本信息输入至对应应用场景类型的场景大模型进行扩展,分别得到多种不同应用场景类型的扩展文本内容的步骤,包括:

34、对短文本信息进行数据处理;

35、根据数据标注后的应用场景信息与场景大模型的应用场景类型的对应关系,将短文本信息输入至对应应用场景类型的场景大模型中;

36、使用场景大模型,按照应用场景类型对短文本信息进行多种媒体形式的数据扩展,生成对应应用场景类型且具有多种媒体形式的扩展文本内容。

37、优选的,上述短文本信息扩展方法中,分别得到多种不同应用场景类型的扩展文本内容的步骤之后,该扩展方法还包括:

38、按照使用要求,对多种不同应用场景类型的扩展文本内容进行数据筛选;

39、按照应用场景信息,对数据筛选后的扩展文本内容进行数据和格式调整。

40、根据本技术的第二方面,本技术还提供了一种基于大模型的短文本信息扩展系统,包括:

41、信息收集模块,用于收集短文本信息和短文本信息的应用场景信息;

42、数据标注模块,用于根据短文本信息和应用场景信息的匹配关系,对短文本信息进行数据标注;

43、模型训练模块,用于基于应用场景训练得到多个场景大模型;

44、信息扩展模块,将短文本信息输入至对应应用场景类型的场景大模型进行扩展,分别得到多种不同应用场景类型的扩展文本内容。

45、优选的,上述短文本信息扩展系统中,信息扩展模块包括:

46、数据处理子模块,用于对短文本信息进行数据处理;

47、模型输入子模块,用于根据数据标注后的应用场景信息与场景大模型的应用场景类型的对应关系,将短文本信息输入至对应应用场景类型的场景大模型中;

48、文本生成子模块,用于使用场景大模型,按照应用场景类型对短文本信息进行多种媒体形式的数据扩展,生成对应应用场景类型且具有多种媒体形式的扩展文本内容。

49、根据本技术的第三方面,本技术还提供了一种基于大模型的短文本信息扩展系统,包括:

50、存储器、处理器及存储在存储器上并在处理器上运行的基于大模型的短文本信息扩展程序,短文本信息扩展程序被处理器执行时实现如上述任一项技术方案提供的短文本信息扩展方法的步骤。

51、综上,本技术上述技术方案提供的基于大模型的短文本信息扩展方案,通过收集短文本信息和短文本信息的应用场景信息,然后根据短文本信息和应用场景信息的匹配关系对短文本信息进行数据标注,这样就能够确定每条短文本信息对应的应用场景,最后训练得到多个场景大模型,每个场景大模型对应一种应用场景,该场景大模型能够扩充丰富对应场景的短文本信息,这样将上述短文本信息输入到对应应用场景类型的场景大模型中进行扩展丰富,就能够分别得到多种不同应用场景类型的扩展文本内容。另外,大模型是拥有超过10亿个参数的深度神经网络,能够处理海量数据,完成各种复杂的任务,如自然语言处理、计算机视觉和语音识别等,因此使用大模型丰富扩展短文本信息,能够对短文本进行深度理解和丰富,生成短文本、长文本和图片等内容,在原有短文本信息的基础上做大量生成式信息的拓展,从而极大丰富短文本的信息量。综上,本技术提供的技术方案,能够解决现有技术中短文本信息扩展的信息量有限的问题。


技术实现思路

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1