一种基于大语言模型的社会个体行为识别预测方法

文档序号:37381726发布日期:2024-03-22 10:34阅读:20来源:国知局
一种基于大语言模型的社会个体行为识别预测方法

本发明属于人工智能与个体行为识别交叉,涉及机器学习、自然语言处理、知识图谱处理技术,尤其涉及一种基于大语言模型的社会个体行为识别预测方法,采用大语言模型进行文本处理,通过构建社会价值行为图进一步构造社会行为链,以实现个体行为识别。


背景技术:

1、价值观在个体行为决策中起着重要的作用。而研究表明,拥有某一价值观的个体在不同环境场景下的行为表现也可能是不同的。因此,基于个体的价值观和所处场景来对个体行为做出预测具有重要的研究价值。

2、对于基于价值观预测个体行为,传统的方法分为心理学和人工智能两类。对于心理学的方法,首先,研究人员通常需要依赖自我报告、调查问卷和实验来了解个体的价值观,但这些方法受到个体主观性和偏见的影响,可能不完全准确,同时也不够方便。其次,心理学研究通常能够识别相关性,但难以确定因果关系。例如,尽管我们可能观察到某些价值观与特定行为相关,但我们需要额外的研究来确定是否是价值观导致了这种行为。第三,价值观和行为的调查过程中也可能涉及一些伦理和隐私的问题。对于人工智能的方法,虽然能够用相关数据训练出准确率不错的深度学习模型,但是很难对于模型的结果进行解释。总的来说,现有的方法难以准确地捕捉并解释个体价值观、场景以及个体行为之间的复杂关系。


技术实现思路

1、为了克服现有技术的不足,本发明旨在提供一种基于大语言模型的社会个体行为识别预测方法,采用大语言模型进行文本数据处理,通过构建基于大语言模型的社会价值行为图,进一步构造个体社会行为链,以实现高效准确的个体行为识别预测。

2、本发明提出的基于大语言模型的社会个体行为识别预测方法,首先通过大语言模型抽取文本数据中的语义关系对;利用关系对按照不同的社会群体构造社会价值行为图;根据当前任务描述在社会价值行为图中采样得到解析图;用解析图在社会价值行为图中进行推理得到行为链,从而对个体的行为选择进行准确的预测。其中,本发明构建了利用大语言模型抽取文本数据中的语义关系对时使用的标准化提示数据集、设计了社会价值行为图的构造方法以及构造和采样过程中的分解与合成方法。

3、本发明提供的技术方案包括如下步骤:

4、1)构建标准化提示数据集,包含大语言模型的输入、理想输出和理想推理过程。这一步骤给出本发明所提出的构造标准化提示数据集的方法以及所构造出的标准化提示数据集,即抽取出(价值观—场景—行为序列)语义关系对,为大语言模型的推理过程提供一个模板,使得大语言模型按照既定的推理过程给出输出。

5、2)利用大语言模型根据标准化提示数据集,结合已知的个体的价值观,从文本数据中抽取出(价值观—场景—行为序列)关系对,并给出场景、行为序列的分解与合成方法。这一步骤的目标是使用本发明构造出的标准化提示数据集提高大语言模型的推理能力,并利用大语言模型的语义理解能力,从大量文本数据中抽取出与个体的场景和行为相关的因果语义信息;同时利用本发明提出的分解与合成方法,消除关系对中的冗余。

6、3)将社会划分为不同的群体,利用步骤1)抽取出的(价值观—场景—行为序列)语义关系对,针对不同的社会群体构建社会价值行为图的子图。每个子图都是社会价值行为图的一个组成部分,对应不同的社会群体,继而加入社会节点(根节点)连接子图形成社会价值行为图。这一步骤给出本发明所给出的社会价值行为图的构造方法,具有社会结构,并使得后续推理过程具有可解释性。

7、4)根据当前任务的描述抽取出场景,在给定已经测定出的价值观的情况下,形成(价值观—场景)对,在社会价值行为图中采样得到语义解析图。利用解析图在社会价值行为图中进行推理,得出个体的行为链,从而确定个体在特定场景下的不同行为选择概率。这一步骤使用本发明提出的分解与合成方法在社会价值行为图中进行采样,得出当前任务的场景,并使用(价值观—场景)对在社会价值行为图中进行匹配,得出行为链,从而实现对个体行为的识别预测。

8、针对上述基于大语言模型的社会行为链构造方法,进一步地,

9、步骤1)所述构建标准化提示数据集方法具体包括如下步骤:

10、11)寻找结构化或非结构化的文本,这样的文本应该能从中推理出个体的价值观、所处场景与对应的行为,作为数据集的输入部分。

11、12)对于步骤11)给定的文本,通过大语言模型生成与人工修改给出输入该文本后大语言模型应当给出的正确的输出,正确的输出格式为三元组(价值观—场景—行为序列)语义关系对。

12、13)对于步骤12)给定的输出,通过大语言模型生成与人工修改给出正确的推理过程,即如何通过输入按照指定的推理过程得到正确的输出的步骤,如文本预处理、文本语义聚合、文本中实体关系提取等。其中,实体指文本中可以单独存在并代表具体事物或概念的文本元素。

13、步骤2)利用步骤1)构造出的数据集,利用大语言模型抽取关系对并确定选用的大预言模型,具体包括如下步骤:

14、21)收集文本数据,这些数据应包含关于个体或群体的价值观、所处场景以及相关行为的描述。这可以是社交媒体帖子、新闻文章、评论、调查问卷等,确保文本是可用的、干净的,并与任务相关。

15、22)选择一个适合关系抽取任务的大语言模型作为基座大模型,如gpt-3.5、gpt-4、文心一言等,并将文本数据通过数据清洗和长度规范化处理成适合模型输入的格式。

16、23)先使用关系抽取数据集对于大语言模型进行微调,然后按照步骤1)的标准化提示数据集中给定的输入、输出以及推理过程,指导大语言模型的推理。在给大语言模型的提示中包括标准化提示数据集中的数据,提示大语言模型按照给定的输出及推理过程进行推理。

17、24)构建原子场景集和原子行为集,提示大语言模型按照原子场景集和原子行为集对场景和行为进行分解和合成,使得抽取出的实体能够相互对应,以便它们在后续步骤中能够对应到同一个节点。

18、25)构建语义关系对抽取测试集,测试集中的每一条数据包括进行抽取的文本、正确的语义关系对。用不同的大语言模型在该测试集上进行测试,对比不同大语言模型在抽取文本数据中语义关系对的效果,选用准确度最高的大语言模型作为基座大模型。

19、步骤3)所述利用关系对构建社会价值行为图包括如下步骤:

20、31)根据抽取出的语义关系对划分得到多个社会群体,并加入群体节点作为社会价值行为图的节点;

21、利用步骤2)中抽取出的语义关系对,按照心理学标准(例如性别、年龄、种族、教育水平、经济地位等)或者使用聚类(例如将抽取出的关系对划分为10类人群)将语义关系对中的个体划分为若干个社会群体,形成对应数目的群体节点va。

22、32)将抽取出的关系对合并生成按所属的不同群体划分在不同的群体节点下面。将每个群体节点下面的关系对按照“价值观、场景、行为”的顺序合并形成树状结构,例如,有相同价值观但却是不同场景的关系对共享一个价值观节点vv。

23、33)将每个群体节点形成的若干个树状结构的根结点(本质上是不同的价值观节点vv)连接到对应的群体节点va,并在图中加入社会节点s作为根节点连接个群体节点,每条边的方向由社会节点指向每个群体节点。

24、步骤4)所述从社会价值行为图中采样得到解析图并在社会价值行为图中进行推理得到行为链包括如下步骤:

25、41)对于大语言模型进行合理的提示,针对当前任务描述所给的文本,从中抽取出个体当前所处的场景,并推断出该个体所处的大致群体,输出例如“所处场景;所属群体可能性排序”的结果。

26、42)针对测定出的个体的价值观,按照所属群体可能性的排序形成(价值观—场景)形式的解析图。

27、43)将解析图按照所属群体可能性从大到小进行排序,按照此顺序在社会价值行为图中进行匹配。在完成匹配后,取出场景节点及其后续所有节点及它们之间的边作为对应的行为子图,即个体在对应价值观以及任务描述对应的场景下的行为链,行为链给出了个体可能选择的不同行为序列。

28、44)输出个体行为选择概率。按照社会价值行为图的构建,行为链有着树状的结构。从34)知行为链也是一个有向有权的树,在采样时,从根节点每次选择一个子节点向下,直到叶节点。选择每个子节点的概率即为边上所带的概率,到叶节点时给出一个行为序列,这个行为序列的概率即为路径上选择每个节点的概率的乘积。重复多次,得到多个行为序列及对应的概率,以概率为权重采样得到一个行为序列作为个体行为的预测。

29、通过上述步骤,实现基于大语言模型的社会个体行为的识别预测。

30、与现有技术相比,本发明的有益效果和技术优势包括:

31、1)根据文本数据中的语义,按照群体、价值观、场景、行为等对应实体来构建社会价值行为图,提供一种具有社会结构的、结合个体价值观、场景、行为的知识图谱构造方法;

32、2)给出一套利用大语言模型的语义理解能力和推理能力、更加准确高效地构建社会价值行为图的流程;

33、3)使用解析图在社会价值行为图中推理出个体的行为链,更具有可解释性;

34、4)构建出标准化提示数据集来提示大语言模型进行推理,使得大语言模型的语义推理能力得到大幅提高。

35、5)基于所构造的原子场景集和原子行为集来对场景和行为进行分解和重新合成,减少社会价值行为图中的冗余,同时提高社会价值行为图的泛化能力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1