本申请涉及数据处理,尤其是涉及到一种科研选题信息生成方法与装置。
背景技术:
1、科研选题是科研活动的重要环节,在选题的过程中,科研人员可能需要跨越自己的专业领域,自行查询和阅读其他学科知识和方法,而人工查询的文献资料十分局限,效率低。
2、目前,科研选题除了依靠科研人员对本领域科研知识和前沿研究的掌握,还可以通过文献检索、科研查询等信息检索手段进行。而相关技术中,信息检索大多只覆盖部分数据库或文献资源,由于数据源的局限性而无法全面检索到相关信息。并且,相关技术中,信息检索与科研选题通常为两个独立的过程,大多情况下需要科研人员根据检索得到的结果人为自行判断所需的科研选题,使得信息检索与科研选题无法有效融合,难以高效地整合相关检索结果来进行创新性的选题。
技术实现思路
1、有鉴于此,本申请提供了一种科研选题信息生成方法与装置,根据用户输入的需求信息,从根据全面的文献数据建立的向量数据集中提取目标向量,并根据目标向量在预设文献数据库中得到与用户需求最为相关的目标文献数据,从而通过预设大模型根据目标文献数据智能化生成多样性科研选题信息,实现将文献检索、科研查新等过程与科研选题生成融为一体,提高科研效率。
2、根据本申请的一个方面,提供了一种科研选题信息生成方法,包括:将待识别的需求信息输入文本嵌入模型,确定所述需求信息的特征向量,其中,所述文本嵌入模型根据预设文献数据库中的文献数据训练得到;根据所述特征向量在向量数据集中确定所述特征向量匹配的目标向量,其中,所述向量数据集根据所述文本嵌入模型对所述预设文献数据库中的文献数据进行向量化处理得到;根据所述目标向量在所述预设文献数据库中确定所述目标向量关联的目标文献数据;将所述目标文献数据输入预设大模型,确定所述需求信息对应的科研选题信息。
3、根据本申请的另一方面,提供了一种科研选题信息生成装置,包括:确定模块,用于将待识别的需求信息输入文本嵌入模型,确定所述需求信息的特征向量,其中,所述文本嵌入模型根据预设文献数据库中的文献数据训练得到;以及,根据所述特征向量在向量数据集中确定所述特征向量匹配的目标向量,其中,所述向量数据集根据所述文本嵌入模型对所述预设文献数据库中的文献数据进行向量化处理得到;以及,根据所述目标向量在所述预设文献数据库中确定所述目标向量关联的目标文献数据;以及,将所述目标文献数据输入预设大模型,确定所述需求信息对应的目标科研选题信息。
4、借由上述技术方案,本申请提供了一种科研选题信息生成方法与装置,利用预先训练完成的符合科研场景的文本嵌入模型,将全面的文献数据进行向量表示,转换为向量数据集,以高效地进行数据存储和检索。进一步,通过在向量数据集中检索与用户输入的需求信息的特征向量匹配的目标向量,实现从大量的文献数据中快速提取与用户需求高度匹配的文献数据,提高检索的准确性与全面性。并根据目标向量在预设文献数据库中得到与用户的需求最为相关的目标文献数据,减少冗余信息,为预设大模型提供更优质的输入数据。从而利用预设大模型智能化生成多样性科研选题信息,实现将文献检索、科研查新等过程与科研选题生成融为一体,提高科研效率与有效性。
5、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
1.一种科研选题信息生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的科研选题信息生成方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的科研选题信息生成方法,其特征在于,所述预设组合规则包括第一预设组合规则和第二预设组合规则,所述根据所述预设文献数据库中文献数据的预设标识,按照预设组合规则组合所述文献数据,确定第一目标数据与第二目标数据,包括:
4.根据权利要求3所述的科研选题信息生成方法,其特征在于,所述基于所述文本嵌入模型,确定所述第二目标数据的第二向量,包括:
5.根据权利要求1所述的科研选题信息生成方法,其特征在于,所述根据所述特征向量在向量数据集中确定所述特征向量匹配的目标向量,包括:
6.根据权利要求5所述的科研选题信息生成方法,其特征在于,所述计算所述特征向量与所述候选向量之间的第二距离,包括:
7.根据权利要求6所述的科研选题信息生成方法,其特征在于,所述方法还包括:
8.根据权利要求1所述的科研选题信息生成方法,其特征在于,所述根据所述目标向量在所述预设文献数据库中确定所述目标向量关联的目标文献数据,包括:
9.根据权利要求1所述的科研选题信息生成方法,其特征在于,所述方法还包括:
10.一种科研选题信息生成装置,其特征在于,所述装置包括: