车辆数据查询分析方法、系统、装置和存储介质与流程

文档序号:36424568发布日期:2023-12-20 17:18阅读:35来源:国知局
车辆数据查询分析方法与流程

本发明的实施方式总体上涉及车辆数据分析,更具体地,涉及一种车辆数据查询分析方法、系统、装置和存储介质。


背景技术:

1、在传统的车辆数据分析工作中,数据的搜集、清洗、处理对数据分析来说是极为关键的步骤。数据分析师需要搜集各种数据源的数据,清洗数据以确保数据的准确性和完整性,并使用数据处理工具和编程语言对数据进行处理转换,然后进行分析和建模,最后用图表的形式展示出来。但是,随着车辆数据的增加,出于查询效率及速度的考虑,不同量级的数据存储在了不同的数据库中,同时产生了更多的车辆数据宽表来存储更多的字段和信息,这使得人工的进行数据搜集和处理极为不便,同时也对数据分析师有了更高的要求。传统的数据分析需要数据分析师完成sql等的编写,进行数据的搜集和处理,进行数据清洗等工作。只有具有不同数据库sql基础和编程语言基础的分析师才能更好的完成这一流程。

2、传统的数据分析工作对数据分析师要求较高,要求其不仅需要有一定的数据分析能力,还需要有一定的编码能力,可以完成不同源的数据采集工作,并可以通过编写代码进行数据的处理。在面临海量数据或数据宽表时,在数据搜集过程中需要花费大量的时间去摸底数据,耗时耗力。

3、为了加快数据分析速度,部分数据分析工作会配置好sql模板供分析师使用,但预设模板比较局限,当数据库类型较多时需要设定多个不同类型的模板进行适配,同时很难生成比较复杂的sql语句,只能进行简单的数据检索等。


技术实现思路

1、为了解决现有技术中的上述问题,在第一方面,本发明的实施方式提供了一种车辆数据查询分析方法,所述方法应用于服务器,所述方法包括:获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将所述数据库名称和所述源表名称传输至客户端,以供所述客户端显示;从客户端接收用户在所述客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符;将所述数据库标识符、所述数据库类型和所述源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;将所述表描述信息查询提示消息输入大语言模型,并且接收所述大语言模型针对所述表描述信息查询提示消息而生成的第一数据库查询语句;对所述已配置的车辆数据源执行所述第一数据库查询语句,以从所述已配置的车辆数据源获取所述指定数据库中的所述指定源表的表描述信息,并将所述表描述信息传输至所述客户端;从所述表描述信息中提取出字段信息,所述字段信息包括字段名称、字段类型、字段描述中的一个或多个;从所述客户端接收用户输入的查询分析需求内容;从所述查询分析需求内容中提取出指标数据和数据展示格式;将所述指标数据、所述数据展示格式和所述字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中所述查询分析提示消息中将待查询分析的字段限制于所述字段信息中的字段;将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中所述车辆知识库包括车辆相关名词含义和/或指标计算方法;将所述查询分析提示消息和所述知识库匹配数据输入大语言模型,并且接收所述大语言模型针对所述查询分析提示消息和所述知识库匹配数据而生成的第二数据库查询语句;对所述已配置的车辆数据源执行所述第二数据库查询语句,以从所述已配置的车辆数据源获取查询分析结果,并将所述查询分析结果传输至所述客户端。

2、在一些实施方式中,在将所述查询分析提示消息和所述知识库匹配数据输入大语言模型之前,所述方法还包括:根据所述指标数据、所述表描述信息和所述知识库匹配数据,判断所述指标数据是否能从所述指定数据库中的所述指定源表中直接获得或者计算获得;如果是,则执行将所述查询分析提示消息和所述知识库匹配数据输入大语言模型;如果否,则向所述客户端发送提示消息,所述提示消息用于提示用户再次输入查询分析需求内容。

3、在一些实施方式中,所述方法还包括:对所述查询分析需求内容执行错别字校验和同义词转义操作,生成经预处理的需求内容,并且从所述查询分析需求内容中提取出指标数据和数据展示格式进一步包括:从所述经预处理的需求内容中提取出指标数据和数据展示格式。

4、在一些实施方式中,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符包括:从客户端接收用户在所显示的所述数据库名称和所述源表名称中选择的指定数据库名称和指定源表名称;根据预先存储的数据库名称、源表名称与数据库标识符、数据库类型和源表标识符的映射表,解析得到用户所指定的数据库和源表的数据库标识符、数据库类型和源表标识符。

5、在一些实施方式中,将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:对所述查询分析提示消息进行文本编码,生成查询分析提示编码数据;将所述查询分析提示编码数据与所述车辆知识库进行相似度匹配;将所述车辆知识库中与所述查询分析提示编码数据相似度最高的预定数目条数据作为所述知识库匹配数据。

6、在一些实施方式中,将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:对所述查询分析提示消息进行文本编码,生成查询分析提示编码数据;将所述查询分析提示编码数据与所述车辆知识库进行相似度匹配;将所述车辆知识库中与所述查询分析提示编码数据的相似度超过预先定义的相似度阈值的数据作为所述知识库匹配数据。

7、在一些实施方式中,将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配包括:将所述车辆知识库中的文本知识数据转化为向量知识数据;将所述向量知识数据与所述文本知识数据组建为键值对,存储为表征知识库;将查询分析提示消息样本进行编码,转换为消息样本向量;将所述消息样本向量与所述表征知识库中的键值对进行拼接,生成相似度计算模型训练样本;通过所述相似度计算模型训练样本对相似度计算原始模型进行训练,获得经训练的相似度计算模型;利用所述经训练的相似度计算模型来计算所述查询分析提示消息与所述车辆知识库中的数据之间的相似度。

8、在第二方面,本发明的实施方式提出了一种车辆数据查询分析系统,所述系统包括服务器和客户端。

9、所述服务器用于:获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将所述数据库名称和所述源表名称传输至客户端,以供所述客户端显示;从客户端接收用户在所述客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符;将所述数据库标识符、所述数据库类型和所述源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;将所述表描述信息查询提示消息输入大语言模型,并且接收所述大语言模型针对所述表描述信息查询提示消息而生成的第一数据库查询语句;对所述已配置的车辆数据源执行所述第一数据库查询语句,以从所述已配置的车辆数据源获取所述指定数据库中的所述指定源表的表描述信息,并将所述表描述信息传输至所述客户端;从所述表描述信息中提取出字段信息,所述字段信息包括字段名称、字段类型、字段描述中的一个或多个;从所述客户端接收用户输入的查询分析需求内容;从所述查询分析需求内容中提取出指标数据和数据展示格式;将所述指标数据、所述数据展示格式和所述字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中所述查询分析提示消息中将待查询分析的字段限制于所述字段信息中的字段;将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中所述车辆知识库包括车辆相关名词含义和/或指标计算方法;将所述查询分析提示消息和所述知识库匹配数据输入大语言模型,并且接收所述大语言模型针对所述查询分析提示消息和所述知识库匹配数据而生成的第二数据库查询语句;对所述已配置的车辆数据源执行所述第二数据库查询语句,以从所述已配置的车辆数据源获取查询分析结果,并将所述查询分析结果传输至所述客户端。

10、所述客户端用于:从所述服务器接收所述已配置的车辆数据源中的所述数据库名称和所述源表名称,并显示所述数据库名称和所述源表名称;接收用户在所显示的数据库名称和源表名称中选择的指定数据库和指定源表,并将其传输至所述服务器;从所述服务器接收所述表描述信息,并显示所述表描述信息;接收用户输入的查询分析需求内容,并将所述查询分析需求内容传输至所述服务器;从所述服务器接收所述查询分析结果,并显示所述查询分析结果。

11、在第三方面,本发明的实施方式提出了一种车辆数据查询分析装置,所述装置应用于服务器,所述装置包括:名称获取模块,配置用于获取已配置的车辆数据源中的数据库名称以及数据库中的源表名称,并将所述数据库名称和所述源表名称传输至客户端,以供所述客户端显示;指定信息获取模块,配置用于从客户端接收用户在所述客户端所显示的数据库名称和源表名称中选择的指定数据库和指定源表,获取所述指定数据库的数据库标识符和数据库类型以及所述指定源表的源表标识符;表描述信息查询提示消息生成模块,配置用于将所述数据库标识符、所述数据库类型和所述源表标识符填入预先定义的表描述信息查询提示模板中,生成表描述信息查询提示消息;第一数据库查询语句获取模块,配置用于将所述表描述信息查询提示消息输入大语言模型,并且接收所述大语言模型针对所述表描述信息查询提示消息而生成的第一数据库查询语句;表描述信息获取模块,配置用于对所述已配置的车辆数据源执行所述第一数据库查询语句,以从所述已配置的车辆数据源获取所述指定数据库中的所述指定源表的表描述信息,并将所述表描述信息传输至所述客户端;字段信息提取模块,配置用于从所述表描述信息中提取出字段信息,所述字段信息包括字段名称、字段类型、字段描述中的一个或多个;需求内容接收模块,配置用于从所述客户端接收用户输入的查询分析需求内容;指标数据提取模块,配置用于从所述查询分析需求内容中提取出指标数据和数据展示格式;查询分析提示消息生成模块,配置用于将所述指标数据、所述数据展示格式和所述字段信息填入预先定义的查询分析提示模板中,生成查询分析提示消息,其中所述查询分析提示消息中将待查询分析的字段限制于所述字段信息中的字段;知识库匹配模块,配置用于将所述查询分析提示消息与预先存储的车辆知识库进行相似度匹配,以生成知识库匹配数据,其中所述车辆知识库包括车辆相关名词含义和/或指标计算方法;第二数据库查询语句获取模块,配置用于将所述查询分析提示消息和所述知识库匹配数据输入大语言模型,并且接收所述大语言模型针对所述查询分析提示消息和所述知识库匹配数据而生成的第二数据库查询语句;查询分析结果获取模块,配置用于对所述已配置的车辆数据源执行所述第二数据库查询语句,以从所述已配置的车辆数据源获取查询分析结果,并将所述查询分析结果传输至所述客户端。

12、在第四方面,本发明的实施方式提出了一种存储介质,存储有计算机可读指令,当所述指令由处理器运行时,执行根据上述任何实施方式所述的方法。

13、本发明的实施方式提出的车辆数据查询分析方法、系统、装置和存储介质可以协助数据分析师完成数据的搜集、处理工作。本发明将大语言模型引入数据分析领域,辅助完成数据的搜集、清洗等工作,使用表描述作为提示,保证数据查询具有更强的准确性和针对性,用来提升数据查询分析的精确率,保证数据分析工作在面对不同源海量数据和更多的数据宽表时具有更高的效率的同时也有更高的准确率。该系统作为一个黑盒系统提供给用户,用户只需提出需求而不需要进行代码的编写,降低了数据分析门槛。

14、本发明的实施方式根据用户输入的需求能够完成不同数据库、数据源的数据查询、分析工作,大大节约数据摸底分析的时间和成本。不需要预设模板、配置详细参数,用户输入自己的需求便可以自动的进行数据搜集和分析,结果保存,更加方便易用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1