特征数据获取方法、数据存储方法、装置、设备及介质与流程

文档序号:20839338发布日期:2020-05-22 17:17阅读:293来源:国知局
特征数据获取方法、数据存储方法、装置、设备及介质与流程

本申请实施例涉及人工智能技术领域,特别涉及一种特征数据获取方法、数据存储方法、装置、设备及介质。



背景技术:

在对机器学习模型进行训练之前,需要先获取用于训练该机器学习模型的特征数据。

在相关技术中,技术人员需要深入学习业务相关知识,了解业务场景下的业务特征和业务标签,从而根据上述业务特征和业务标签,获取特征数据和标签数据。假设业务场景为涉嫌走私,则技术人员需要深入学习有关走私相关的知识,了解涉嫌走私场景下的业务特征和业务标签,例如,技术人员需要了解应该获取嫌疑人的哪些相关信息,从而可以根据上述相关信息判断该嫌疑人是否涉嫌走私。

然而,上述相关技术中业务特征和业务标签需要由技术人员深入学习,使得特征数据的获取效率较低。



技术实现要素:

本申请实施例提供了一种特征数据获取方法、数据存储方法、装置、设备及介质,可用于解决相关技术中业务特征和业务标签需要由技术人员深入学习,使得特征数据的获取效率较低的问题。技术方案如下:

一方面,本申请实施例提供一种特征数据获取方法,所述方法包括:

获取目标业务场景对应的特征图谱;

根据所述特征图谱,确定所述目标业务场景下的业务特征和业务标签;

根据所述业务特征和所述业务标签,获取所述目标业务场景下的特征数据和标签数据。

另一方面,本申请实施例提供一种数据存储方法,所述方法包括:

接收特征图谱生成设备发送目标业务场景对应的特征图谱;

向特征数据生成设备发送所述特征图谱;

接收所述特征数据生成设备发送的机器学习模型,所述机器学习模型是采用所述目标业务场景下的特征数据和标签数据进行训练得到的模型,所述特征数据和所述标签数据是基于从所述特征图谱中确定的业务特征和业务标签获取的,所述机器学习模型用于对所述目标业务场景进行标签分类;

存储所述机器学习模型。

另一方面,本申请实施例提供一种特征图谱生成方法,所述方法包括:

显示业务平台提供的图谱生成页面,所述图谱生成页面包括组件选择区域和图谱生成区域;

接收对应于目标组件从所述组件选择区域到所述图谱生成区域的拖拽操作,所述目标组件是指目标业务场景下的业务特征或业务标签对应的组件;

在所述图谱生成区域中生成所述目标组件对应的图形块;根据所述图形块,生成所述目标业务场景对应的特征图谱。

另一方面,本申请实施例提供一种特征数据获取装置,所述装置包括:

图谱获取模块,用于获取目标业务场景对应的特征图谱;

特征确定模块,用于根据所述特征图谱,确定所述目标业务场景下的业务特征和业务标签;

数据获取模块,用于根据所述业务特征和所述业务标签,获取所述目标业务场景下的特征数据和标签数据。

再一方面,本申请实施例提供一种数据存储装置,所述装置包括:

图谱接收模块,用于接收特征图谱生成设备发送目标业务场景对应的特征图谱;

图谱发送模块,用于向特征数据生成设备发送所述特征图谱;

模型接收模块,用于接收所述特征数据生成设备发送的机器学习模型,所述机器学习模型是采用所述目标业务场景下的特征数据和标签数据进行训练得到的模型,所述特征数据和所述标签数据是基于从所述特征图谱中确定的业务特征和业务标签获取的,所述机器学习模型用于对所述目标业务场景进行标签分类;

模型存储模块,用于存储所述机器学习模型。

再一方面,本申请实施例提供一种特征图谱生成装置,所述装置包括:

页面显示模块,用于显示业务平台提供的图谱生成页面,所述图谱生成页面包括组件选择区域和图谱生成区域;

操作接收模块,用于接收对应于目标组件从所述组件选择区域到所述图谱生成区域的拖拽操作,所述目标组件是指目标业务场景下的业务特征或业务标签对应的组件;

图形块生成模块,用于在所述图谱生成区域中生成所述目标组件对应的图形块;

图谱生成模块,用于根据所述图形块,生成所述目标业务场景对应的特征图谱。

又一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述特征数据获取方法,或实现上述数据存储方法,或实现上述特征图谱生成方法。

又一方面,本申请实施例提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述特征数据获取方法,或实现上述数据存储方法,或实现上述特征图谱生成方法。

本申请实施例提供的技术方案可以带来如下有益效果:

通过获取业务场景对应的特征图谱,从而确定业务场景下的业务特征和业务数据,进而获取该业务场景下的特征数据和标签数据,本申请不需要技术人员深入学习从而确定业务特征和业务标签,特征数据和标签数据的获取速度快,提高了数据分析过程的效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一个实施例提供的实施环境的示意图;

图2是本申请一个实施例提供的特征数据获取方法的流程图;

图3是本申请一个实施例提供的特征图谱的示意图;

图4是本申请一个实施例提供的属性配置页面的示意图;

图5是本申请另一个实施例提供的属性配置页面的示意图;

图6是本申请另一个实施例提供的特征数据获取方法的流程图;

图7是本申请一个实施例提供的数据存储方法的流程图;

图8是本申请一个实施例提供的业务平台的架构示意图;

图9是本申请一个实施例提供的特征图谱生成方法的流程图;

图10是本申请一个实施例提供的特征数据获取装置的框图;

图11是本申请另一个实施例提供的特征数据获取装置的框图;

图12是本申请一个实施例提供的数据存储装置的框图;

图13是本申请另一个实施例提供的数据存储装置的框图;

图14是本申请一个实施例提供的特征图谱生成装置的框图;

图15是本申请一个实施例提供的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

人工智能(artificialintelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

计算机视觉技术(computervision,cv)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。

自然语言处理(naturelanguageprocessing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习(machinelearning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

机器学习是人工智能研究发展到一定阶段的必然产物,其致力于通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”形式存在,通过机器学习算法,可从数据中产生“模型”,也就是说,将经验数据提供给机器学习算法,就能基于这些经验数据产生模型,在面对新的情况时,模型会提供相应的判断,即预测结果。

在相关技术中,通过如下方式获取特征数据:导入包含历史数据记录或预测数据记录的数据集(例如,数据表);通过对数据集中的数据记录的属性信息进行各种处理,以得到各个特征,这些特征构成的特征向量可作为机器学习训练样本或机器学习预测样本。数据表中的每条数据记录可包括多个属性信息,而特征可指示字段本身或字段的局部、或字段的组合等各种字段处理(或运算)结果,以便更好地反映数据分布以及字段间的内在关联与潜在含义。

特征图谱是指利用图形化的形式展现业务场景的图谱,是一个更加形式化、简洁化的表达形式,特征图谱中可以包括多个图形块。特征图谱又可以称之为知识图谱,可以为用户找出更加准确的信息,作出更全面的总结并提供更有深度相关的信息。特征图谱可以通过人为构建与定义,去描述各种概念之间的关系。

本申请实施例提供的方案涉及人工智能的计算机视觉技术、自然语言处理、机器学习等技术,具体通过如下实施例进行说明。

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

请参考图1,其示出了本申请一个实施例提供的实施环境的示意图。该实施环境包括:特征图谱生成设备10、特征数据生成设备20和服务器30。

在本申请实施例中,特征图谱生成设备10是指用于生成特征图谱的设备,特征图谱生成设备10可以是终端,例如,pc(personalcomputer,个人计算机)、平板电脑、手机、智能可穿戴设备等电子设备,特征图谱生成设备10生成特征图谱后,上传至服务器30中。

特征数据生成设备20是指用于获取特征图谱从而生成特征数据的设备,特征数据生成设备20可以是终端,例如,pc、平板电脑、手机、智能可穿戴设备等电子设备。特征数据生成设备20可以从服务器30中获取特征图谱生成设备10生成的特征图谱。

服务器30可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是云计算中心。服务器30可以通过有线或者无线网络与特征图谱生成设备10和特征数据生成设备20进行通信。示例性地,服务器30中可以运行有业务平台,特征图谱生成设备10将生成的特征图谱上传至业务平台的数据库中,特征数据生成设备20从业务平台的数据库中获取上述特征图谱。

请参考图2,其示出了本申请一个实施例提供的特征数据获取方法的流程图,该方法的执行主体可以是图1所示的特征数据生成设备,该方法可以包括如下几个步骤:

步骤201,获取目标业务场景对应的特征图谱。

目标业务场景可以是任意一个业务场景,例如诈骗、盗窃、抢劫罪等。不同业务场景对应的特征图谱不一样,特征图谱是指利用图形化的形式展现业务场景的图谱,同一业务场景可以对应有多个特征图谱。

可选地,特征数据生成设备可以从业务平台的数据库中获取特征图谱。特征图谱可以是业务人员通过特征图谱生成设备生成的。

步骤202,根据特征图谱,确定目标业务场景下的业务特征和业务标签。

在示意性实施例中,如图3所示,特征图谱300包括:业务特征31、业务标签32、业务特征31的属性信息和业务标签32的属性信息。业务特征31用于表征在业务场景下所需的特征,业务标签32用于表征在业务场景下的标签,业务特征31的属性信息用于指示业务特征31的属性,业务标签32的属性信息用于指示业务标签32的属性。业务特征31的属性信息和业务标签32的属性信息可以包括多个信息,每个信息可以对应有一个数据过滤规则。以业务场景为涉嫌走私分析为例进行介绍说明,业务特征31可以包括所属车辆、车辆轨迹、身份信息和出入境信息。以业务特征31为所属车辆为例,所属车辆的属性信息可以包括所属车辆的所属地市、车牌号、品牌等信息,所属地市对应的数据过滤规则可以是xx市,品牌可以是xx兰,可选地,业务特征31的属性信息还包括创建人及创建时间。上述业务特征31的属性信息可以在如图4所述的属性配置页面中设置,当然,用户可以点击“修改属性”按钮修改某一业务特征的属性信息。业务标签32可以为涉嫌走私,业务标签32的属性信息可以包括标签描述,例如判断人员是否涉嫌走私;业务标签32的属性信息还可以包括各个业务特征各自对应的影响权重以及数据过滤规则,例如,所属车辆对应的影响权重为20%,车辆轨迹对应的影响权重为20%,身份信息对应的影响权重为20%,出入境信息对应的影响权重为40%,所属车辆对应的数据过滤规则为xx市、车辆轨迹对应的数据过滤规则为xx地图数据,身份信息对应的数据过滤规则为xx省公民。可选地,业务标签32的属性信息还包括创建人及创建时间。上述业务标签32的属性信息可以在如图5所述的属性配置页面中设置。

以业务场景为涉恐人员识别或涉黑人员识别为例进行介绍说明,业务特征31可以包括身份信息、出入境信息、手机信息、社交应用信息。业务标签32可以为是否为涉恐人员或是否为涉黑人员。

示例性地,业务特征31包括公共业务特征和自定义业务特征。公共业务特征是指不可自定义修改的业务特征,自定义业务特征是指可自定义修改的业务特征。

示例性地,业务标签32包括公共业务标签和自定义业务标签。公共业务标签是指不可自定义修改的业务标签,自定义业务标签是指可自定义修改的业务标签。

公共业务特征和公共业务标签可以是由业务平台的管理员设置的,是经过验证后的权威业务积累。普通用户不可以修改公共业务特征和公共业务标签,可以设置自定义业务特征和自定义业务标签。

步骤203,根据业务特征和业务标签,获取目标业务场景下的特征数据和标签数据。

特征数据是指与业务特征对应的数据,标签数据是指与业务标签对应的数据。特征数据生成设备可以根据业务特征和业务标签,从数据库中获取特征数据和标签数据。

业务特征和业务标签作为数据挖掘分析的重要内容,其丰富程度和准确性直接关系到数据画像、专题分析等数据分析应用的成效。特征图谱实现了数据分析的业务和技术的分离,业务人员输出自己的业务经验,也可参与到数据分析项目中,最终形成宝贵的业务沉淀。

综上所述,本申请实施例提供的技术方案中,通过获取业务场景对应的特征图谱,从而确定业务场景下的业务特征和业务数据,进而获取该业务场景下的特征数据和标签数据,本申请不需要技术人员深入学习从而确定业务特征和业务标签,特征数据和标签数据的获取速度快,提高了数据分析过程的效率。

在示意性实施例中,如图6所示,其示出了本申请另一个实施例提供的特征数据获取方法的流程图,该方法可以包括如下几个步骤:

步骤601,获取目标业务场景对应的特征图谱。

步骤602,根据特征图谱,确定目标业务场景下的业务特征和业务标签。

步骤603,根据业务特征和业务标签,获取目标业务场景下的特征数据和标签数据。

示意性地,特征数据生成设备可以通过如下方式获取特征数据和标签数据:

第一,根据业务特征和业务特征的属性信息,确定特征数据的过滤规则;

仍然以上述示例为例进行介绍说明,假设业务特征包括所属车辆,所属车辆的属性信息包括所属车辆的地市、车牌号、品牌,则可以确定特征数据的过滤规则为某市、品牌为xx兰的车辆。

第二,获取符合特征数据的过滤规则的特征数据;

特征数据生成设备可以从数据库中筛选出某市、品牌为xx兰的车辆作为所属车辆的特征数据。

第三,根据业务标签和业务标签的属性信息,确定标签数据的过滤规则;

仍然以上述示例为例进行介绍说明,业务标签包括涉嫌走私,涉嫌走私的属性信息包括所属车辆对应的影响权重为20%,车辆轨迹对应的影响权重为20%,身份信息对应的影响权重为20%,出入境信息对应的影响权重为40%,所属车辆对应的数据过滤规则为xx市、车辆轨迹对应的数据过滤规则为xx地图数据,身份信息对应的数据过滤规则为xx省公民。

第四,获取符合标签数据的过滤规则的标签数据。

特征数据生成设备可以从数据库中筛选出涉嫌走私的数据为标签数据。

步骤604,根据特征数据和标签数据,生成机器学习模型的训练样本。

机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法,是一种通过利用数据,训练出模型,然后使用模型预测的方法。训练样本是指训练机器学习模型的数据。特征数据生成设备可以将特征数据和标签数据组成训练样本。

步骤605,采用训练样本对机器学习模型进行训练。

在本申请实施例中,机器学习模型用于对目标业务场景进行标签分类。示例性地,特征数据生成设备可以采用训练样本对机器学习模型训练预设次数。特征数据生成设备可以根据机器学习模型预测的标签分类与业务标签,对机器学习模型进行训练。

综上所述,本申请实施例提供的技术方案中,通过根据特征数据和标签数据,生成机器学习模型的训练样本,并采用训练样本对机器学习模型进行训练,由于机器学习模型的训练样本是根据业务人员生成的特征图谱包括的业务特征和业务标签确定的,融合了业务人员的业务经验,因而生成的训练样本更精确,从而使得机器学习模型的训练更精确。特征数据决定了机器学习的上限,而机器学习模型和算法只是逼近这个上限,因此精确的训练样本可以使得机器学习更优。

在示意性实施例中,在对机器学习模型进行训练后,特征数据生成设备可以通过如下方式根据机器学习模型的训练结果对特征图谱进行调整:

接收对应于特征图谱的图形块删除指令;根据图形块删除指令,在特征图谱中删除第一图形块。

接收对应于特征图谱的图形块添加指令;根据图形块添加指令,在特征图谱中添加第二图形块。

接收对应于特征图谱的图形块修改指令;根据图形块修改指令,在特征图谱中修改第三图形块。

图形块删除指令用于指示删除特征图谱中的第一图形块。图形块添加指令用于指示在特征图谱中添加第二图形块。图形块修改指令用于指示在特征图谱中修改第三图形块。

特征数据生成设备既可以删除特征图谱中的图形块,也可以添加特征图谱中的图形块;或者,特征数据生成设备既可以删除特征图谱中的图形块,也可以修改特征图谱中的图形块;或者,特征数据生成设备既可以添加特征图谱中的图形块,也可以修改特征图谱中的图形块;或者,技术人员可以对特征图谱中的图形块进行删除、添加和修改操作。

图形块可以是业务特征对应的图形块,也可以是业务标签对应的图形块。若机器学习模型的训练结果指示的标签分类与业务标签不一致,则特征数据生成设备可以删除与业务标签不一致的业务特征,并添加与该业务标签对应的业务特征对应的图形块。技术人员通过机器学习等技术手段可以将新发现的业务特征及业务标签录入到特征图谱中,也可通过数据及算法验证业务人员根据业务经验沉淀的特征和标签是否准确,进而回流优化特征图谱。

在示意性实施例中,在特征数据生成设备采用训练样本对机器学习模型进行训练之后,还可以执行以下步骤:

1、根据机器学习模型和特征图谱,生成ai(artificialintelligence,人工智能)模板;

2、将ai模板存储至业务平台的数据库中。

将特征图谱和对应训练好的机器学习模型组成形成ai模板,不需要掌握高深的人工智能技术,有一定人工智能技术基础的业务人员即可根据ai模板快速开展ai相关工作,节省项目实施成本,保障项目实施质量。

综上所述,本申请实施例提供的技术方案中,通过对特征图谱进行删除、添加或修改操作,可以优化特征图谱,使得最终生成的特征图谱更优。

另外,根据机器学习模型和特征图谱,生成ai模板,并将ai模板存储至业务平台的数据库中,可以使得项目的开展更为简单高效,节省项目实施成本。

请参考图7,其示出了本申请一个实施例提供的数据存储方法的流程图。该方法的执行主体可以是图1中的服务器,该方法可以包括如下几个步骤:

步骤701,接收特征图谱生成设备发送目标业务场景对应的特征图谱。

业务人员通过特征图谱生成设备在业务平台生成目标业务场景对应的特征图谱,并将上述特征图谱存储至业务平台的数据库中。本申请实施例提供的业务平台的技术架构可以如图8所示,业务平台可使用大数据相关技术来构建,平台底层架构(数据库)采用hadoop(分布式)系统基础架构,包括:hbase(分布式数据库)、hive(数据仓库工具)、hdfs(hadoopdistrubutedfilesystem,分布式文件系统)。程序架构上采用mvc(modelviewcontroller,模型-视图-控制器)三层架构体系,业务层包括:数据源管理、文件数据管理、数据流程管理、特征图谱管理等。利用cas(centralauthenticationservice,中央认证服务)技术,实现用户的单点登录。数据层包括业务数据bean和业务数据dao。业务数据bean是一种java语言写成的可重用组件。业务数据dao(dataaccessobject,数据存取对象)用于隔离不同数据库。cas-client(中央认证服务中的顾客)支持非常多的客户端,cas-server(中央认证服务中的服务方)负责用户的认证工作。特征图谱生成设备可以登录业务平台,实现特征图谱的上传;特征数据生成设备可以登录业务平台,实现特征图谱的获取。业务平台的运行环境可以包括云主机、本地服务器和第三方虚拟主机。

步骤702,向特征数据生成设备发送特征图谱。

业务平台可以将上述特征图谱发送给特征数据生成设备,例如,特征数据生成设备可以向服务器发送图谱获取请求,该图谱获取请求用于请求获取特征图谱,服务器在接收到图谱获取请求时,从业务平台的数据库中将特征图谱发送给特征数据生成设备。

步骤703,接收特征数据生成设备发送的机器学习模型。

在本申请实施例中,机器学习模型是采用目标业务场景下的特征数据和标签数据进行训练得到的模型,特征数据和标签数据是基于从特征图谱中确定的业务特征和业务标签获取的,机器学习模型用于对目标业务场景进行标签分类。

关于特征数据生成设备如何训练机器学习模型的介绍说明可参见上文实施例,此处不再赘述。特征数据生成设备训练完机器学习模型之后,可以将该机器学习模型发送至业务平台的数据库中。

步骤704,存储机器学习模型。

服务器在接收到机器学习模型之后,存储该机器学习模型。

在示意性实施例中,特征图谱包括:业务特征、业务标签、业务特征的属性信息和业务标签的属性信息;在本申请实施例中,业务特征的属性信息用于指示业务特征的属性,业务标签的属性信息用于指示业务标签的属性。

有关特征图谱的介绍说明可参见上文实施例,此处不再赘述。

示例性地,服务器还可以接收特征数据生成设备发送的修改后的特征图谱;存储修改后的特征图谱。

在本申请实施例中,修改后的特征图谱是根据机器学习模型的训练结果对特征图谱进行修改后得到的特征数据生成设备可以对特征图谱进行修改,并将修改后的特征图谱发送给服务器,以使得服务器存储该修改后的特征图谱。

示例性地,服务器还可以接收特征数据生成设备发送的ai模板;存储ai模板。

在本申请实施例中,ai模板是根据机器学习模型和特征图谱生成的。特征数据生成设备通过根据机器学习模型和特征图谱,生成ai模板,并将该ai模板发送给服务器,以实现ai模板的共享,有助于业务人员根据该ai模板快速开展ai相关开发工作,节省项目实施成本,保证项目实施质量。

业务平台存储机器学习模型后,业务人员可以通过自己的设备从业务平台中获取该机器学习模型。假设业务人员是公安人员,公安人员正面临一起涉嫌走私犯罪,犯罪嫌疑人包括嫌疑人a、嫌疑人b、嫌疑人c和嫌疑人d,公安人员需要确定哪些是涉嫌走私人员,哪些是无辜人员。此时,公安人员可以从业务平台中获取与涉嫌走私相关的机器学习模型,将上述嫌疑人a、嫌疑人b、嫌疑人c和嫌疑人d各自的所属车辆、车辆轨迹、身份信息和出入境信息输入至机器学习模型中,机器学习模型输出嫌疑人a为涉嫌走私人员、嫌疑人b为无辜人员、嫌疑人c为无辜人员、嫌疑人d为涉嫌走私人员,通过机器学习模型对涉嫌走私人员进行识别分析,可以为公安人员破案提供更有价值的参考信息,降低了破案的难度。

综上所述,本申请实施例提供的技术方案中,通过接收特征图谱生成设备发送的特征图谱,并向特征数据生成设备发送特征图谱,然后接收特征数据生成设备发送的机器学习模型,可以实现特征图谱和机器学习模型的共享,提高特征数据的获取效率,从而提高数据分析的效率。

另外,服务器还可以接收特征数据生成设备发送的修改后的特征图谱以及ai模板,可以实现信息共享,有助于业务人员根据上述信息快速开展ai相关工作,节省项目实施成本,保证项目实施质量。

请参考图9,其示出了本申请一个实施例提供的特征图谱生成方法的流程图,该方法的执行主体可以是图1所示的特征图谱生成设备,该方法可以包括如下几个步骤:

步骤901,显示业务平台提供的图谱生成页面。

在本申请实施例中,如图3所示,图谱生成页面400包括组件选择区域401和图谱生成区域402。组件选择区域401是指用于供用户选择组件的区域,图谱生成区域402是指用于生成特征图谱300的区域。

步骤902,接收对应于目标组件从组件选择区域到图谱生成区域的拖拽操作。

在本申请实施例中,目标组件是指目标业务场景下的业务特征或业务标签对应的组件。

步骤903,在图谱生成区域中生成目标组件对应的图形块。

可选地,通过业务平台在图谱生成区域中生成目标组件对应的图形块。

仍然以业务场景为涉嫌走私分析为例进行介绍说明,特征图谱生成设备接收对应于所属车辆对应的组件从组件选择区域401到图谱生成区域402的拖拽操作,在图谱生成区域402中生成所属车辆对应的图形块。相应地,特征图谱生成设备接收对应于涉嫌走私对应的组件从组件选择区域401到图谱生成区域402的拖拽操作,在图谱生成区域402中生成涉嫌走私对应的图形块。特征图谱生成设备按照上述流程相应地在图谱生成区域402中生成车辆轨迹、身份信息和出入境信息对应的图形块。

步骤904,根据图形块,生成目标业务场景对应的特征图谱。

特征图谱生成设备根据上述所属车辆、车辆轨迹、身份信息、出入境信息和涉嫌走私各自对应的图形块,生成涉嫌走私分析对应的特征图谱300。

综上所述,本申请实施例提供的技术方案中,通过接收对应于组件从组件选择区域到图谱生成区域的拖拽操作,在图谱生成区域中生成上述组件对应的图形块,从而根据上述图形块,生成业务场景对应的特征图谱,特征图谱的生成过程操作简单高效。

下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。

请参考图10,其示出了本申请一个实施例提供的特征数据获取装置的框图。该装置具有实现上述特征数据获取方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置1000可以包括:图谱获取模块1010、特征确定模块1020和数据获取模块1030。

图谱获取模块1010,用于获取目标业务场景对应的特征图谱。

特征确定模块1020,用于根据所述特征图谱,确定所述目标业务场景下的业务特征和业务标签。

数据获取模块1030,用于根据所述业务特征和所述业务标签,获取所述目标业务场景下的特征数据和标签数据。

综上所述,本申请实施例提供的技术方案中,通过获取业务场景对应的特征图谱,从而确定业务场景下的业务特征和业务数据,进而获取该业务场景下的特征数据和标签数据,本申请不需要技术人员深入学习从而确定业务特征和业务标签,特征数据和标签数据的获取速度快,提高了数据分析过程的效率。

在示意性实施例中,所述特征图谱包括:所述业务特征、所述业务标签、所述业务特征的属性信息和所述业务标签的属性信息;

其中,所述业务特征的属性信息用于指示所述业务特征的属性,所述业务标签的属性信息用于指示所述业务标签的属性。

在示意性实施例中,所述数据获取模块1030,用于:

根据所述业务特征和所述业务特征的属性信息,确定所述特征数据的过滤规则;

获取符合所述特征数据的过滤规则的所述特征数据;

根据所述业务标签和所述业务标签的属性信息,确定所述标签数据的过滤规则;

获取符合所述标签数据的过滤规则的所述标签。

在示意性实施例中,所述业务特征包括公共业务特征和自定义业务特征;

其中,所述公共业务特征是指不可自定义修改的业务特征,所述自定义业务特征是指可自定义修改的业务特征。

在示意性实施例中,如图11所述,所述装置1000,还包括:样本生成模块1040和模型训练模块1050。

样本生成模块1040,用于根据所述特征数据和所述标签数据,生成机器学习模型的训练样本。

模型训练模块1050,用于采用所述训练样本对所述机器学习模型进行训练,所述机器学习模型用于对所述目标业务场景进行标签分类。

在示意性实施例中,所述装置1000,还包括:图形修改模块1060。

所述图形修改模块1060,用于:

接收对应于所述特征图谱的图形块删除指令,所述图形块删除指令用于指示删除所述特征图谱中的第一图形块;根据所述图形块删除指令,在所述特征图谱中删除所述第一图形块;

和/或,

接收对应于所述特征图谱的图形块添加指令,所述图形块添加指令用于指示在所述特征图谱中添加第二图形块;根据所述图形块添加指令,在所述特征图谱中添加所述第二图形块;

和/或,

接收对应于所述特征图谱的图形块修改指令,所述图形块修改指令用于指示在所述特征图谱中修改第三图形块;根据所述图形块修改指令,在所述特征图谱中修改所述第三图形块。

在示意性实施例中,所述装置1000,还包括:模板生成模块1070和模板存储模块1080。

模板生成模块1070,用于根据所述机器学习模型和所述特征图谱,生成人工智能ai模板;

模板存储模块1080,用于将所述ai模板存储至业务平台的数据库中。

请参考图12,其示出了本申请一个实施例提供的数据存储装置的框图。该装置具有实现上述数据存储方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置1200可以包括:图谱接收模块1210、图谱发送模块1220、模型接收模块1230和模型存储模块1240。

图谱接收模块1210,用于接收特征图谱生成设备发送目标业务场景对应的特征图谱。

图谱发送模块1220,用于向特征数据生成设备发送所述特征图谱。

模型接收模块1230,用于接收所述特征数据生成设备发送的机器学习模型,所述机器学习模型是采用所述目标业务场景下的特征数据和标签数据进行训练得到的模型,所述特征数据和所述标签数据是基于从所述特征图谱中确定的业务特征和业务标签获取的,所述机器学习模型用于对所述目标业务场景进行标签分类。

模型存储模块1240,用于存储所述机器学习模型。

综上所述,本申请实施例提供的技术方案中,通过接收特征图谱生成设备发送的特征图谱,并向特征数据生成设备发送特征图谱,然后接收特征数据生成设备发送的机器学习模型,可以实现特征图谱和机器学习模型的共享,提高特征数据的获取效率,从而提高数据分析的效率。

在示意性实施例中,所述特征图谱包括:所述业务特征、所述业务标签、所述业务特征的属性信息和所述业务标签的属性信息;

其中,所述业务特征的属性信息用于指示所述业务特征的属性,所述业务标签的属性信息用于指示所述业务标签的属性。

在示意性实施例中,如图13所示,所述装置1200,还包括:图谱存储模块1250。

所述图谱接收模块1210,还用于接收所述特征数据生成设备发送的修改后的特征图谱,所述修改后的特征图谱是根据所述机器学习模型的训练结果对所述特征图谱进行修改后得到的。

图谱存储模块1250,用于存储所述修改后的特征图谱。

在示意性实施例中,所述装置,还包括:模板接收模块1260和模板存储模块1270。

模板接收模块1260,用于接收所述特征数据生成设备发送的人工智能ai模板,所述ai模板是根据所述机器学习模型和所述特征图谱生成的。

模板存储模块1270,用于存储所述ai模板。

请参考图14,其示出了本申请一个实施例提供的特征图谱生成装置的框图。该装置具有实现上述特征图谱生成方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置1400可以包括:页面显示模块1410、操作接收模块1420、图形块生成模块1430和图谱生成模块1440。

页面显示模块1410,用于显示业务平台提供的图谱生成页面,所述图谱生成页面包括组件选择区域和图谱生成区域。

操作接收模块1420,用于接收对应于目标组件从所述组件选择区域到所述图谱生成区域的拖拽操作,所述目标组件是指目标业务场景下的业务特征或业务标签对应的组件。

图形块生成模块1430,用于在所述图谱生成区域中生成所述目标组件对应的图形块。

图谱生成模块1440,用于根据所述图形块,生成所述目标业务场景对应的特征图谱。

综上所述,本申请实施例提供的技术方案中,通过接收对应于组件从组件选择区域到图谱生成区域的拖拽操作,在图谱生成区域中生成上述组件对应的图形块,从而根据上述图形块,生成业务场景对应的特征图谱,特征图谱的生成过程操作简单高效。

需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内容结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

请参考图15,其示出了本申请一个实施例提供的计算机设备1500的结构示意图。计算机设备是指具备计算和处理能力的电子设备,计算机设备可以是终端或服务器。该计算机设备1500可用于实施上述实施例中提供的方法。具体来讲:

所述计算机设备1500包括中央处理单元(centralprocessingunit,cpu)1501、包括ram(randomaccessmemory,随机存取存储器)1502和rom(read-onlymemory,只读存储器)1503的系统存储器1504,以及连接系统存储器1504和中央处理单元1501的系统总线1505。所述计算机设备1500还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(i/o系统,input/output系统)1506,和用于存储操作系统1513、应用程序1514和其他程序模块1515的大容量存储设备1507。

所述基本输入/输出系统1506包括有用于显示信息的显示器1508和用于用户输入信息的诸如鼠标、键盘之类的输入设备1509。其中所述显示器1508和输入设备1509都通过连接到系统总线1505的输入输出控制器1510连接到中央处理单元1501。所述基本输入/输出系统1506还可以包括输入输出控制器1510以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1510还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备1507通过连接到系统总线1505的大容量存储控制器(未示出)连接到中央处理单元1501。所述大容量存储设备1507及其相关联的计算机可读介质为计算机设备1500提供非易失性存储。也就是说,所述大容量存储设备1507可以包括诸如硬盘或者cd-rom(compactdiscread-onlymemory,只读光盘)驱动器之类的计算机可读介质(未示出)。

不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括ram、rom、eprom(erasableprogrammableread-onlymemory,可擦除可编程只读存储器)、eeprom(electricallyerasableprogrammableread-onlymemory,电可擦可编程只读存储器)、闪存(flashmemory)或其他固态存储其技术,cd-rom、dvd(digitalversatiledisc,数字通用光盘)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1504和大容量存储设备1507可以统称为存储器。

根据本申请的各种实施例,所述计算机设备1500还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1500可以通过连接在所述系统总线1505上的网络接口单元1511连接到网络1512,或者说,也可以使用网络接口单元1511来连接到其他类型的网络或远程计算机系统(未示出)。

所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于实现上述方法的指令。

在示意性实施例中,还提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集。所述至少一条指令、至少一段程序、代码集或指令集经配置以由一个或者一个以上处理器执行,以实现上述特征数据获取方法。

在示意性实施例中,还提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集。所述至少一条指令、至少一段程序、代码集或指令集经配置以由一个或者一个以上处理器执行,以实现上述数据存储方法。

在示意性实施例中,还提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集。所述至少一条指令、至少一段程序、代码集或指令集经配置以由一个或者一个以上处理器执行,以实现上述特征图谱生成方法。

在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被计算机设备的处理器执行时实现上述特征数据获取方法。

在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被计算机设备的处理器执行时实现上述数据存储方法。

在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被计算机设备的处理器执行时实现上述特征图谱生成方法。

可选地,上述计算机可读存储介质可以是rom(read-onlymemory,只读存储器)、ram(randomaccessmemory,随机存取存储器)、cd-rom(compactdiscread-onlymemory,只读光盘)、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于实现上述特征数据获取方法。

在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于实现上述数据存储方法。

在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于实现上述特征图谱生成方法。

应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外,本文中描述的步骤编号,仅示例性示出了步骤间的一种可能的执行先后顺序,在一些其它实施例中,上述步骤也可以不按照编号顺序来执行,如两个不同编号的步骤同时执行,或者两个不同编号的步骤按照与图示相反的顺序执行,本申请实施例对此不作限定。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1