本发明属于计算机,具体为一种结合变长自注意力机制与统计特征的风险评估方法。
背景技术:
1、相同的驾驶行为对于不同的驾龄、车辆,可能带来不同的风险,单独的两个模型无法实现区分相同驾驶行为,不同人员车辆的属性特征带来的不同风险,或区分相同人员车辆的属性不同驾驶行为带来的不同风险。
2、现有技术中,大多是使用单纯轨迹数据或单纯统计特征与人员属性特征,对行车风险进行评估,但单纯轨迹数据较难提取长期统计特征与人员车辆的属性特征;单纯统计特征与人员属性特征难以细致刻画特定的客户画像。
技术实现思路
1、针对上述情况,为克服现有技术的缺陷,本发明提供一种结合变长自注意力机制与统计特征的风险评估方法,有效的解决了背景技术中的问题。
2、为实现上述目的,本发明提供如下技术方案:一种结合变长自注意力机制与统计特征的风险评估方法,包括以下步骤,
3、步骤一,对原始未标注的源数据流进行行程切分,剔除gps超过5000个点的行程,
4、步骤二,使用transformer预训练模型进行训练,使用轨迹还原,事故行程预测的预训练任务训练至模型收敛,保存该自监督模型参数,提取模型最后4层的输出特征,将数层特征拼接到一起作为行程特征,
5、步骤三,将行程特征与行程所对应的车辆信息进行拼接,作为模型输入,使用全连接网络进行推理,输出一维驾驶行为得分,与人工专家打分或赔付相关信息进行比对,计算loss,反向传播优化模型参数,
6、步骤四,重复步骤二与步骤三至模型收敛。
7、优选的,所述步骤一具体包括以下步骤:
8、步骤101,将原始未标注的源数据进行归纳,并将其输入到预处理程序中,
9、步骤102,预处理程序能够对gps超过5000个点的行程进行剔除,得到数据库一,
10、步骤103,数据库一中的数据再次被预处理程序进行处理,将其切分成预定长度的数据点,以构成数据库二。
11、优选的,所述步骤103中,当切割后的数据长度小于预定长度时,使用0数据作为补充,以使得每段数据的长度均相同。
12、优选的,对数据库二中的数据随机抽取部分进行标记,标记完成后,将标记数据中的30%使用0数据进行替换,30%数据使用该形成均值进行替换,40%的数据不变。
13、优选的,抽取数据库中的50%-70%进行标记。
14、与现有技术相比,本发明的有益效果是:
15、本发明在实施的时候,通过对车辆行程数据的分析以及驾驶行为数据的分析,能够增加评估的准确性。
1.一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:
2.根据权利要求1所述的一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:所述步骤一具体包括以下步骤:
3.根据权利要求2所述的一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:所述步骤103中,当切割后的数据长度小于预定长度时,使用0数据作为补充,以使得每段数据的长度均相同。
4.根据权利要求2所述的一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:对数据库二中的数据随机抽取部分进行标记,标记完成后,将标记数据中的30%使用0数据进行替换,30%数据使用该形成均值进行替换,40%的数据不变。
5.根据权利要求4所述的一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:抽取数据库中的50%-70%进行标记。