一种结合变长自注意力机制与统计特征的风险评估方法与流程

文档序号:34539355发布日期:2023-06-27 14:59阅读:35来源:国知局
一种结合变长自注意力机制与统计特征的风险评估方法与流程

本发明属于计算机,具体为一种结合变长自注意力机制与统计特征的风险评估方法。


背景技术:

1、相同的驾驶行为对于不同的驾龄、车辆,可能带来不同的风险,单独的两个模型无法实现区分相同驾驶行为,不同人员车辆的属性特征带来的不同风险,或区分相同人员车辆的属性不同驾驶行为带来的不同风险。

2、现有技术中,大多是使用单纯轨迹数据或单纯统计特征与人员属性特征,对行车风险进行评估,但单纯轨迹数据较难提取长期统计特征与人员车辆的属性特征;单纯统计特征与人员属性特征难以细致刻画特定的客户画像。


技术实现思路

1、针对上述情况,为克服现有技术的缺陷,本发明提供一种结合变长自注意力机制与统计特征的风险评估方法,有效的解决了背景技术中的问题。

2、为实现上述目的,本发明提供如下技术方案:一种结合变长自注意力机制与统计特征的风险评估方法,包括以下步骤,

3、步骤一,对原始未标注的源数据流进行行程切分,剔除gps超过5000个点的行程,

4、步骤二,使用transformer预训练模型进行训练,使用轨迹还原,事故行程预测的预训练任务训练至模型收敛,保存该自监督模型参数,提取模型最后4层的输出特征,将数层特征拼接到一起作为行程特征,

5、步骤三,将行程特征与行程所对应的车辆信息进行拼接,作为模型输入,使用全连接网络进行推理,输出一维驾驶行为得分,与人工专家打分或赔付相关信息进行比对,计算loss,反向传播优化模型参数,

6、步骤四,重复步骤二与步骤三至模型收敛。

7、优选的,所述步骤一具体包括以下步骤:

8、步骤101,将原始未标注的源数据进行归纳,并将其输入到预处理程序中,

9、步骤102,预处理程序能够对gps超过5000个点的行程进行剔除,得到数据库一,

10、步骤103,数据库一中的数据再次被预处理程序进行处理,将其切分成预定长度的数据点,以构成数据库二。

11、优选的,所述步骤103中,当切割后的数据长度小于预定长度时,使用0数据作为补充,以使得每段数据的长度均相同。

12、优选的,对数据库二中的数据随机抽取部分进行标记,标记完成后,将标记数据中的30%使用0数据进行替换,30%数据使用该形成均值进行替换,40%的数据不变。

13、优选的,抽取数据库中的50%-70%进行标记。

14、与现有技术相比,本发明的有益效果是:

15、本发明在实施的时候,通过对车辆行程数据的分析以及驾驶行为数据的分析,能够增加评估的准确性。



技术特征:

1.一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:

2.根据权利要求1所述的一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:所述步骤一具体包括以下步骤:

3.根据权利要求2所述的一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:所述步骤103中,当切割后的数据长度小于预定长度时,使用0数据作为补充,以使得每段数据的长度均相同。

4.根据权利要求2所述的一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:对数据库二中的数据随机抽取部分进行标记,标记完成后,将标记数据中的30%使用0数据进行替换,30%数据使用该形成均值进行替换,40%的数据不变。

5.根据权利要求4所述的一种结合变长自注意力机制与统计特征的风险评估方法,其特征在于:抽取数据库中的50%-70%进行标记。


技术总结
本发明公开了一种结合变长自注意力机制与统计特征的风险评估方法,包括以下步骤,步骤一,对原始未标注的源数据流进行行程切分,剔除gps超过5000个点的行程,步骤二,使用transformer预训练模型进行训练,使用轨迹还原,事故行程预测的预训练任务训练至模型收敛,保存该自监督模型参数,提取模型最后4层的输出特征,将数层特征拼接到一起作为行程特征,步骤三,将行程特征与行程所对应的车辆信息进行拼接,作为模型输入,使用全连接网络进行推理,输出一维驾驶行为得分,与人工专家打分或赔付相关信息进行比对,计算loss,反向传播优化模型参数。本发明在实施的时候,通过对车辆行程数据的分析以及驾驶行为数据的分析,能够增加评估的准确性。

技术研发人员:鲁鑫
受保护的技术使用者:北京宏瓴科技发展有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1