一种在线任务的实时监控和自动处理方法与流程

文档序号:36407022发布日期:2023-12-16 15:16阅读:26来源:国知局
一种在线任务的实时监控和自动处理方法与流程

本发明涉及半导体,特别是涉及一种在线任务的实时监控和自动处理方法。


背景技术:

1、目前的流片(tape out)工作中发现,某些任务在运行的过程中会发生异常完成的现象,这些异常任务的状态被称之为完成异常(done-abnormally)。从队列里看这些任务已经运行完,但是从运行记录log中可以发现没有输出需要的数据,这些任务的运行时间runtime一般小于20sec。那就会导致相关联的任务会被待命在线上,导致工程师次日没法看到需要的结果。

2、通过查看异常任务的log可以推测出问题大概率和lsf有关,需要联系厂商来解决。但是由于公司目前没有继续采购lsf,导致没有厂商提供维护服务。且异常完成的现象会不定期的发生在不同的产品中,只能由工程师手动重新运行。如果是晚上或者tape out任务重期间频繁发生这种情况,会严重影响产品tape out周期。本着在不给公司增加额外开支且不增加工程师工作量的情况下,希望可以通过程序化语言来代替工程师及时的发现并解决问题,利用最少的资源将问题造成的影响降到最小。


技术实现思路

1、鉴于以上所述现有技术的缺点,本发明的目的在于提供一种在线任务的实时监控和自动处理方法,用于解决现有技术中从队列里看这些任务已经运行完,但是从运行记录log中发现没有输出需要的数据,导致工程师无法看到需要的结果的问题。

2、为实现上述目的及其他相关目的,本发明提供一种在线任务的实时监控和自动处理方法,至少包括:

3、步骤一、搜索过去运行时长在一小时内文件夹下生成的所有log;

4、步骤二、将搜索到的所有log逐个打开并逐行搜索关键词“successfullycompleted”;

5、步骤三、将搜索到所述关键词的log再次打开并逐行扫描读取运行时长runtime数据;并将运行时长runtime小于20sec的log的任务信息抓取出来;

6、步骤四、处理busb指令中所需要使用到的数值;

7、步骤五、判断测试程式recipe的类型;若异常完成的任务的测试程式recipe的类型是opc.drc,则只需要重新提交任务,不需要执行bkill指令;若异常完成的任务的测试程式recipe的类型是tdopc.drc或opcrp.drc,需要先清除线上对应的opc.drc或opcv.drc,再重新提交两支任务;

8、步骤六、若提交了两支任务,需从队列中抓取两支任务的id,使用bmod指令建立两支任务的依赖关系,以确定该两支任务的运行顺序。

9、优选地,步骤四中busb指令中所需要使用到的数值包括:calibre version、turbo、path。

10、优选地,步骤四中busb指令中所需要使用到的数值从运行时长runtime小于20sec的log中抓取,这些值经过排序处理,被编辑为提交任务所需要用到的busb指令。

11、优选地,在执行步骤一前,使用linux的crontab命令将程序设定为1小时执行一次,程序运行时,执行步骤一。

12、优选地,步骤三中搜索到所述关键词“successfully completed”的log表示对应的任务已在线上完成。

13、优选地,步骤三中运行时长runtime小于20sec的log为异常完成。

14、如上所述,本发明的在线任务的实时监控和自动处理方法,具有以下有益效果:本发明代替工程师实时监控处理任务运行情况,避免任务异常完成后得不到及时处理和长时间待命。提高流片效率,确保在预估时间内有效运行完任务。在此程序试用期间,异常完成的任务已经可以被重新提交至线上并顺利完成,避免了需要通过采购额外服务来解决根本问题从而造成的资源浪费。可以通过增加测试程式类型来适配更多任务。



技术特征:

1.一种在线任务的实时监控和自动处理方法,其特征在于,至少包括:

2.根据权利要求1所述的在线任务的实时监控和自动处理方法,其特征在于:步骤四中busb指令中所需要使用到的数值包括:calibre version、turbo、path。

3.根据权利要求2所述的在线任务的实时监控和自动处理方法,其特征在于:步骤四中busb指令中所需要使用到的数值从运行时长runtime小于20sec的log中抓取,这些值经过排序处理,被编辑为提交任务所需要用到的busb指令。

4.根据权利要求1所述的在线任务的实时监控和自动处理方法,其特征在于:在执行步骤一前,使用linux的crontab命令将程序设定为1小时执行一次,程序运行时,执行步骤一。

5.根据权利要求1所述的在线任务的实时监控和自动处理方法,其特征在于:步骤三中搜索到所述关键词“successfully completed”的log表示对应的任务已在线上完成。

6.根据权利要求1所述的在线任务的实时监控和自动处理方法,其特征在于:步骤三中运行时长runtime小于20sec的log为异常完成。


技术总结
本发明提供一种在线任务的实时监控和自动处理方法,搜索过去运行时长在一小时内文件夹下生成的所有Log;将搜索到的所有Log逐个打开并逐行搜索关键词“Successfully completed”;将搜索到所述关键词的Log再次打开并逐行扫描读取运行时长Runtime数据;并将运行时长Runtime小于20sec的Log的任务信息抓取出来;处理busb指令中所需要使用到的数值;判断测试程式Recipe的类型;若异常完成的任务的测试程式Recipe的类型是OPC.DRC,则只需要重新提交任务,不需要执行bkill指令;若异常完成的任务的测试程式Recipe的类型是TDOPC.DRC或OPCRP.DRC,需要先清除线上对应的OPC.DRC或OPCV.DRC,再重新提交两支任务;若提交了两支任务,需从队列中抓取两支任务的ID,使用bmod指令建立两支任务的依赖关系,以确定该两支任务的运行顺序。

技术研发人员:郝宇阳
受保护的技术使用者:上海华力集成电路制造有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1