本申请涉及数据处理,尤其涉及一种数据筛选方法、装置、计算机设备及存储介质。
背景技术:
1、目前常见的编码器通用测试集主要来源于两个渠道,一是标准测试集,例如高效率视频编码(high efficiency video coding,hevc)标准测试集;二是编码器大赛各个赛道所用到的测试集。
2、上述提到的几个测试集,确实是非常专业且全面的,可以很好的对一个编码器性能进行合理的评估,但是商用自研编码器更多的服务于各家平台自己的数据,例如用户生成内容(user generated content,ugc)数据。此时,对编码器的优化测试强烈依赖于平台自身生产的数据,而上述提到的两种测试集不能很好的反应平台自身数据的特点。因此,如何更好地筛选编码器性能测试的数据集非常重要。
技术实现思路
1、本申请实施例提供了一种数据筛选方法、装置、计算机设备及存储介质,可以提高数据筛选的准确性和灵活性,有助于更好地满足不同编码器的数据需求。
2、第一方面,本申请实施例提供了一种数据筛选方法,包括:
3、获取数据获取请求,所述数据获取请求包括数据获取需求信息;
4、响应所述数据获取请求,从目标数据库中获取多个数据,并计算所述多个数据的时域复杂度与空域复杂度的对应关系;
5、根据所述多个数据的时域复杂度与空域复杂度的对应关系,对所述多个数据的时空域复杂度进行分区,得到多个区域;
6、根据各个区域中的数据数量从所述各个区域中筛选出与所述数据获取需求信息相匹配的目标数据。
7、第二方面,本申请实施例提供了一种数据筛选装置,包括:
8、获取单元,用于获取数据获取请求,所述数据获取请求包括数据获取需求信息;
9、计算单元,用于响应所述数据获取请求,从目标数据库中获取多个数据,并计算所述多个数据的时域复杂度与空域复杂度的对应关系;
10、分区单元,用于根据所述多个数据的时域复杂度与空域复杂度的对应关系,对所述多个数据的时空域复杂度进行分区,得到多个区域;
11、筛选单元,用于根据各个区域中的数据数量从所述各个区域中筛选出与所述数据获取需求信息相匹配的目标数据。
12、第三方面,本申请实施例提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述处理器用于执行上述第一方面所述的方法。
13、第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有程序指令,该程序指令被执行时实现上述第一方面所述的方法。
14、本申请实施例可以获取数据获取请求,该数据获取请求包括数据获取需求信息;响应该数据获取请求,从目标数据库中获取多个数据,并计算该多个数据的时域复杂度与空域复杂度的对应关系;根据该多个数据的时域复杂度与空域复杂度的对应关系,对该多个数据的时空域复杂度进行分区,得到多个区域;根据各个区域中的数据数量从各个区域中筛选出与该数据获取需求信息相匹配的目标数据。通过这种方式,可以提高数据筛选的准确性和灵活性,有助于更好地满足不同编码器的数据需求。
1.一种数据筛选方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述数据获取需求信息包括数据需求数量、数据分辨率和数据时长;所述响应所述数据获取请求,从目标数据库中获取多个数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个数据的时域复杂度与空域复杂度的对应关系,对所述多个数据的时空域复杂度进行分区,得到多个区域,包括:
4.根据权利要求3所述的方法,其特征在于,所述多个区域中的每个区域包括多个子区域;所述根据各个区域中的数据数量从所述各个区域中筛选出与所述数据获取需求信息相匹配的目标数据,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述每个区域对应的各个子区域中包括的数据的第一数量、所述数据需求数量以及从所述目标数据库中获取的数据的第二数量,从所述每个区域中筛选出与所述数据获取需求信息相匹配的目标数据,包括:
6.根据权利要求5所述的方法,其特征在于,所述数据获取需求还包括数据内容需求;所述从所述各个子区域中筛选出与对应的第三数量相匹配的数据,包括:
7.根据权利要求5所述的方法,其特征在于,所述根据所述每个区域对应的各个子区域中包括的数据的第一数量、所述数据需求数量以及从所述目标数据库中获取的数据的第二数量,确定从各个子区域筛选的数据的第三数量,包括:
8.一种数据筛选装置,其特征在于,包括:
9.一种计算机设备,其特征在于,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,该程序指令被执行时实现如权利要求1-7任一项所述的方法。