应用程序接口确定方法、装置、计算机设备、存储介质与流程

文档序号:34143943发布日期:2023-05-13 14:53阅读:46来源:国知局
应用程序接口确定方法、装置、计算机设备、存储介质与流程

本公开涉及大数据数据处理,特别是涉及一种应用程序接口确定方法、装置、计算机设备、存储介质。


背景技术:

1、随着大数据的发展,出现了大量的api,如何挑选、推荐、组合api(applicationprogramming interface)服务成了一个难题。无论是服务挑选、服务组合还是服务推荐问题,在处理时都无法绕过将服务的信息向量化(即嵌入)。api服务本身的信息除了基础的参数等数值信息以外,还有功能描述类文本信息,文本信息在用于计算时,必须先表示为向量。计算一个准确的、能够反映api服务的功能信息的文本嵌入值有助于服务挑选、服务组合、服务推荐的工作。

2、然而,目前大部分api服务的功能描述文本中通常存在一些与功能无关的其他信息。如果直接使用文本嵌入的处理方法,则无法过滤到这些无关的信息。导致生成的文本嵌入值不准确,进而无法正确的找到符合要求的api服务。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够不受到文本中无关的信息影响,准确地生成文本嵌入值的应用程序接口确定方法、装置、计算机设备、存储介质。

2、第一方面,本公开提供了一种应用程序接口确定方法。所述方法包括:

3、获取多个待处理文本数据,所述待处理文本数据为应用程序接口的功能描述文本;

4、利用关键词提取算法确定每个所述待处理文本数据中的摘要;

5、利用预先训练完成的词向量模型对每个所述待处理文本数据的摘要进行处理,得到每个待处理文本数据中所述摘要的嵌入值;

6、根据每个待处理文本数据中所述摘要的嵌入值,确定目标应用程序接口。

7、在其中一个实施例中,所述利用关键词提取算法确定每个所述待处理文本数据中的摘要,包括:

8、将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值;

9、根据每个所述文本句的权重值,确定每个所述待处理文本数据的摘要。

10、在其中一个实施例中,所述将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值,包括:

11、响应于所述文本句中未存在代表词典中的代表词语,利用关键词提取算法计算每个所述文本句的第一权重值,其中,所述代表词典为与所述待处理文本对应的应用程序接口的功能类别相同的词典;所述代表词典的生成过程包括:根据多个功能类别对应的文本数据的第一常用词集合、每个功能类别对应的文本数据中第二常用词集合,确定每个功能类别对应的代表词典。

12、在其中一个实施例中,所述将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值,还包括:

13、响应于所述文本句中存在代表词典中的代表词语,利用关键词提取算法、所述代表词语和所述文本句的第一权重值,确定所述文本句的第二权重值。

14、在其中一个实施例中,所述利用关键词提取算法、所述代表词语和所述文本句的第一权重值,确定所述文本句的第二权重值,包括:

15、计算所述代表词语在所述文本句中的代表权重值;

16、将所述代表权重值与所述第一权重进行相加,确定所述文本句的第二权重值。

17、在其中一个实施例中,所述代表词典的生成过程进一步包括:

18、统计多个功能类别的应用程序接口的功能描述文本中的词语和每个词语对应的词频,确定多个功能类别对应的文本数据中第一常用词集合;

19、统计每个功能类别的应用程序接口的功能描述文本中的词语和每个词语对应的词频,确定每个功能类别对应的文本数据中第二常用词集合;

20、在所述第二常用词集合中删除与所述第一常用词集合中的相同的词语,得到每个功能类别对应的代表词典。

21、在其中一个实施例中,所述统计多个功能类别对应的文本数据中的词语和每个词语对应的词频,确定多个功能类别对应的文本数据中第一常用词集合之前,所述方法还包括:

22、删除多个功能类别的应用程序接口的功能描述文本中的停用词,其中,所述停用词包括:没有实际意义的词语。

23、在其中一个实施例中,所述利用关键词提取算法计算每个所述文本句的第一权重值,包括:

24、分别计算每个所述文本句之间的权重值;

25、响应于所述权重值大于预设的权重阈值,确定所述权重值对应的文本句之间的边;

26、根据每个所述文本句之间的权重值和所述文本句之间的边,确定每个所述文本句的第一权重值。

27、第二方面,本公开还提供了一种应用程序接口确定装置。所述装置包括:

28、数据获取模块,用于获取多个待处理文本数据,所述待处理文本数据为应用程序接口的功能描述文本;

29、摘要提取模块,用于利用关键词提取算法确定每个所述待处理文本数据中的摘要;

30、嵌入值计算模块,用于利用预先训练完成的词向量模型对每个所述待处理文本数据的摘要进行处理,得到每个待处理文本数据中所述摘要的嵌入值;

31、应用程序接口确定模块,用于根据每个待处理文本数据中所述摘要的嵌入值,确定目标应用程序接口。

32、在所述装置的其中一个实施例中,所述摘要提取模块,包括:权重值计算模块,用于将每个所述待处理文本数据划分为多个文本句,利用关键词提取算法确定每个所述文本句的权重值;

33、摘要确定模块,用于根据每个所述文本句的权重值,确定每个所述待处理文本数据的摘要。

34、在所述装置的其中一个实施例中,所述权重值计算模块包括:第一权重值计算模块,用于响应于所述文本句中未存在代表词典中的代表词语,利用关键词提取算法计算每个所述文本句的第一权重值,其中,所述代表词典为与所述待处理文本对应的应用程序接口的功能类别相同的词典;所述代表词典的生成过程包括:根据多个功能类别对应的文本数据的第一常用词集合、每个功能类别对应的文本数据中第二常用词集合,确定每个功能类别对应的代表词典。

35、在所述装置的其中一个实施例中,所述权重值计算模块还包括:第二权重值计算模块,用于响应于所述文本句中存在代表词典中的代表词语,利用关键词提取算法、所述代表词语和所述文本句的第一权重值,确定所述文本句的第二权重值。

36、在所述装置的其中一个实施例中,所述装置还包括所述第二权重值计算模块,包括:代表权重值计算模块,用于计算所述代表词语在所述文本句中的代表权重值;

37、权重值计算子模块,用于将所述代表权重值与所述第一权重进行相加,确定所述文本句的第二权重值。

38、在所述装置的其中一个实施例中,所述装置还包括:代表词典生成模块,用于统计多个功能类别的应用程序接口的功能描述文本中的词语和每个词语对应的词频,确定多个功能类别对应的文本数据中第一常用词集合;统计每个功能类别的应用程序接口的功能描述文本中的词语和每个词语对应的词频,确定每个功能类别对应的文本数据中第二常用词集合;在所述第二常用词集合中删除与所述第一常用词集合中的相同的词语,得到每个功能类别对应的代表词典。

39、在所述装置的其中一个实施例中,所述代表词典生成模块,还包括:停用词删除模块,用于删除多个功能类别的应用程序接口的功能描述文本中的停用词,其中,所述停用词包括:没有实际意义的词语。

40、在所述装置的其中一个实施例中,所述第一权重值计算模块,还用于分别计算每个所述文本句之间的权重值;响应于所述权重值大于预设的权重阈值,确定所述权重值对应的文本句之间的边;根据每个所述文本句之间的权重值和所述文本句之间的边,确定每个所述文本句的第一权重值。

41、第三方面,本公开还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一方法实施例的步骤。

42、第四方面,本公开还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法实施例的步骤。

43、第五方面,本公开还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一方法实施例的步骤。

44、上述各实施例中,用关键词提取算法确定每个应用程序接口的功能描述文本的摘要,能够精简功能描述文本的信息,并且能够确定比较简要且描述了每个应用程序接口所对应的功能的短文,能够将功能描述文本中的与功能无关的其他信息进行过滤,保留简要且重要的信息。使用预先训练的词向量模型对摘要进行处理,得到每个待处理文本数据中摘要的嵌入值,能够将摘要信息向量化,更好对摘要信息进行处理。并且使用嵌入值来对应用程序接口进行筛选,该嵌入值也不会受到无关信息的影响,能够准确的生成每个功能描述文本的摘要的嵌入值,后续在利用该嵌入值寻找api服务时,能够正确的找到符合要求的api服务。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1