技术编号:20619749
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明涉及序列采样技术领域,具体地说,涉及一种面向序列采样的样本代表性计算方法。背景技术所谓面向序列采样的样本代表性是指,从全序列中抽取一个子序列后,该子序列代表全序列程度的指标。该代表性可被用于自然语言处理(nlp)中的一些基础任务及其效果评估。现有方案一般只考虑采样数与总数的比例,没有考虑采样子序列的跨度及在全序列中的分布情况。即现有方案的代表性=采样比例=采样样本数/总数。即使在相同采样比例前提下,采样样本在原序列中的跨度大小及分布均匀程度不同,也会导致样本的代表性不同。发明内容本发明的目...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。