技术总结
本发明涉及一种快速精确的粒球近邻分类算法,属于计算机技术领域。该算法使用被查询点到少量粒球的距离来替代样本点之间的距离的直接计算,使得该算法的时间复杂度可以保持在近邻线性,即O(n),远小于现有的精确k最近邻算法。粒球近邻分类算法不需要进行k值的选择,这是现有k近邻算法所没有的特点。粒球近邻分类算法能够保留产生分类边界,从而有效地处理现有k最近邻算法在不平衡数据集精度失效的问题,获得了比现有k最近邻算法更好的精度。另外,相比现有基于树的精确最近邻算法,GBkNN算法不依赖任何树索引结构,所以能够更高效地处理高维数据,并且仍然保留了现有最近邻查询算法的优势:在线,多分类,不依赖训练等。
技术研发人员:夏书银
受保护的技术使用者:重庆邮电大学
文档号码:201611168229
技术研发日:2016.12.16
技术公布日:2017.05.31