Posted on 2005-12-16 17:26
inwind 阅读(72)
评论(0) 编辑 收藏 引用
今天又开了一下午的会议,boss提出了一个很新颖的想法
因为当前的分类和聚类的实验,都是基于封闭或者半封闭的数据集,并且数据集是比较规整的,在向量空间上是不均匀的,即有利于划分的。
虽然,特征提取就是为了选择可以划分的向量,但是考虑到网络上的海量数据,测验的结果和封闭测试的可能悬殊很大。
基于这样的考虑,考虑使用多个分类或者聚类策略(这里使用策略一词,包括不同的特征选择策略的侧重,例如地点,时间等,也包括分类/聚类算法的选择,M-ray策略的选择等等),最后把每个分类/聚类算法的结果,以向量的形式给出,联成一个新的大向量,然后依次作分类/聚类。
这种思想是很新鲜的,但是,同样,当前的分类,聚类算法,比较复杂的也有将各种特征,进行分别提取和不同权值,产生了不错的效果。两种策略的比较,还需要实验来确定哦