搜索结果: 1-8 共查到“数据流聚类”相关记录8条 . 查询时间(0.289 秒)
针对分布式数据流聚类算法存在的聚类质量不高、通信代价大的问题,提出了密度和代表点聚类思想相结合的分布式数据流聚类算法。该算法的局部站点采用近邻传播聚类,引入了类簇代表点的概念来描述局部分布的概要信息,全局站点采用基于改进的密度聚类算法合并局部站点上传的概要数据结构进而获得全局模型。仿真实验结果表明,所提算法能明显提高分布式环境下数据流的聚类质量,同时算法使用类簇代表点能够发现不同形状的聚簇并显著降...
基于Squeezer 算法的文本数据流聚类
文本数据流 Squeezer算法 投影聚类
2014/10/8
为解决数据流聚类中的“链式数据”问题以及文本数据流存在的高维、稀疏、多主题问题, 以Squeezer 聚类算法为基础, 重新定义了聚类过程中类的质心、半径和判别距离. 提出了一种改进算法, 通过加入数据预处理环节来提高聚类精度, 通过投影聚类提高聚类效率并为簇赋予语义. 最后通过在互联网新闻语料的聚类实验, 表明了所提出的算法能够以较小的速度代价换来聚类效果的大幅提升, 性能显著优于Squeeze...
基于密度的混合属性数据流聚类算法
数据流 数据挖掘 聚类 混合属性
2014/9/15
数据流聚类分析是当前数据挖掘研究的热点问题。为了克服数据流聚类框架CluStream算法不能处理混合属性数据流的缺陷,提出了基于密度的混合属性数据流聚类算法MCStream。本文在微聚类中使用面向维度的距离来度量对象之间的相似度,在宏聚类中是使用改进的密度聚类算法M-DBSCAN来对微簇进行聚类。实验结果表明,MCStream算法能快速有效地处理混合属性数据流聚类问题。
基于相异度矩阵的混合属性数据流聚类算法
数据流 相异度 聚类
2009/7/16
数据流的聚类是数据流挖掘的一个重要问题。提出一种针对混合属性的数据流聚类算法,它采用相异度来代替普通的聚类距离,并将等价相异度矩阵引入聚类过程。基于真实数据集的实验表明该算法比基地同类算法具有更好的聚类性能。
基于移动网格和密度的数据流聚类算法
聚类 数据流 移动网格
2009/7/16
传统的基于网格的数据流聚类算法采用固定划分网格的方法,虽然算法的处理速度较快,但是聚类准确性较低。针对此问题,提出了一种新的基于移动网格和密度的数据流聚类算法。在算法中引进了权重与衰减系数,利用移动网格技术对数据流的边界点进行处理,增强了聚类的准确性,提高了算法的运行效率。
一种基于概率密度的数据流聚类算法
数据流 聚类 高斯混合模型
2008/12/24
数据流具有数据量无限且流速快等特点,使得传统的聚类算法不能直接应用于数据流聚类问题。针对该问题,提出了一种基于概率密度的数据流聚类算法。此方法不需要存储全部的历史数据,只需要存储新到达的数据并对其应用EM算法,利用高斯混合模型增量式地更新概率密度函数。实验表明,该算法对于解决数据流聚类问题非常有效。
基于滑动窗口的进化数据流聚类
2007/11/1
Chang JL, Cao F, Zhou AY. Clustering evolving data streams over sliding windows.
Journal of Software, 2007,18(4):905-918.DOI:
10.1360/jos180905 http://www.jos.org.cn/1000-9825/18/905.htm摘要
提出了纳...