互联网数据量呈爆炸式增长,数据对社会生产和生活的影响越来越大,数据挖掘技术的应用也越来越广泛。数据挖掘过程是一个反复多次的人机交互过程,它包括定义问题、建立数据挖掘库、分析数据、准备数据、建立模型、评估模型等。主要的数据挖掘算法包括关联分析、序列模式挖掘、分类算法及聚类算法等。
据了解,WIMI微美全息开发了基于人工神经网络的数据挖掘聚类优化算法系统。在聚类分析中,数据按照一定的规则进行划分,数据划分为类后,使类之间的相似性较小,类内的相似性较大。数据分析结果不仅可以揭示数据之间的内在联系和差异,还可为进一步的数据分析和知识发现提供重要依据。
WIMI开发基于人工神经网络的数据挖掘聚类优化算法包含几下几种方法:
(1)分区方法:该方法可以找到球形互斥簇,簇的中心用均值或中心点表示。该算法适用于具有固定簇数和较小数据集的聚类问题。通过随机搜索策略,使得大规模数据聚类具有高效性和良好的可扩展性。分区聚类算法通常易于并行化,近年来在大数据处理平台上非常活跃。
(2)层次化方法:该方法基于层次分解聚类的思想,其根据数据点之间的相似性进行层次分解,生成具有层次结构的嵌套聚类树。自下而上的层次分解对应于凝聚法,自上而下的层次分解则对应于分裂法。
(3)基于密度的方法:该算法可以找到具有不同规则形状的聚类,而无需强制改变聚类的形状。它适用于不规则数量和随机形状的聚类,具有减少甚至消除噪声的优点。其将具有足够密度的区域划分为簇,并在有噪声的空间数据库中找到任意形状的簇,它根据采样点的局部密度,将簇定义为具有连接密度的最大点集合。
(4)基于网格的方法:该算法将量化的网格空间聚类,速度快,计算能力强。将空间划分为多个网格,并对网格上的数据进行分析。
(5)模型聚类:模型聚类算法假设数据是根据特定的概率分布混合的,该概率分布致力于在数据和给定模型之间找到最佳拟合。
在这个海量数据的时代,数据挖掘极其重要,其应用越来越广泛,其重要性也越来越明显。只要企业拥有具有分析价值和需求的数据仓库或数据库,就可以进行有目的的数据挖掘,获取有价值的数据。
而聚类优化算法可处理具有多维和不相关特征的数据,聚类方法的选择直接决定了数据挖掘的质量。为了提高聚类的质量,人们不断探索更好的聚类分析方法。
WIMI开发的基于人工神经网络的数据挖掘聚类优化算法可以根据预设的警告值自动合并粒度较小的聚类结果,从而有效地防止了由于指定的聚类数过多而导致的不合理聚类结果的发生。人工神经网络具有高度非线性学习能力和对噪声数据的容错能力,并且其具有很强的提取规则知识的能力,利用人工神经网络模型来处理数据和挖掘知识具有非常明显的优越性。