无监督分类
Ⅰ (ArcGIS高手进)用ArcGIS进行非监督分类
http://wenku..com/view/7d7402b065ce050876321311.html
这个有,我刚试过了,可以。
Ⅱ 无监督学习比如简单的聚类分析真的是“学习”吗
聚类通过把目标数据放入少数相对同源的组或“类”(cluster)里。分析表达数据,(1)通过一系列的检测将待测的一组基因的变异标准化,然后成对比较线性协方差。(2)通过把用最紧密关联的谱来放基因进行样本聚类,例如用简单的层级聚类(hierarchicalclustering)方法。这种聚类亦可扩展到每个实验样本,利用一组基因总的线性相关进行聚类。(3)多维等级分析(,MDS)是一种在二维Euclidean“距离”中显示实验样本相关的大约程度。(4)K-means方法聚类,通过重复再分配类成员来使“类”内分散度最小化的方法。聚类方法有两个显著的局限:首先,要聚类结果要明确就需分离度很好(well-separated)的数据。几乎所有现存的算法都是从互相区别的不重叠的类数据中产生同样的聚类。但是,如果类是扩散且互相渗透,那么每种算法的的结果将有点不同。结果,每种算法界定的边界不清,每种聚类算法得到各自的最适结果,每个数据部分将产生单一的信息。为解释因不同算法使同样数据产生不同结果,必须注意判断不同的方式。对遗传学家来说,正确解释来自任一算法的聚类内容的实际结果是困难的(特别是边界)。最终,将需要经验可信度通过序列比较来指导聚类解释。第二个局限由线性相关产生。上述的所有聚类方法分析的仅是简单的一对一的关系。因为只是成对的线性比较,大大减少发现表达类型关系的计算量,但忽视了生物系统多因素和非线性的特点。从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。聚类是观察式学习,而不是示例式的学习。从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。就数据挖掘功能而言,聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他数据挖掘任务(如分类、关联规则)的预处理步骤。数据挖掘领域主要研究面向大型数据库、数据仓库的高效实用的聚类分析算法。聚类分析是数据挖掘中的一个很活跃的研究领域,并提出了许多聚类算法。这些算法可以被分为划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法。1划分方法(PAM:PArtitioningmethod)首先创建k个划分,k为要创建的划分个数;然后利用一个循环定位技术通过将对象从一个划分移到另一个划分来帮助改善划分质量。典型的划分方法包括:k-means,k-medoids,CLARA(ClusteringLARgeApplication),CLARANS().FCM2层次方法(hierarchicalmethod)创建一个层次以分解给定的数据集。该方法可以分为自上而下(分解)和自下而上(合并)两种操作方式。为弥补分解与合并的不足,层次合并经常要与其它聚类方法相结合,如循环定位。典型的这类方法包括:第一个是;BIRCH()方法,它首先利用树的结构对对象集进行划分;然后再利用其它聚类方法对这些聚类进行优化。第二个是CURE()方法,它利用固定数目代表对象来表示相应聚类;然后对各聚类按照指定量(向聚类中心)进行收缩。第三个是ROCK方法,它利用聚类间的连接进行聚类合并。最后一个CHEMALOEN,它则是在层次聚类时构造动态模型。3基于密度方法,根据密度完成对象的聚类。它根据对象周围的密度(如DBSCAN)不断增长聚类。典型的基于密度方法包括:DBSCAN(Densit-):该算法通过不断生长足够高密度区域来进行聚类;它能从含有噪声的空间数据库中发现任意形状的聚类。此方法将一个聚类定义为一组“密度连接”的点集。OPTICS():并不明确产生一个聚类,而是为自动交互的聚类分析计算出一个增强聚类顺序。。4基于网格方法,首先将对象空间划分为有限个单元以构成网格结构;然后利用网格结构完成聚类。STING(STatisticalINformationGrid)就是一个利用网格单元保存的统计信息进行基于网格聚类的方法。CLIQUE(ClusteringInQUEst)和Wave-Cluster则是一个将基于网格与基于密度相结合的方法。5基于模型方法,它假设每个聚类的模型并发现适合相应模型的数据。典型的基于模型方法包括:统计方法COBWEB:是一个常用的且简单的增量式概念聚类方法。它的输入对象是采用符号量(属性-值)对来加以描述的。采用分类树的形式来创建一个层次聚类。CLASSIT是COBWEB的另一个版本.。它可以对连续取值属性进行增量式聚类。它为每个结点中的每个属性保存相应的连续正态分布(均值与方差);并利用一个改进的分类能力描述方法,即不象COBWEB那样计算离散属性(取值)和而是对连续属性求积分。但是CLASSIT方法也存在与COBWEB类似的问题。因此它们都不适合对大数据库进行聚类处理.
Ⅲ 什么是监督分类什么是非监督分类
中文名称:监督分类 英文名称:supervised classification 定义1:根据已知训练区提供的样本,通过计算选择特征参数,建立判别函数以对各待分类影像进行的图像分类。 应用学科:测绘学(一级学科);摄影测量与遥感学(二级学科) 定义2:在遥感影像的计算机分类过程中,采用一定数量的影像分类标准样板,作为计算机分类的训练基准的技术,即一种有已知类别标准的分类方法,或具有先验知识的分类方法。 应用学科:地理学(一级学科);遥感应用(二级学科)
监督分类 (supervised classification)又称训练场地法,是以建立统计识别函数为理论基础,依据典型样本训练方法进行分类的技术。即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对各待分类影像进行的图像分类,是模式识别的一种方法。要求训练区域具有典型性和代表性。判别准则若满足分类精度要求,则此准则成立;反之,需重新建立分类的决策规则,直至满足分类精度要求为止。常用算法有:判别分析、最大似然分析、特征分析、序贯分析和图形识别等。
中文名称:非监督分类 英文名称:unsupervised classification 定义1:以不同影像地物在特征空间中类别特征的差别为依据的一种无先验类别标准的图像分类。 应用学科:测绘学(一级学科);摄影测量与遥感学(二级学科) 定义2:在遥感影像的计算机分类过程中,无需采用训练样板的分类技术,或没有先验知识的分类方法。 应用学科:地理学(一级学科);遥感应用(二级学科)
非监督分类 (Unsupervised Classification ) 是以不同影像地物在特征空间中类别特征的差别为依据的一种无先验(已知)类别标准的图像分类,是以集群为理论基础,通过计算机对图像进行集聚统计分析的方法。根据待分类样本特征参数的统计特征,建立决策规则来进行分类。而不需事先知道类别特征。把各样本的空间分布按其相似性分割或合并成一群集,每一群集代表的地物类别,需经实地调查或与已知类型的地物加以比较才能确定。是模式识别的一种方法。一般算法有:回归分析、趋势分析、等混合距离法、集群分析、主成分分析和图形识别等。希望您帮到你
Ⅳ 做监督分类时需要做精度评价。非监督分类需要做精度评价吗求解释!!
非监督分类也要做精度评估,不然做出来的图像精度不高,分类精度评估是将专题分类图像版中的特定像权元与已知分类的参考像元进行比较,实际工作中常常是将分类数据与地面真值、先前的试验地图、航空相片或其它数据进行对比的途径之一。
Ⅳ 什么是监督分类和非监督分类
监督分类又称训练场地法、训练分类法,是以建立统计识别函数为理论基础、依据典型样本训练方法进行分类的技术,即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对各待分类影像进行的图像分类。
非监督分类是以不同影像地物在特征空间中类别特征的差别为依据的一种无先验类别标准的图像分类,是以集群为理论基础,通过计算机对图像进行集聚统计分析的方法。根据待分类样本特征参数的统计特征,建立决策规则来进行分类。
(5)无监督分类扩展阅读
监督分类的主要优点如下:
(1)可根据应用目的和区域,充分利用先验知识,有选择地决定分类类别,避免出现不必要的类别;
(2)可控制训练样本的选择;
(3)可通过反复检验训练样本,来提高分类精度,避免分类严重错误;
(4)避免了非监督分类中对光谱集群组的重新归类。
缺点如下:
(1)其分类系统的确定、训练样本的选择,均人为主观因素较强,分析者定义的类别有可能并不是图像中存在的自然类别,导致各类别间可能出现重叠;分析者所选择的训练样本也可能并不代表图像中的真实情形;
(2)由于图像中同一类别的光谱差异,造成训练样本没有很好的代表性;
(3)训练样本的选取和评估需花费较多的人力、时间;
(4)只能识别训练样本中所定义的类别,若某类别由于训练者不知道或者其数量太少未被定义,则监督分类不能识别。
Ⅵ 监督分类和非监督分类的研究现状
非监督分类是指人们事先对分类过程不施加任何的先验知识,而仅凭数据(遥感影像地物的光谱特征的分布规律),即自然聚类的特性,进行“盲目”的分类;其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性,亦即:非监督分类只能把样本区分为若干类别,而不能给出样本的描述;其类别的属性是通过分类结束后目视判读或实地调查确定的。非监督分类也称聚类分析。一般的聚类算法是先选择若干个模式点作为聚类的中心。每一中心代表一个类别,按照某种相似性度量方法(如最小距离方法)将各模式归于各聚类中心所代表的类别,形成初始分类。然后由聚类准则判断初始分类是否合理,如果不合理就修改分类,如此反复迭代运算,直到合理为止。与监督法的先学习后分类不同,非监督法是边学习边分类,通过学习找到相同的类别,然后将该类与其它类区分开,但是非监督法与监督法都是以图像的灰度为基础。通过统计计算一些特征参数,如均值,协方差等进行分类的。所以也有一些共性。
Ⅶ 什么是监督分类和非监督分类
监督分类 (supervised classification)又称训练场地法,是以建立统计识别函数为理论基础,依据典型样本训练方法进行分类的技术。即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对各待分类影像进行的图像分类,是模式识别的一种方法。要求训练区域具有典型性和代表性。判别准则若满足分类精度要求,则此准则成立;反之,需重新建立分类的决策规则,直至满足分类精度要求为止。常用算法有:判别分析、最大似然分析、特征分析、序贯分析和图形识别等。
非监督分类是以不同影像地物在特征空间中类别特征的差别为依据的一种无先验(已知)类别标准的图像分类,是以集群为理论基础,通过计算机对图像进行集聚统计分析的方法。根据待分类样本特征参数的统计特征,建立决策规则来进行分类。而不需事先知道类别特征。把各样本的空间分布按其相似性分割或合并成一群集,每一群集代表的地物类别,需经实地调查或与已知类型的地物加以比较才能确定。是模式识别的一种方法。一般算法有:回归分析、趋势分析、等混合距离法、集群分析、主成分分析和图形识别等。
Ⅷ 遥感:监督分类与非监督分类的区别
非监督分类运用1SODATA(Iterative Self-Organizing Data Analysis Technique )算法,完全按照像元的光谱特性进行统计分类,常常用于对分类区没有什么了解的情况。使用该方法时。原始图像的所有波段都参于分类运算,分类结果往往是各类像元数大体等比例。由于人为干预较少,非监督分类过程的自动化程度较高。非监督分类一般要经过以下几个步骤:初始分类、专题判别、分类合并、色彩确定、分类后处理、色彩重定义、栅格矢量转换、统计分析。
监督分类比非监督分类更多地要求用户来控制,常用于对研究区域比较了解的情况。在监督分类过程中,首先选择可以识别或者借助其它信息可以断定其类型的像元建立模板,然后基于该模板使计算机系统自动识别具有相同特性的像元。对分类结果进行评价后再对模板进行修改,多次反复后建立一个比较准确的模板,并在此基础上最终进行分类。监督分类一般要经过以下几个步骤:建立模板(训练样本)、评价模板、确定初步分类图、检验分类结果、分类后处理、分类特征统计、栅格矢量转换。
上面的这段话是我们遥感实验手册上的话, 我自我感觉在用ERDAS 8.6 时候 ,对监督分类和非监督分类的区别才有了深刻点的理解,简单的说监督分类是我们人为地选择好样本区 比如水体,植被 ,就像是告诉计算机“我圈起来的这种像素就代表水体噢”,这个对个人经验要求很高,很容易把有的颜色混淆,以至于少分几类,而非监督分类就是计算机自己将图像上的像元按像素分几类,一般如果你最后是要分成水体,植被,土地等几类,但是你设置的起码最初要分它的两倍,因为计算机识别的时候有可能有的最终可以归到一类,但是计算机不会知道它分类每一类代表什么,这个就要人为地输入每一类地物的名称。
[email protected] 如果你需要这方面的实验指导书就找我吧
Ⅸ 实验十八 遥感图像非监督分类处理
一、实验目的
通过使用ENVI的两种遥感非监督分类器——IsoData非监督分类和K-Means非监督分类命令,加深对遥感非监督分类原理和对地质应用的理解,了解其技术实现过程,初步掌握其ENVI功能命令的基本使用操作。
二、实验内容
①桂林市TM 遥感影像数据IsoData非监督分类;②桂林市TM 遥感影像数据KMeans非监督分类;③IsoData非监督分类与K-Means非监督分类效果比较分析。
三、实验要求
(①预习ISODATA和K-Means两种算法原理;②掌握ISODATA和K-Means分类处理的基本操作;③对两种分类结果进行比较分析;④编写实验报告。
四、技术条件
①微型计算机;②桂林市TM 遥感影像数据;③ENVI软件;④Photoshop软件(ver.6.0以上)和ACDSee软件(ver.4.0以上)。
五、实验步骤
非监督分类是根据图像数据的本身统计特征及点群的情况,从纯统计学的角度对图像数据进行类别划分。非监督分类不需要事先给定类别,由图像数据的统计特征来决定,即同类地物在相同的成像条件下具有相同或相近的光谱特征(如DN 值),归属于同一个光谱空间区域;不同地物由于光谱信息特征不同,归属于不同的光谱空间区域。
非监督分类一般可分为四个步骤:执行非监督分类、类别定义、合并子类和评价结果。
(一)执行非监督分类
ENVI有ISODATA和K-Means两种非监督分类方法。
1.ISODATA非监督分类
ISODATA(iterative self-organizing data analysis technique)属于聚类分析方法。是按照像元之间的联系程度(亲疏程度)来进行归类的一种多元统计分析方法。ISODATA非监督分类计算数据空间中均匀分布的类均值,然后用最小距离技术将剩余像元迭代聚集,每次迭代都重新计算均值,且根据所得的新均值,对像元进行再分类。具体操作步骤如下:
在ENVI主菜单栏中选择“Classification>Unsupervised>ISODATA”,在“Classificatoin Input File”对话框中选择待分类遥感影像,打开“ISODATA Parameters”对话框,如图18-1所示。
图18-1 ISODATA参数对话框
对图18-1中的参数进行如下说明:
(1) Number of Classes:类数范围(最小值和最大值),一般输入最小数量不能小于最终分类数量,最大数量为最终分类数量的2~3倍。
(2) Maximum Iterations:最大迭代次数值,迭代次数越大,得到的结果越精确。
(3) Change Threshold%(0~100):变化阈值(0~100%),当每一类的变换像元数小于阈值时,结束迭代过程,该值越小得到的结果越精确。
(4) Minimum #Pixel in Class:形成一类需要的最少像元数,如果某一类中的像元数少于最少像元数,该类将被删除,其中的像元被归并到距离最近的类中。
(5) Maximum Class Stdv:最大分类标准差,以像素值为单位,如果某一类的标准差比该阈值大,该类将被拆分成两类。
(6) Minimum Class Distance:类均值之间的最小距离,如果类均值之间的距离小于输入的最小值,则这一类就会被合并。
(7) Maximum #Merge Pairs:合并成对的最大数。
(8)Maximum Stdev From Mean:距离类别均值的最大标准差,为可选项,筛选小于这个标准差的像元参与分类。
(9) Maximum Distance Error:允许的最大距离误差,为可选项,筛选小于这个最大距离误差的像元参与分类。
(10)选择输出路径及文件名,单击【OK】按钮,执行ISODATA非监督分类。
2.K-Means非监督分类
K-Means算法接受输入量K;然后将n个数据对象划分为K个聚类以便使所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。具体操作步骤如下:
在ENVI主菜单栏中选择“Classification>Unsupervised>K-Means”,在“Classification Input File”对话框中选择待分类遥感影像,打开“K-Means Parameters”对话框,如图18-2所示。
图18-2 K-Means分类器参数设置对话框
(1) Number of Classes:分类数量,一般输入为最终分类数量的2~3倍。
(2) Maximum Iterations:最大迭代次数值,迭代次数越大,得到的结果越精确。
(3) Maximum Stdev From Mean:距离类别均值的最大标准差,为可选项,筛选小于这个标准差的像元参与分类。
(4) Maximum Distance Error:允许的最大距离误差,为可选项,筛选小于这个最大距离误差的像元参与分类。
(5)选择输出路径及文件名,单击【OK】按钮,执行K-Means非监督分类。
(二)定义类别与子类合并
执行非监督分类后,得到的只是一个初步的分类结果,需要进行类别定义域合并子类的操作。
1.类别定义
类别定义的根据可以通过更高分辨率图像上目视解译获得,也可以通过野外实地调查获得。
(1)打开分类图像即灌阳地区QuickBird遥感数据,并使之显示在“Display”中。
(2)在分类图像的主窗口中,选择“Overlay>Classification”,在“Interactive Class Tool Input File”对话框中选择非监督分类结果,单击【OK】按钮打开“Interactive Class Tool”对话框,如图18-3所示。
图18-3 交互式分类工具对话框
(3)在“Interactive Class Tool”对话框中,勾选类别前面的“On”选择框,就能将此类结果叠加显示在“Display”分类图像窗口上,识别此分类类别。
(4)在“Interactive Class Tool”对话框中,选择“Options>Edit Class Colors/Names”,打开“Class Color Map Editing”对话框,如图18-4所示。
在“Class Color Map Editnig”对话框中,选择对应的类别,在“Class Name”中输入重新定义的类别名称,同时可以修改此类别显示的颜色,修改后点击【OK】按钮完成修改。
(5)重复步骤(3)~步骤(4),定义其他类别。
(6)完成各类别定义后,在“Interactive Class Tool”对话框中,选择“File>Save Change to File”,保存修改结果。
2.合并子类
在选择非监督分类类别数量时,一般选择为最终分类数量的2~3倍,因此在定义类别之后,需要将相同类别合并。
(1)在 ENVI 主菜单栏中,选择“Classification > Post Classification > Combine Classes”,在“Combine Classes Input File”对话框中选择定义好的分类结果,单击【OK】按钮打开“Combine Classes Parameters”对话框(图18-5)。
图18-4 编辑分类名称和颜色对话框
图18-5 分类类别的合并对话框
(2)在“Combine Classes Parameters”对话框中,从“Select Input Class”中选择合并的类别,从“Select Output Class”中选择并入的类别,单击【Add Combination】按钮添加到合并方案中,合并方案显示在“Combine Classes”列表中。
(3)合并方案确定后,点击【OK】按钮,打开“Combine Classes output”对话框,在“Remove Empty Classes”选项中选择“Yes”,将无用类移除。
(4)选择输出合并结果路径及文件夹名,点击【OK】按钮,执行合并子类。
(三)分类后处理和评价分类结果
分类后处理和评价分类结果的方法同监督分类一样,可参考实验十七中的“遥感影像监督分类”。
完成遥感影像非监督分类后,分别利用ISODATA 和K-Means非监督分类方法对灌阳地区QuickBird遥感影像进行非监督分类处理,利用混淆矩阵对两种分类结果进行评价,得出总体分类精度和Kappa系数。比较两种分类结果,用W ORD文件记录,取名为《灌阳地区QuickBird遥感影像两种非监督分类方法分类结果评价》,存入自己的工作文件夹。
六、实验报告
(1)简述实验过程。
(2)回答问题:①根据实验操作步骤及各步骤之间的关系,分析两种非监督分类方法具有的共同特点。②通过目视解译定性比较两种非监督分类方法的效果。
实验报告格式见附录一。