無監督分類
Ⅰ (ArcGIS高手進)用ArcGIS進行非監督分類
http://wenku..com/view/7d7402b065ce050876321311.html
這個有,我剛試過了,可以。
Ⅱ 無監督學習比如簡單的聚類分析真的是「學習」嗎
聚類通過把目標數據放入少數相對同源的組或「類」(cluster)里。分析表達數據,(1)通過一系列的檢測將待測的一組基因的變異標准化,然後成對比較線性協方差。(2)通過把用最緊密關聯的譜來放基因進行樣本聚類,例如用簡單的層級聚類(hierarchicalclustering)方法。這種聚類亦可擴展到每個實驗樣本,利用一組基因總的線性相關進行聚類。(3)多維等級分析(,MDS)是一種在二維Euclidean「距離」中顯示實驗樣本相關的大約程度。(4)K-means方法聚類,通過重復再分配類成員來使「類」內分散度最小化的方法。聚類方法有兩個顯著的局限:首先,要聚類結果要明確就需分離度很好(well-separated)的數據。幾乎所有現存的演算法都是從互相區別的不重疊的類數據中產生同樣的聚類。但是,如果類是擴散且互相滲透,那麼每種演算法的的結果將有點不同。結果,每種演算法界定的邊界不清,每種聚類演算法得到各自的最適結果,每個數據部分將產生單一的信息。為解釋因不同演算法使同樣數據產生不同結果,必須注意判斷不同的方式。對遺傳學家來說,正確解釋來自任一演算法的聚類內容的實際結果是困難的(特別是邊界)。最終,將需要經驗可信度通過序列比較來指導聚類解釋。第二個局限由線性相關產生。上述的所有聚類方法分析的僅是簡單的一對一的關系。因為只是成對的線性比較,大大減少發現表達類型關系的計算量,但忽視了生物系統多因素和非線性的特點。從統計學的觀點看,聚類分析是通過數據建模簡化數據的一種方法。傳統的統計聚類分析方法包括系統聚類法、分解法、加入法、動態聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。採用k-均值、k-中心點等演算法的聚類分析工具已被加入到許多著名的統計分析軟體包中,如SPSS、SAS等。從機器學習的角度講,簇相當於隱藏模式。聚類是搜索簇的無監督學習過程。與分類不同,無監督學習不依賴預先定義的類或帶類標記的訓練實例,需要由聚類學習演算法自動確定標記,而分類學習的實例或數據對象有類別標記。聚類是觀察式學習,而不是示例式的學習。從實際應用的角度看,聚類分析是數據挖掘的主要任務之一。就數據挖掘功能而言,聚類能夠作為一個獨立的工具獲得數據的分布狀況,觀察每一簇數據的特徵,集中對特定的聚簇集合作進一步地分析。聚類分析還可以作為其他數據挖掘任務(如分類、關聯規則)的預處理步驟。數據挖掘領域主要研究面向大型資料庫、數據倉庫的高效實用的聚類分析演算法。聚類分析是數據挖掘中的一個很活躍的研究領域,並提出了許多聚類演算法。這些演算法可以被分為劃分方法、層次方法、基於密度方法、基於網格方法和基於模型方法。1劃分方法(PAM:PArtitioningmethod)首先創建k個劃分,k為要創建的劃分個數;然後利用一個循環定位技術通過將對象從一個劃分移到另一個劃分來幫助改善劃分質量。典型的劃分方法包括:k-means,k-medoids,CLARA(ClusteringLARgeApplication),CLARANS().FCM2層次方法(hierarchicalmethod)創建一個層次以分解給定的數據集。該方法可以分為自上而下(分解)和自下而上(合並)兩種操作方式。為彌補分解與合並的不足,層次合並經常要與其它聚類方法相結合,如循環定位。典型的這類方法包括:第一個是;BIRCH()方法,它首先利用樹的結構對對象集進行劃分;然後再利用其它聚類方法對這些聚類進行優化。第二個是CURE()方法,它利用固定數目代表對象來表示相應聚類;然後對各聚類按照指定量(向聚類中心)進行收縮。第三個是ROCK方法,它利用聚類間的連接進行聚類合並。最後一個CHEMALOEN,它則是在層次聚類時構造動態模型。3基於密度方法,根據密度完成對象的聚類。它根據對象周圍的密度(如DBSCAN)不斷增長聚類。典型的基於密度方法包括:DBSCAN(Densit-):該演算法通過不斷生長足夠高密度區域來進行聚類;它能從含有雜訊的空間資料庫中發現任意形狀的聚類。此方法將一個聚類定義為一組「密度連接」的點集。OPTICS():並不明確產生一個聚類,而是為自動交互的聚類分析計算出一個增強聚類順序。。4基於網格方法,首先將對象空間劃分為有限個單元以構成網格結構;然後利用網格結構完成聚類。STING(STatisticalINformationGrid)就是一個利用網格單元保存的統計信息進行基於網格聚類的方法。CLIQUE(ClusteringInQUEst)和Wave-Cluster則是一個將基於網格與基於密度相結合的方法。5基於模型方法,它假設每個聚類的模型並發現適合相應模型的數據。典型的基於模型方法包括:統計方法COBWEB:是一個常用的且簡單的增量式概念聚類方法。它的輸入對象是採用符號量(屬性-值)對來加以描述的。採用分類樹的形式來創建一個層次聚類。CLASSIT是COBWEB的另一個版本.。它可以對連續取值屬性進行增量式聚類。它為每個結點中的每個屬性保存相應的連續正態分布(均值與方差);並利用一個改進的分類能力描述方法,即不象COBWEB那樣計算離散屬性(取值)和而是對連續屬性求積分。但是CLASSIT方法也存在與COBWEB類似的問題。因此它們都不適合對大資料庫進行聚類處理.
Ⅲ 什麼是監督分類什麼是非監督分類
中文名稱:監督分類 英文名稱:supervised classification 定義1:根據已知訓練區提供的樣本,通過計算選擇特徵參數,建立判別函數以對各待分類影像進行的圖像分類。 應用學科:測繪學(一級學科);攝影測量與遙感學(二級學科) 定義2:在遙感影像的計算機分類過程中,採用一定數量的影像分類標准樣板,作為計算機分類的訓練基準的技術,即一種有已知類別標準的分類方法,或具有先驗知識的分類方法。 應用學科:地理學(一級學科);遙感應用(二級學科)
監督分類 (supervised classification)又稱訓練場地法,是以建立統計識別函數為理論基礎,依據典型樣本訓練方法進行分類的技術。即根據已知訓練區提供的樣本,通過選擇特徵參數,求出特徵參數作為決策規則,建立判別函數以對各待分類影像進行的圖像分類,是模式識別的一種方法。要求訓練區域具有典型性和代表性。判別准則若滿足分類精度要求,則此准則成立;反之,需重新建立分類的決策規則,直至滿足分類精度要求為止。常用演算法有:判別分析、最大似然分析、特徵分析、序貫分析和圖形識別等。
中文名稱:非監督分類 英文名稱:unsupervised classification 定義1:以不同影像地物在特徵空間中類別特徵的差別為依據的一種無先驗類別標準的圖像分類。 應用學科:測繪學(一級學科);攝影測量與遙感學(二級學科) 定義2:在遙感影像的計算機分類過程中,無需採用訓練樣板的分類技術,或沒有先驗知識的分類方法。 應用學科:地理學(一級學科);遙感應用(二級學科)
非監督分類 (Unsupervised Classification ) 是以不同影像地物在特徵空間中類別特徵的差別為依據的一種無先驗(已知)類別標準的圖像分類,是以集群為理論基礎,通過計算機對圖像進行集聚統計分析的方法。根據待分類樣本特徵參數的統計特徵,建立決策規則來進行分類。而不需事先知道類別特徵。把各樣本的空間分布按其相似性分割或合並成一群集,每一群集代表的地物類別,需經實地調查或與已知類型的地物加以比較才能確定。是模式識別的一種方法。一般演算法有:回歸分析、趨勢分析、等混合距離法、集群分析、主成分分析和圖形識別等。希望您幫到你
Ⅳ 做監督分類時需要做精度評價。非監督分類需要做精度評價嗎求解釋!!
非監督分類也要做精度評估,不然做出來的圖像精度不高,分類精度評估是將專題分類圖像版中的特定像權元與已知分類的參考像元進行比較,實際工作中常常是將分類數據與地面真值、先前的試驗地圖、航空相片或其它數據進行對比的途徑之一。
Ⅳ 什麼是監督分類和非監督分類
監督分類又稱訓練場地法、訓練分類法,是以建立統計識別函數為理論基礎、依據典型樣本訓練方法進行分類的技術,即根據已知訓練區提供的樣本,通過選擇特徵參數,求出特徵參數作為決策規則,建立判別函數以對各待分類影像進行的圖像分類。
非監督分類是以不同影像地物在特徵空間中類別特徵的差別為依據的一種無先驗類別標準的圖像分類,是以集群為理論基礎,通過計算機對圖像進行集聚統計分析的方法。根據待分類樣本特徵參數的統計特徵,建立決策規則來進行分類。
(5)無監督分類擴展閱讀
監督分類的主要優點如下:
(1)可根據應用目的和區域,充分利用先驗知識,有選擇地決定分類類別,避免出現不必要的類別;
(2)可控制訓練樣本的選擇;
(3)可通過反復檢驗訓練樣本,來提高分類精度,避免分類嚴重錯誤;
(4)避免了非監督分類中對光譜集群組的重新歸類。
缺點如下:
(1)其分類系統的確定、訓練樣本的選擇,均人為主觀因素較強,分析者定義的類別有可能並不是圖像中存在的自然類別,導致各類別間可能出現重疊;分析者所選擇的訓練樣本也可能並不代表圖像中的真實情形;
(2)由於圖像中同一類別的光譜差異,造成訓練樣本沒有很好的代表性;
(3)訓練樣本的選取和評估需花費較多的人力、時間;
(4)只能識別訓練樣本中所定義的類別,若某類別由於訓練者不知道或者其數量太少未被定義,則監督分類不能識別。
Ⅵ 監督分類和非監督分類的研究現狀
非監督分類是指人們事先對分類過程不施加任何的先驗知識,而僅憑數據(遙感影像地物的光譜特徵的分布規律),即自然聚類的特性,進行「盲目」的分類;其分類的結果只是對不同類別達到了區分,但並不能確定類別的屬性,亦即:非監督分類只能把樣本區分為若干類別,而不能給出樣本的描述;其類別的屬性是通過分類結束後目視判讀或實地調查確定的。非監督分類也稱聚類分析。一般的聚類演算法是先選擇若干個模式點作為聚類的中心。每一中心代表一個類別,按照某種相似性度量方法(如最小距離方法)將各模式歸於各聚類中心所代表的類別,形成初始分類。然後由聚類准則判斷初始分類是否合理,如果不合理就修改分類,如此反復迭代運算,直到合理為止。與監督法的先學習後分類不同,非監督法是邊學習邊分類,通過學習找到相同的類別,然後將該類與其它類區分開,但是非監督法與監督法都是以圖像的灰度為基礎。通過統計計算一些特徵參數,如均值,協方差等進行分類的。所以也有一些共性。
Ⅶ 什麼是監督分類和非監督分類
監督分類 (supervised classification)又稱訓練場地法,是以建立統計識別函數為理論基礎,依據典型樣本訓練方法進行分類的技術。即根據已知訓練區提供的樣本,通過選擇特徵參數,求出特徵參數作為決策規則,建立判別函數以對各待分類影像進行的圖像分類,是模式識別的一種方法。要求訓練區域具有典型性和代表性。判別准則若滿足分類精度要求,則此准則成立;反之,需重新建立分類的決策規則,直至滿足分類精度要求為止。常用演算法有:判別分析、最大似然分析、特徵分析、序貫分析和圖形識別等。
非監督分類是以不同影像地物在特徵空間中類別特徵的差別為依據的一種無先驗(已知)類別標準的圖像分類,是以集群為理論基礎,通過計算機對圖像進行集聚統計分析的方法。根據待分類樣本特徵參數的統計特徵,建立決策規則來進行分類。而不需事先知道類別特徵。把各樣本的空間分布按其相似性分割或合並成一群集,每一群集代表的地物類別,需經實地調查或與已知類型的地物加以比較才能確定。是模式識別的一種方法。一般演算法有:回歸分析、趨勢分析、等混合距離法、集群分析、主成分分析和圖形識別等。
Ⅷ 遙感:監督分類與非監督分類的區別
非監督分類運用1SODATA(Iterative Self-Organizing Data Analysis Technique )演算法,完全按照像元的光譜特性進行統計分類,常常用於對分類區沒有什麼了解的情況。使用該方法時。原始圖像的所有波段都參於分類運算,分類結果往往是各類像元數大體等比例。由於人為干預較少,非監督分類過程的自動化程度較高。非監督分類一般要經過以下幾個步驟:初始分類、專題判別、分類合並、色彩確定、分類後處理、色彩重定義、柵格矢量轉換、統計分析。
監督分類比非監督分類更多地要求用戶來控制,常用於對研究區域比較了解的情況。在監督分類過程中,首先選擇可以識別或者藉助其它信息可以斷定其類型的像元建立模板,然後基於該模板使計算機系統自動識別具有相同特性的像元。對分類結果進行評價後再對模板進行修改,多次反復後建立一個比較准確的模板,並在此基礎上最終進行分類。監督分類一般要經過以下幾個步驟:建立模板(訓練樣本)、評價模板、確定初步分類圖、檢驗分類結果、分類後處理、分類特徵統計、柵格矢量轉換。
上面的這段話是我們遙感實驗手冊上的話, 我自我感覺在用ERDAS 8.6 時候 ,對監督分類和非監督分類的區別才有了深刻點的理解,簡單的說監督分類是我們人為地選擇好樣本區 比如水體,植被 ,就像是告訴計算機「我圈起來的這種像素就代表水體噢」,這個對個人經驗要求很高,很容易把有的顏色混淆,以至於少分幾類,而非監督分類就是計算機自己將圖像上的像元按像素分幾類,一般如果你最後是要分成水體,植被,土地等幾類,但是你設置的起碼最初要分它的兩倍,因為計算機識別的時候有可能有的最終可以歸到一類,但是計算機不會知道它分類每一類代表什麼,這個就要人為地輸入每一類地物的名稱。
[email protected] 如果你需要這方面的實驗指導書就找我吧
Ⅸ 實驗十八 遙感圖像非監督分類處理
一、實驗目的
通過使用ENVI的兩種遙感非監督分類器——IsoData非監督分類和K-Means非監督分類命令,加深對遙感非監督分類原理和對地質應用的理解,了解其技術實現過程,初步掌握其ENVI功能命令的基本使用操作。
二、實驗內容
①桂林市TM 遙感影像數據IsoData非監督分類;②桂林市TM 遙感影像數據KMeans非監督分類;③IsoData非監督分類與K-Means非監督分類效果比較分析。
三、實驗要求
(①預習ISODATA和K-Means兩種演算法原理;②掌握ISODATA和K-Means分類處理的基本操作;③對兩種分類結果進行比較分析;④編寫實驗報告。
四、技術條件
①微型計算機;②桂林市TM 遙感影像數據;③ENVI軟體;④Photoshop軟體(ver.6.0以上)和ACDSee軟體(ver.4.0以上)。
五、實驗步驟
非監督分類是根據圖像數據的本身統計特徵及點群的情況,從純統計學的角度對圖像數據進行類別劃分。非監督分類不需要事先給定類別,由圖像數據的統計特徵來決定,即同類地物在相同的成像條件下具有相同或相近的光譜特徵(如DN 值),歸屬於同一個光譜空間區域;不同地物由於光譜信息特徵不同,歸屬於不同的光譜空間區域。
非監督分類一般可分為四個步驟:執行非監督分類、類別定義、合並子類和評價結果。
(一)執行非監督分類
ENVI有ISODATA和K-Means兩種非監督分類方法。
1.ISODATA非監督分類
ISODATA(iterative self-organizing data analysis technique)屬於聚類分析方法。是按照像元之間的聯系程度(親疏程度)來進行歸類的一種多元統計分析方法。ISODATA非監督分類計算數據空間中均勻分布的類均值,然後用最小距離技術將剩餘像元迭代聚集,每次迭代都重新計算均值,且根據所得的新均值,對像元進行再分類。具體操作步驟如下:
在ENVI主菜單欄中選擇「Classification>Unsupervised>ISODATA」,在「Classificatoin Input File」對話框中選擇待分類遙感影像,打開「ISODATA Parameters」對話框,如圖18-1所示。
圖18-1 ISODATA參數對話框
對圖18-1中的參數進行如下說明:
(1) Number of Classes:類數范圍(最小值和最大值),一般輸入最小數量不能小於最終分類數量,最大數量為最終分類數量的2~3倍。
(2) Maximum Iterations:最大迭代次數值,迭代次數越大,得到的結果越精確。
(3) Change Threshold%(0~100):變化閾值(0~100%),當每一類的變換像元數小於閾值時,結束迭代過程,該值越小得到的結果越精確。
(4) Minimum #Pixel in Class:形成一類需要的最少像元數,如果某一類中的像元數少於最少像元數,該類將被刪除,其中的像元被歸並到距離最近的類中。
(5) Maximum Class Stdv:最大分類標准差,以像素值為單位,如果某一類的標准差比該閾值大,該類將被拆分成兩類。
(6) Minimum Class Distance:類均值之間的最小距離,如果類均值之間的距離小於輸入的最小值,則這一類就會被合並。
(7) Maximum #Merge Pairs:合並成對的最大數。
(8)Maximum Stdev From Mean:距離類別均值的最大標准差,為可選項,篩選小於這個標准差的像元參與分類。
(9) Maximum Distance Error:允許的最大距離誤差,為可選項,篩選小於這個最大距離誤差的像元參與分類。
(10)選擇輸出路徑及文件名,單擊【OK】按鈕,執行ISODATA非監督分類。
2.K-Means非監督分類
K-Means演算法接受輸入量K;然後將n個數據對象劃分為K個聚類以便使所獲得的聚類滿足:同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。聚類相似度是利用各聚類中對象的均值所獲得一個「中心對象」(引力中心)來進行計算的。具體操作步驟如下:
在ENVI主菜單欄中選擇「Classification>Unsupervised>K-Means」,在「Classification Input File」對話框中選擇待分類遙感影像,打開「K-Means Parameters」對話框,如圖18-2所示。
圖18-2 K-Means分類器參數設置對話框
(1) Number of Classes:分類數量,一般輸入為最終分類數量的2~3倍。
(2) Maximum Iterations:最大迭代次數值,迭代次數越大,得到的結果越精確。
(3) Maximum Stdev From Mean:距離類別均值的最大標准差,為可選項,篩選小於這個標准差的像元參與分類。
(4) Maximum Distance Error:允許的最大距離誤差,為可選項,篩選小於這個最大距離誤差的像元參與分類。
(5)選擇輸出路徑及文件名,單擊【OK】按鈕,執行K-Means非監督分類。
(二)定義類別與子類合並
執行非監督分類後,得到的只是一個初步的分類結果,需要進行類別定義域合並子類的操作。
1.類別定義
類別定義的根據可以通過更高解析度圖像上目視解譯獲得,也可以通過野外實地調查獲得。
(1)打開分類圖像即灌陽地區QuickBird遙感數據,並使之顯示在「Display」中。
(2)在分類圖像的主窗口中,選擇「Overlay>Classification」,在「Interactive Class Tool Input File」對話框中選擇非監督分類結果,單擊【OK】按鈕打開「Interactive Class Tool」對話框,如圖18-3所示。
圖18-3 互動式分類工具對話框
(3)在「Interactive Class Tool」對話框中,勾選類別前面的「On」選擇框,就能將此類結果疊加顯示在「Display」分類圖像窗口上,識別此分類類別。
(4)在「Interactive Class Tool」對話框中,選擇「Options>Edit Class Colors/Names」,打開「Class Color Map Editing」對話框,如圖18-4所示。
在「Class Color Map Editnig」對話框中,選擇對應的類別,在「Class Name」中輸入重新定義的類別名稱,同時可以修改此類別顯示的顏色,修改後點擊【OK】按鈕完成修改。
(5)重復步驟(3)~步驟(4),定義其他類別。
(6)完成各類別定義後,在「Interactive Class Tool」對話框中,選擇「File>Save Change to File」,保存修改結果。
2.合並子類
在選擇非監督分類類別數量時,一般選擇為最終分類數量的2~3倍,因此在定義類別之後,需要將相同類別合並。
(1)在 ENVI 主菜單欄中,選擇「Classification > Post Classification > Combine Classes」,在「Combine Classes Input File」對話框中選擇定義好的分類結果,單擊【OK】按鈕打開「Combine Classes Parameters」對話框(圖18-5)。
圖18-4 編輯分類名稱和顏色對話框
圖18-5 分類類別的合並對話框
(2)在「Combine Classes Parameters」對話框中,從「Select Input Class」中選擇合並的類別,從「Select Output Class」中選擇並入的類別,單擊【Add Combination】按鈕添加到合並方案中,合並方案顯示在「Combine Classes」列表中。
(3)合並方案確定後,點擊【OK】按鈕,打開「Combine Classes output」對話框,在「Remove Empty Classes」選項中選擇「Yes」,將無用類移除。
(4)選擇輸出合並結果路徑及文件夾名,點擊【OK】按鈕,執行合並子類。
(三)分類後處理和評價分類結果
分類後處理和評價分類結果的方法同監督分類一樣,可參考實驗十七中的「遙感影像監督分類」。
完成遙感影像非監督分類後,分別利用ISODATA 和K-Means非監督分類方法對灌陽地區QuickBird遙感影像進行非監督分類處理,利用混淆矩陣對兩種分類結果進行評價,得出總體分類精度和Kappa系數。比較兩種分類結果,用W ORD文件記錄,取名為《灌陽地區QuickBird遙感影像兩種非監督分類方法分類結果評價》,存入自己的工作文件夾。
六、實驗報告
(1)簡述實驗過程。
(2)回答問題:①根據實驗操作步驟及各步驟之間的關系,分析兩種非監督分類方法具有的共同特點。②通過目視解譯定性比較兩種非監督分類方法的效果。
實驗報告格式見附錄一。