無監督訓練
① 監督學習與無監督學習有什麼不同
監督學習是從標記的訓練數據來推斷一個功能的機器學習任務。在監督學習中,每個實例都是由一個輸入對象(通常為矢量)和一個期望的輸出值(也稱為監督信號)組成。監督學習演算法是分析該訓練數據,並產生一個推斷的功能,其可以用於映射出新的實例。
無監督學習是機器學習的一個分支,它從未經標記或分類的測試數據中學習。它本質上是一個統計手段,在沒有標簽的數據里可以發現潛在的一些結構。
兩者的主要區別是:
1.監督學習是一種目的明確的訓練方式,你知道得到的是什麼;而無監督學習則是沒有明確目的的訓練方式,你無法提前知道結果是什麼。
2.監督學習需要給數據打標簽;而無監督學習不需要給數據打標簽。
3.監督學習由於目標明確,所以可以衡量效果;而無監督學習幾乎無法量化效果如何。
② 如何有效實現無監督學習
1、自主學習,要學會給自己定定目標(大、小、長、短),這樣學習會有一個方向;然後梳理自身的學習情況,找出自己掌握的薄弱環節、存在的問題、容易丟分的知識點;再者合理的分配時間,有針對性的制定學習任務,一一的去落實。
2、可以學習掌握速讀記憶的能力,提高學習復習效率。速讀記憶是一種高效的學習、復習方法,其訓練原理就在於激活「腦、眼」潛能,培養形成眼腦直映式的閱讀、學習方式。速讀記憶的練習見《精英特全腦速讀記憶訓練》,用軟體練習,每天一個多小時,一個月的時間,可以把閱讀速度提高5、6倍,記憶力、理解力等也會得到相應的提高,最終提高學習、復習效率,取得好成績。如果你的閱讀、學習效率低的話,可以好好的去練習一下。
3、要學會整合知識點。把需要學習的信息、掌握的知識分類,做成思維導圖或知識點卡片,會讓你的大腦、思維條理清醒,方便記憶、溫習、掌握。同時,要學會把新知識和已學知識聯系起來,不斷糅合、完善你的知識體系。這樣能夠促進理解,加深記憶。
4、做題的時候要學會反思、歸類、整理出對應的解題思路。遇到錯的題(粗心做錯也好、不會做也罷),最好能把這些錯題收集起來,每個科目都建立一個獨立的錯題集(錯題集要歸類),當我們進行考前復習的時候,它們是重點復習對象,保證不再同樣的問題上再出錯、再丟分。
③ 為什麼無監督的預訓練可以幫助深度學習
深度學習的概念源於人工神經網路的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特徵形成更加抽象的高層表示屬性類別或特徵,以發現數據的分布式特徵表示。
深度學習的概念由Hinton等人於2006年提出。基於深信度網(DBN)提出非監督貪心逐層訓練演算法,為解決深層結構相關的優化難題帶來希望,隨後提出多層自動編碼器深層結構。此外Lecun等人提出的卷積神經網路是第一個真正多層結構學習演算法,它利用空間相對關系減少參數數目以提高訓練性能。
深度學習是機器學習研究中的一個新的領域,其動機在於建立、模擬人腦進行分析學習的神經網路,它模仿人腦的機制來解釋數據,例如圖像,聲音和文本。
同機器學習方法一樣,深度機器學習方法也有監督學習與無監督學習之分.不同的學習框架下建立的學習模型很是不同.例如,卷積神經網路(Convolutional neural networks,簡稱CNNs)就是一種深度的監督學習下的機器學習模型,而深度置信網(Deep Belief Nets,簡稱DBNs)就是一種無監督學習下的機器學習模型。
深度不足會出現問題
在許多情形中深度2就足夠表示任何一個帶有給定目標精度的函數。但是其代價是:圖中所需要的節點數(比如計算和參數數量)可能變的非常大。理論結果證實那些事實上所需要的節點數隨著輸入的大小指數增長的函數族是存在的。
我們可以將深度架構看做一種因子分解。大部分隨機選擇的函數不能被有效地表示,無論是用深的或者淺的架構。但是許多能夠有效地被深度架構表示的卻不能被用淺的架構高效表示。一個緊的和深度的表示的存在意味著在潛在的可被表示的函數中存在某種結構。如果不存在任何結構,那將不可能很好地泛化。
大腦有一個深度架構
例如,視覺皮質得到了很好的研究,並顯示出一系列的區域,在每一個這種區域中包含一個輸入的表示和從一個到另一個的信號流(這里忽略了在一些層次並行路徑上的關聯,因此更復雜)。這個特徵層次的每一層表示在一個不同的抽象層上的輸入,並在層次的更上層有著更多的抽象特徵,他們根據低層特徵定義。
需要注意的是大腦中的表示是在中間緊密分布並且純局部:他們是稀疏的:1%的神經元是同時活動的。給定大量的神經元,仍然有一個非常高效地(指數級高效)表示。
認知過程逐層進行,逐步抽象
人類層次化地組織思想和概念;
人類首先學習簡單的概念,然後用他們去表示更抽象的;
工程師將任務分解成多個抽象層次去處理;
學習/發現這些概念(知識工程由於沒有反省而失敗?)是很美好的。對語言可表達的概念的反省也建議我們一個稀疏的表示:僅所有可能單詞/概念中的一個小的部分是可被應用到一個特別的輸入(一個視覺場景)。
核心思想
把學習結構看作一個網路,則深度學習的核心思路如下:
①無監督學慣用於每一層網路的pre-train;
②每次用無監督學習只訓練一層,將其訓練結果作為其高一層的輸入;
③用自頂而下的監督演算法去調整所有層
④ 什麼是無監督學習
在機器學習,無監督學習的問題是,在未加標簽的數據中,試圖找到隱藏的結構。因為提供給學習者的實例是未標記的,因此沒有錯誤或報酬信號來評估潛在的解決方案。這區別於監督學習和強化學習無監督學習。
無監督學習是密切相關的統計數據密度估計的問題。然而無監督學習還包括尋求,總結和解釋數據的主要特點等諸多技術。在無監督學習使用的許多方法是基於用於處理數據的數據挖掘方法。
非監督學習對應的是監督學習。
⑤ 無監督學習是什麼
意思是說不會有人逼著你去學習,也不會干預你學習,完全是靠你自己自覺地區學習。
⑥ 什麼是無監督學習
首先看什麼是學習(learning)?一個成語就可概括:舉一反三。此處以高考為例,高考的題目在上考場前我們未必做過,但在高中三年我們做過很多很多題目,懂解題方法,因此考場上面對陌生問題也可以算出答案。機器學習的思路也類似:我們能不能利用一些訓練數據(已經做過的題),使機器能夠利用它們(解題方法)分析未知數據(高考的題目)?
最簡單也最普遍的一類機器學習演算法就是分類(classification)。對於分類,輸入的訓練數據有特徵(feature),有標簽(label)。所謂的學習,其本質就是找到特徵和標簽間的關系(mapping)。這樣當有特徵而無標簽的未知數據輸入時,我們就可以通過已有的關系得到未知數據標簽。
在上述的分類過程中,如果所有訓練數據都有標簽,則為有監督學習(supervised learning)。如果數據沒有標簽,顯然就是無監督學習(unsupervised learning)了,也即聚類(clustering)。
⑦ 什麼是無監督學習
首先看什麼是學習(learning)?一個成語就可概括:舉一反三。此處以高考為例,高考的題目在上考場前我們未必做過,但在高中三年我們做過很多很多題目,懂解題方法,因此考場上面對陌生問題也可以算出答案。機器學習的思路也類似:我們能不能利用一些訓練數據(已經做過的題),使機器能夠利用它們(解題方法)分析未知數據(高考的題目)?
最簡單也最普遍的一類機器學習演算法就是分類(classification)。對於分類,輸入的訓練數據有特徵(feature),有標簽(label)。所謂的學習,其本質就是找到特徵和標簽間的關系(mapping)。這樣當有特徵而無標簽的未知數據輸入時,我們就可以通過已有的關系得到未知數據標簽。
在上述的分類過程中,如果所有訓練數據都有標簽,則為有監督學習(supervised learning)。如果數據沒有標簽,顯然就是無監督學習(unsupervised learning)了,也即聚類(clustering)。
(但有監督學習並非全是分類,還有回歸(regression),此處不細說。)
目前分類演算法的效果還是不錯的,但相對來講,聚類演算法就有些慘不忍睹了。確實,無監督學習本身的特點使其難以得到如分類一樣近乎完美的結果。這也正如我們在高中做題,答案(標簽)是非常重要的,假設兩個完全相同的人進入高中,一個正常學習,另一人做的所有題目都沒有答案,那麼想必第一個人高考會發揮更好,第二個人會發瘋。
⑧ 什麼是無監督學習
無監督學習:設計分類器時候,用於處理未被分類標記的樣本集
目標是我們不告訴計算機怎麼做,而是讓它(計算機)自己去學習怎樣做一些事情。非監督學習一般有兩種思路。第一種思路是在指導Agent時不為其指定明確的分類,而是在成功時採用某種形式的激勵制度。需要注意的是,這類訓練通常會置於決策問題的框架里,因為它的目標不是產生一個分類系統,而是做出最大回報的決定。這種思路很好的概括了現實世界,Agent可以對那些正確的行為做出激勵,並對其他的行為進行處罰。
強化學習的一些形式常常可以被用於非監督學習,由於沒有必然的途徑學習影響世界的那些行為的全部信息,因此Agent把它的行為建立在前一次獎懲的基礎上。在某種意義上,所有的這些信息都是不必要的,因為通過學習激勵函數,Agent不需要任何處理就可以清楚地知道要做什麼,因為它(Agent)知道自己採取的每個動作確切的預期收益。對於防止為了計算每一種可能性而進行的大量計算,以及為此消耗的大量時間(即使所有世界狀態的變遷概率都已知),這樣的做法是非常有益的。另一方面,在嘗試出錯上,這也是一種非常耗費時間的學習。
不過這一類學習可能會非常強大,因為它假定沒有事先分類的樣本。在某些情況下,例如,我們的分類方法可能並非最佳選擇。在這方面一個突出的例子是Backgammon(西洋雙陸棋)游戲,有一系列計算機程序(例如neuro-gammon和TD-gammon)通過非監督學習自己一遍又一遍的玩這個游戲,變得比最強的人類棋手還要出色。這些程序發現的一些原則甚至令雙陸棋專家都感到驚訝,並且它們比那些使用預分類樣本訓練的雙陸棋程序工作得更出色。
一種次要的非監督學習類型稱之為聚合(clustering)。這類學習類型的目標不是讓效用函數最大化,而是找到訓練數據中的近似點。聚合常常能發現那些與假設匹配的相當好的直觀分類。例如,基於人口統計的聚合個體可能會在一個群體中形成一個富有的聚合,以及其他的貧窮的聚合。