半監督

發布時間: 2020-11-23 03:14:41

1. 半監督學習的起源和發展歷程

SSL的研究歷史可以追溯到20世紀70年代，這一時期，出現了自訓練(Self-Training)、直推學習(Transctive Learning)、生成式模型(Generative Model)等學習方法。
90年代，新的理論的出現，以及自然語言處理、文本分類和計算機視覺中的新應用的發展，促進了SSL的發展，出現了協同訓練(Co-Training)和轉導支持向量機(Transctive Support Vector Machine，TSVM)等新方法。Merz等人在1992年提出了SSL這個術語，並首次將SSL用於分類問題。接著Shahshahani和Landgrebe展開了對SSL的研究。協同訓練方法由Blum和Mitchell提出，基於不同的視圖訓練出兩個不同的學習機，提高了訓練樣本的置信度。Vapnik和Sterin提出了TSVM，用於估計類標簽的線性預測函數。為了求解TSVM，Joachims提出了SVM方法，Bie和Cristianini將TSVM放鬆為半定規劃問題從而進行求解。許多研究學者廣泛研究將期望最大演算法(Expectation Maximum，EM)與高斯混合模型(Gaussian Mixture Model，GMM)相結合的生成式SSL方法。Blum等人提出了最小割法(Mincut)，首次將圖論應用於解決SSL問題。Zhu等人提出的調和函數法(Harmonic Function)將預測函數從離散形式擴展到連續形式。由Belkin等人提出的流形正則化法(Manifold Regularization)將流形學習的思想用於SSL場景。Klein等人提出首個用於聚類的半監督距離度量學習方法，學習一種距離度量。

2. python 有可以做半監督回歸的機器學習庫嗎

python 有很多庫都可以做半監督回歸的機器學習，最常用的如下：

Scikit-learn
Tensorflow
Caffe
Shogun

3. 如何理解半監督的樸素貝葉斯分類演算法

為了測試評估貝葉斯分類器的性能,用不同數據集進行對比實驗是必不可少的. 現有的回貝葉斯網路實驗軟體包答都是針對特定目的設計的,不能滿足不同研究的需要. 介紹了用Matlab在BNT軟體包基礎上建構的貝葉斯分類器實驗平台MBNC,闡述了MBNC的系統結構和主要功能,以及在MBNC上建立的樸素貝葉斯分類器NBC,基於互信息和條件互信息測度的樹擴展的貝葉斯分類器TANC,基於K2演算法和GS演算法的貝葉斯網路分類器BNC. 用來自UCI的標准數據集對MBNC進行測試,實驗結果表明基於MBNC所建構的貝葉斯分類器的性能優於國外同類工作的結果,編程量大大小於使用同類的實驗軟體包,所建立的MBNC實驗平台工作正確、有效、穩定. 在MBNC上已經進行貝葉斯分類器的優化和改進實驗,以及處理缺失數據等研究工作

4. 急求最近鄰演算法的半監督學習演算法對vehicle數據分類的matlab程序

嗯嗯嗯

5. 我知道有監督學習，半監督學習，那麼什麼是弱監督學習

三種弱監督類型：不完全監督，即只有一部分樣本有標簽；不確切監督，即訓練樣本只有粗粒度的標簽；以及不準確監督，即給定的標簽不一定總是真值。

6. 半監督學習的介紹

半監督學習(Semi-Supervised Learning，SSL)是模式識別和機器學習領域研究的重點問題，是監督學習與無監督學習相內結合的一種容學習方法。它主要考慮如何利用少量的標注樣本和大量的未標注樣本進行訓練和分類的問題。主要分為半監督分類，半監督回歸，半監督聚類和半監督降維演算法。

7. 自我學習，監督學習，半監督學習和遷移學習的區別

自我學習和半監督學習一樣，當前手頭上只有少量訓練樣本，但是周圍手頭上還有版大量無標注樣本。舉一權個經典的例子，分離大象和犀牛。對於監督學習來說，我們手頭有大量大象的樣本和犀牛的樣本，接下來訓練分類器，進行分類，大家都知道的。對於遷移學習，則是指我們手頭上有大量羊的樣本和馬的樣本（已標記），少量的大象和犀牛的樣本，接下來就要從羊和馬的樣本中選出有效的樣本分別加入到大象和犀牛的標記樣本中，然後再用監督學習的方法訓練分類器。而非監督學習，則是手上僅有少量大象和犀牛的已標記樣本，另外有一堆大象和犀牛的沒有標記的數據（注意它們中要麼是大象要麼是犀牛，沒有其他物種）。半監督學習就是利用這些樣本訓練分類器，實現分類。而自我學習，同樣是手上僅有少量大象和犀牛的已標記樣本，另外有一大堆自然圖像。所謂自然圖像，就是有大象和犀牛的圖片，還有各種其他物種的圖片。自我學習比半監督學習更適合實際場景—–哪有一堆只有大象和犀牛的圖片給你呢？而自然圖像的來源更加廣泛，可以從互聯網上隨便下載。轉載網路。

8. 集成學習和半監督學習之間有什麼關系

最簡單的就是求相關系數矩陣和協方差矩陣。如果想玩的深一點，可以用因素分析、聚類分析、判別分析，多元回歸等等。你查一下「多元統計分析」的相關教材或書籍吧，你說的問題很大，很模糊。但都在這類問題之中。

9. 支持向量機演算法是基於監督的還是基於半監督的

分類作為數據挖掘領域中一項非常重要的任務，它的目的是學會一個分類函數或分類模型(或者叫做分類器)，而支持向量機本身便是一種監督式學習的方法。

引自CSDN：網頁鏈接

10. 半監督學習的基本假設

SSL的成立依賴於模型假設，當模型假設正確時，無類標簽的樣例能夠幫助改進學習性能。SSL依賴的假設有以下三個：
1)平滑假設(Smoothness Assumption)：位於稠密數據區域的兩個距離很近的樣例的類標簽相似，也就是說，當兩個樣例被稠密數據區域中的邊連接時，它們在很大的概率下有相同的類標簽；相反地，當兩個樣例被稀疏數據區域分開時，它們的類標簽趨於不同。
2)聚類假設(Cluster Assumption)：當兩個樣例位於同一聚類簇時，它們在很大的概率下有相同的類標簽。這個假設的等價定義為低密度分離假設(Low Sensity Separation Assumption)，即分類決策邊界應該穿過稀疏數據區域，而避免將稠密數據區域的樣例分到決策邊界兩側。
聚類假設是指樣本數據間的距離相互比較近時，則他們擁有相同的類別。根據該假設，分類邊界就必須盡可能地通過數據較為稀疏的地方，以能夠避免把密集的樣本數據點分到分類邊界的兩側。在這一假設的前提下，學習演算法就可以利用大量未標記的樣本數據來分析樣本空間中樣本數據分布情況，從而指導學習演算法對分類邊界進行調整，使其盡量通過樣本數據布局比較稀疏的區域。例如，Joachims提出的轉導支持向量機演算法，在訓練過程中，演算法不斷修改分類超平面並交換超平面兩側某些未標記的樣本數據的標記，使得分類邊界在所有訓練數據上最大化間隔，從而能夠獲得一個通過數據相對稀疏的區域，又盡可能正確劃分所有有標記的樣本數據的分類超平面。
3)流形假設(Manifold Assumption)：將高維數據嵌入到低維流形中，當兩個樣例位於低維流形中的一個小局部鄰域內時，它們具有相似的類標簽。
流形假設的主要思想是同一個局部鄰域內的樣本數據具有相似的性質，因此其標記也應該是相似。這一假設體現了決策函數的局部平滑性。和聚類假設的主要不同是，聚類假設主要關注的是整體特性，流形假設主要考慮的是模型的局部特性。在該假設下，未標記的樣本數據就能夠讓數據空間變得更加密集，從而有利於更加標准地分析局部區域的特徵，也使得決策函數能夠比較完滿地進行數據擬合。流形假設有時候也可以直接應用於半監督學習演算法中。例如，Zhu 等人利用高斯隨機場和諧波函數進行半監督學習，首先利用訓練樣本數據建立一個圖，圖中每個結點就是代表一個樣本，然後根據流形假設定義的決策函數的求得最優值，獲得未標記樣本數據的最優標記；Zhou 等人利用樣本數據間的相似性建立圖，然後讓樣本數據的標記信息不斷通過圖中的邊的鄰近樣本傳播，直到圖模型達到全局穩定狀態為止。
從本質上說，這三類假設是一致的,只是相互關注的重點不同。其中流行假設更具有普遍性。

閱讀全文

熱點內容

影視轉載限制分鍾發布：2024-08-19 09:13:14 瀏覽：319

韓國電影傷口上紋身找心裡輔導發布：2024-08-19 09:07:27 瀏覽：156

韓國電影集合3小時發布：2024-08-19 08:36:11 瀏覽：783

有母乳場景的電影發布：2024-08-19 08:32:55 瀏覽：451

我准備再看一場電影英語發布：2024-08-19 08:14:08 瀏覽：996

奧迪a8電影叫什麼三個女救人發布：2024-08-19 07:56:14 瀏覽：513

邱淑芬風月片全部發布：2024-08-19 07:53:22 瀏覽：341

善良媽媽的朋友李采潭發布：2024-08-19 07:33:09 瀏覽：760

哪裡還可以看查理九世發布：2024-08-19 07:29:07 瀏覽：143

看電影需要多少幀數發布：2024-08-19 07:23:14 瀏覽：121

半監督

與半監督相關的資訊