半监督svm

发布时间: 2020-12-16 05:00:12

① 求助如何使用libsvm实现半监督支持向量机算法

SVM有如下主要几个特点：
（1）非线性映射是SVM方法的理论基础，SVM利用内积核函专数代替属向高维空间的非线性映射；
（2）对特征空间划分的最优超平面是SVM的目标，最大化分类边际的思想是SVM方法的核心；
（3）支持向量是SVM的训练结果，在SVM分类决策中起决定作用的是支持向量。
（4）SVM 是一种有坚实理论基础的新颖的小样本学习方法。它基本上不涉及概率测度及大数定律等，因此不同于现有的统计方法。从本质上看，它避开了从归纳到演绎的传统过程，实现了高效的从训练样本到预报样本的“转导推理”，大大简化了通常的分类和回归等问题

② 用于数据挖掘的分类算法有哪些，各有何优劣

1、朴素贝叶斯(Naive Bayes, NB)

简单，就像做一些数数的工作。

如果条件独立假设成立的话,NB将比鉴别模型（如Logistic回归）收敛的更快,所以你只需要少量的训练数据。

如果你想做类似半监督学习,或者是既要模型简单又要性能好,NB值得尝试.

2.Logistic回归(Logistic Regression, LR)

LR有很多方法来对模型正则化。比起NB的条件独立性假设，LR不需要考虑样本是否是相关的。

如果你想要一些概率信息（如,为了更容易的调整分类阈值,得到分类的不确定性,得到置信区间）,或者希望将来有更多数据时能方便的更新改进模型,LR是值得使用的.

3.决策树（Decision Tree, DT）

DT是非参数的，所以你不需要担心野点（或离群点）和数据是否线性可分的问题（例如,DT可以轻松的处理这种情况：属于A类的样本的特征x取值往往非常小或者非常大，而属于B类的样本的特征x取值在中间范围）。

DT的主要缺点是容易过拟合，这也正是随机森林（Random Forest, RF）（或者Boosted树）等集成学习算法被提出来的原因。

此外,RF在很多分类问题中经常表现得最好，且速度快可扩展,也不像SVM那样需要调整大量的参数,所以最近RF是一个非常流行的算法.

4.支持向量机（Support Vector Machine, SVM）

很高的分类正确率，对过拟合有很好的理论保证，选取合适的核函数，面对特征线性不可分的问题也可以表现得很好。

SVM在维数通常很高的文本分类中非常的流行。由于较大的内存需求和繁琐的调参，我认为RF已经开始威胁其地位了.

阅读全文

热点内容

影视转载限制分钟发布：2024-08-19 09:13:14 浏览：319

韩国电影伤口上纹身找心里辅导发布：2024-08-19 09:07:27 浏览：156

韩国电影集合3小时发布：2024-08-19 08:36:11 浏览：783

有母乳场景的电影发布：2024-08-19 08:32:55 浏览：451

我准备再看一场电影英语发布：2024-08-19 08:14:08 浏览：996

奥迪a8电影叫什么三个女救人发布：2024-08-19 07:56:14 浏览：513

邱淑芬风月片全部发布：2024-08-19 07:53:22 浏览：341

善良妈妈的朋友李采潭发布：2024-08-19 07:33:09 浏览：760

哪里还可以看查理九世发布：2024-08-19 07:29:07 浏览：143

看电影需要多少帧数发布：2024-08-19 07:23:14 浏览：121

半监督svm

与半监督svm相关的资讯