[已答复] 支持向量机(SVM)分类时,训练集正确率很高,测试集很低

[复制链接]
dmsn 发表于 2016-5-16 11:11:38
用SVM做分类问题时,遇到以下问题,求解答,非常感谢

1. 训练样本的正确判别率很高,但测试样本的正确率不高(60%左右),请问可能的解决办法?

2.我是这样分配样本(样本的类别是已知的,是通过实验得到的)的,如:
A类样本:随机选择85%作为训练集,15%作为测试集
B类样本:随机选择85%作为训练集,15%作为测试集
C类样本:随机选择85%作为训练集,15%作为测试集
这样选择合适吗?假若可以,85:15可以换成90:10或者其他比例吗,这个比例会影响到最终的测试正确率吗?
也就是说训练集、测试集的分配会影响到最终的测试正确率吗?有没有最佳比例之说?

3.测试正确率的高低和原始样本数据本身有关系吗?难道有的数据无论怎么做都不可能得到很高的测试正确率?如果是这样,怎样事先判断数据集是否合适、用SVM能否做出较高的预测正确率?即对样本事先要做哪些分析(预处理、预分析之类的,比如是不是要剔除一些数据呀、需要方差分析吗......)忘高人指点?

4.和参数寻优有关?我用的是libSVM-faruto版本,多次改变程序默认的参数寻优范围、改变参数寻优方法,测试正确率还是比较低,在60%左右;难道是我参数调整方法不对?



20 条回复


yerengege 发表于 2017-5-4 11:07:02
LZ怎么解决的啊?我也遇到同样的问题!!!

orchid1105 发表于 2017-5-28 18:46:04
yerengege 发表于 2017-5-4 11:07
LZ怎么解决的啊?我也遇到同样的问题!!!

您好!我也遇到了同样的问题,你找到原因了吗

yerengege 发表于 2017-5-30 12:04:20
orchid1105 发表于 2017-5-28 18:46
您好!我也遇到了同样的问题,你找到原因了吗

找到了,你把你数据发来,我看看,和我的原因一不一样。

orchid1105 发表于 2017-5-30 12:33:36
yerengege 发表于 2017-5-30 12:04
找到了,你把你数据发来,我看看,和我的原因一不一样。

我的数据量比较大,您能加我qq吗?qq:1144656604,谢谢啦

yerengege 发表于 2017-5-30 12:41:50
orchid1105 发表于 2017-5-30 12:33
我的数据量比较大,您能加我qq吗?qq:1144656604,谢谢啦

已加,同意一下。

1175781599 发表于 2017-10-30 16:39:22
能在论坛上指点一下吗,这样大家讨论一下也更加方便呀,谢谢

ysusie 发表于 2017-11-2 22:12:42
楼主我有同样的问题,你解决了吗?

yerengege 发表于 2017-11-22 12:44:50
ysusie 发表于 2017-11-2 22:12
楼主我有同样的问题,你解决了吗?

数据本身的问题

jiangbo 发表于 2018-1-7 03:10:46
楼主问题解决了吗?有没有大神解答下

g土豆一箩筐 发表于 2018-5-24 11:35:49
楼主您好  可以帮我看看么 我的也是这个问题   QQ  756073673

liujie599 发表于 2018-11-11 22:51:43
g土豆一箩筐 发表于 2018-5-24 11:35
楼主您好  可以帮我看看么 我的也是这个问题   QQ  756073673

有解决吗 怎么处理的 麻烦了

Shut_Down 发表于 2019-1-14 11:26:23
怎么查看训练集的正确率呀楼主

zlw322 发表于 2019-3-8 20:53:52
有可能是过拟合问题,即你的原始网络参数较多,而样本数量较少导致网络过拟合,具体体现就是训练集很好而测试集很不好,可以换一种参数少的网络,或者减少原网络的参数,缩减规模

幻之森 发表于 2019-5-16 20:08:35
zlw322 发表于 2019-3-8 20:53
有可能是过拟合问题,即你的原始网络参数较多,而样本数量较少导致网络过拟合,具体体现就是训练集很好而测 ...

您好?能问下如何修改向量机相关参数能获得较佳的预测能力吗?

DCL123 发表于 2019-7-25 16:46:36
我也遇到这样问题,能请教一下吗

liuzuojun 发表于 2019-7-27 09:18:31
DCL123 发表于 2019-7-25 16:46
我也遇到这样问题,能请教一下吗

数据有没有进行归一化?QQ 1773615041

港港_S9fnh 发表于 2019-11-16 19:49:17
遇到了相同的问题,请问一下是如何解决的~

xiaozong1 发表于 2022-5-9 22:42:30
yerengege 发表于 2017-5-30 12:04
找到了,你把你数据发来,我看看,和我的原因一不一样。

请问怎么解决啊,我不是过拟合,但是测试集的准确率在75%,数据300+个,请问怎么提高准确率,QQ2412404968

xiaozong1 发表于 2022-5-10 08:57:14
请问楼主解决了吗

xiaozong1 发表于 2022-5-18 21:11:05
xiaozong1 发表于 2022-5-9 22:42
请问怎么解决啊,我不是过拟合,但是测试集的准确率在75%,数据300+个,请问怎么提高准确率,QQ241240496 ...

我也找到了原因了,我把数据调换一下顺序就好了,这是什么原因啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则

相关帖子
相关文章
热门教程
站长推荐
快速回复 返回顶部 返回列表