orange人工智能分类问题

实验介绍:

一:多分类问题

我们想要机器自动识别不同种类的生物,这就涉及到多分类问题。

支持向量机的介绍

讲得很好引用一下
支持向量机SVM详解
支持向量机和逻辑回归的区别是:逻辑回归是找一条曲线把数据分开,支持向量机就是找一个宽马路把不同类数据隔得越远越好
支持向量机对异常数据的容忍就会好一些

搭建流程
图片[1]-orange人工智能分类问题-牛翰网
输入数据[数据链接]
(https://files.cnblogs.com/files/blogs/815873/datasets.zip?t=1730452340&download=true “数据链接”)
数据是不同种类动物的腿,尾巴等的数据特征

将交叉验证改成10次,可以看见拟合非常好
图片[2]-orange人工智能分类问题-牛翰网

使用逻辑回归算法进行对比

图片[3]-orange人工智能分类问题-牛翰网
逻辑回归拟合更好

二:决策树

新建一个决策树的工作流,输入泰坦尼克号的生存数据,分析不同情况下的生存概率
图片[4]-orange人工智能分类问题-牛翰网
图片[5]-orange人工智能分类问题-牛翰网
查看树部件如其名,用来查看决策树。

决策树 叶子节点代表不同的分类,按决策规则分支。

图片[6]-orange人工智能分类问题-牛翰网
图片[7]-orange人工智能分类问题-牛翰网

三:集成学习

袋装

自助抽样:随机有放回地抽样。
自助抽样举例:十个红球里面放一个黑球,不管抽多少次抽到黑球概率都是1/11。

引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07

因为是投票决定,需要模型为奇数个,否则会出现两个模型平票。

随机森林

引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07

因为是投票决定,需要模型为奇数个。

堆叠

引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07

提升

引用图片:已授权,来源《人工智能基础》耿煜 电子工业出版社 2022-07

工作流如下
毕达哥拉斯森林用来查看随机森林
图片[8]-orange人工智能分类问题-牛翰网
我使用的是泰坦尼克号生存的数据
图片[9]-orange人工智能分类问题-牛翰网

© 版权声明
THE END
支持一下吧
点赞11 分享
评论 抢沙发
头像
请文明发言!
提交
头像

昵称

取消
昵称表情代码快捷回复

    暂无评论内容