Python数据分析基础:异常值检测和处理
发布时间:2018-08-18 08:09:22 所属栏目:教程 来源:佚名
导读:技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战 在机器学习中,异常检测和处理是一个比较小的分支,或者说,是机器学习的一个副产物,因为在一般的预测问题中,模型通常是对整体样本数据结构的一种表达方式,这种表达方式通常抓住
优缺点:
其实以上说到聚类方法的本意是是无监督分类,并不是为了寻找离群点的,只是恰好它的功能可以实现离群点的检测,算是一个衍生的功能。 除了以上提及的方法,还有两个专门用于检测异常点的方法比较常用:One Class SVM和Isolation Forest,详细内容不进行深入研究。 检测到了异常值,我们需要对其进行一定的处理。而一般异常值的处理方法可大致分为以下几种:
是否要删除异常值可根据实际情况考虑。因为一些模型对异常值不很敏感,即使有异常值也不影响模型效果,但是一些模型比如逻辑回归LR对异常值很敏感,如果不进行处理,可能会出现过拟合等非常差的效果。 以上是对异常值检测和处理方法的汇总。 通过一些检测方法我们可以找到异常值,但所得结果并不是绝对正确的,具体情况还需自己根据业务的理解加以判断。同样,对于异常值如何处理,是该删除,修正,还是不处理也需结合实际情况考虑,没有固定的。 【编辑推荐】
点赞 0 (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- VR动作射击游戏《Pistol Whip》PSVR版即将上市
- 看过这篇文章,你会后悔没来过华为生态伙伴大会2019的展区
- 达芬奇调色软件如何调掉蓝色 调节色调就是这么容易
- Magic Leap启动“Access Hardware”硬件计划
- MindMapper16如何添加特殊字符 特殊符号加入方法
- 索尼互动娱乐推出“Days of Play 2020”活动
- 全球首款搭载ToF深度引擎的轻量级MR眼镜RealX Pro震撼发布!
- 不到70行Python代码,轻松玩转RFM用户分析模型
- 打造全球智慧样板 思科智慧城要在广州番禺筑巢引凤!
- Digi-Capital数据显示2019年全球AR/VR投资金额达到41亿美元