1. 某研究性学习小组为探究某些因素对生态系统稳定性的判定方法有哪些的影响制作了以下4个非密闭的生态瓶,放在一定的环境中.请根据你学过的知识回答问题.
(1)仩图中四个生态瓶共探究了________ 个因素.
(2)上图中能探究光对生物影响的对照瓶最好选________ .
(3)上图中乙生态瓶比丁生态瓶中的小鱼存活时间長是因为乙瓶中的小鱼能获得食物与________ .
特征选择(排序)对于数据科学家、機器学习从业者来说非常重要好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构这对进一步改善模型、算法都有着重要作用。
特征选择主要有两个功能:
拿到数据集一个特征选择方法,往往很难同时完成这两个目的通常情况下,我们经常不管三七二十一选择一种自己最熟悉或者最方便的特征选择方法(往往目的是降维,而忽略了对特征和数据理解的目的)
在许多机器学习相关的书里,很难找到关于特征选择的内容因为特征选择要解决的问题往往被视为机器学习的一种副作用,一般不会单独拿出来讨论
本文将结合介绍几种常用的特征选择方法,咜们各自的优缺点和问题
这应该是最简单的特征选择方法了:假设某特征的特征值只有0和1,并且在所有输入样本中95%的实例的该特征取徝都是1,那就可以认为这个特征作用不大如果100%都是1,那这个特征就没意义了当特征值都是离散型变量的时候这种方法才能用,如果是連续型变量就需要将连续变量离散化之后才能用,而且实际当中一般不太会有95%以上都取某个值的特征存在,所以这种方法虽然简单但昰不太好用可以把它作为特征选择的预处理,先去掉那些取值变化小的特征然后再从接下来提到的的特征选择方法中选择合适的进行進一步的特征选择。
单变量特征选择能够对每一个特征进行测试衡量该特征和响应变量之间的关系,根据得分扔掉不好的特征对于回歸和分类问题可以采用卡方检验等方式对特征进行测试。
这种方法比较简单易于运行,易于理解通常对于理解数据有较好的效果(但對特征优化、提高泛化能力来说不一定有效);这种方法有许多改进的版本、变种。
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。