R中的R factorr和as.integer(R factorr)是什么意思?

  统计基础不好,所以一直无法理解R语言中的因子(factor),复习笔记的时候突然有了新的理解,立马再做个笔记,同时也与同样基础薄弱的网友分享我的理解。

在R语言中,因子(factor)表示的是一个符号、一个编号或者一个等级,即,一个点。例如,人的个数可以是1,2,3,4......那么因子就包括,1,2,3,4.....还有统计量的水平的时候用到的高、中、低,也是因子,因为他是一个点。与之区别的向量,是一个连续性的值,例如,数值中有1,1.1,1.2......可以作为数值来计算,而因子则不可以。如果用我自己的理解,简单通俗来讲:因子是一个点,向量是一个有方向的范围。

  在R中,如果把数字作为因子,那么在导入数据之后,需要将向量转换为因子(factor),而因子在整个计算过程中不再作为数值,而是一个"符号"而已。

  个人愚见,请多多批评指正。

}

IBM? SPSS? 可与 R 通信。就这一点来说,这是一个高度保密的秘密,依据是 R 博客圈的低活动水平。这种有趣的低极性并不奇怪:SPSS 用户通常是仅使用 SPSS 执行其数据分析的人;而 R 用户熟悉在使用 R 的过程中应用聪明的诀窍。想要分析 .sav 格式的数据的 R 用户通常会在 SPSS 中打开该文件,将它保存为逗号分隔值 (CSV) 格式,然后使用 上著名的金融网站获取的 IBM 证券的 NYSE 证券市场数据的一条记录。在这里,您可以看到从 2013 年 8 月 8 日读回的前几行数据。

我可将该数据读入到 SPSS 中,但日期格式不是 SPSS 日期-时间向导支持的格式。R 会救援任务!从 SPSS 使用 R 语法,我可从 R 打开该文件,将日期转换为一种合适的格式,然后使用结果创建一个 SPSS 数据。这是操作步骤:

  1. R 集成插件的默认工作目录在 SPSS 程序目录树的深处。这不是您想要的。将工作目录设置为您的数据文件的位置,以便 R 可找到它。
  2. 这些代码行以字符格式读入日期,使用 1582 年 10 月 10 日作为正确的开始日期来将它们转换为 UNIX? 可移植操作系统接口 (POSIX) 格式。

展示了如何执行这些步骤。

清单 5. 将数据直接读入 R 中并使用它们创建一个 SPSS 数据库

我的简单示例没有很好地处理类别变量 Rating。R 获取了该变量的数字代码,但没有获取该变量可能使用的不同级别的描述性标签:PoorAverageExcellent

您可对该问题采取一些操作。 中所示的 factorMode 参数导入类别级别,而不是数字值。

为类别变量构建一个字典

factorMode 参数依据我想要类别变量的数字代码还是值,为我提供了一种选择。但如果我想要使用类别数据创建一个 SPSS 数据库,我需要更多选择。解决方案就是向数据字典添加另一种结构。 中的示例演示了如何从一个包含因素的 R 数据框架构建一个 SPSS 数据库。

基础 R 捆绑了流行的鸢尾属植物数据集。它是一个包含 4 个数字变量和一个因素(表示 3 种特殊的鸢尾属植物物种之一)的数据框架。为了在 SPSS 中构建一个数据库,我完成了以下步骤:

  1. 为鸢尾属植物数据创建一个数据字典。

    此字典是一个包含 5 列的数据框架(鸢尾属植物数据集的每个变量一列)。

  2. 为该因子创建一个类别字典。

    这里的 R 结构很复杂。它是一个长度为 2 的列表。第一个组件包含各个因子的名称。第二个组件是一个嵌套列表。每一项都是一个长度为 2 的列表:一个组件表示数字代码,另一个组件表示它们的标签。

  3. 通过 “设置” 数据和类别字典来开始创建一个 SPSS 数据库。
  4. 这么做会在 SPSS 中创建一个数据库,但不会将它保存到磁盘。这个活动数据库会保留原样。

清单 7. 为类别数据构建一个字典

R 集成包包含许多函数来实现从 SPSS 向 R 的无缝迁移。例如,SPSS 在定义丢失的值方面具有比 R 更高的灵活性。R 集成包包含管理丢失值的函数,以便在从 SPSS 传递到 R 和反向传递时不会丢失任何信息。另一个重要的特性是创建使用 R 的 SPSS 扩展的能力。可向 Analysis 菜单添加菜单项来使 R 函数可在活动数据集上运行,而无需在语法文件中编写显式代码。通过这种方式,您可向没有 R 知识的用户提供 R 的功能。R 集成包为同时使用 SPSS 和 R 的数据分析师提供了许多优势。

  • 访问 ,这是 R 项目和每个 R 包的主要站点。其中详细介绍了与 optimxnlmrtRcgmin 相关的帮助页面和手册。还提供了大量参考资料。
  • 查阅 (Catherine Dalzell,developerWorks,2013 年 9 月),了解为什么 R 是一个宝贵的数据分析工具,专为反映统计人员的思考和工作方式而设计。
  • 了解有关 的更多信息。
  • 在 ,了解关于大数据的更多信息,获取技术文档、how-to 文章、培训、下载、产品信息以及其他资源。
  • 在 ,了解关于信息管理的更多信息,获取技术文档、how-to 文章、培训、下载、产品信息以及其他资源。
}

我要回帖

更多关于 R factor 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信