博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《R语言数据分析》——1.6 导入Excel电子表格
阅读量:6863 次
发布时间:2019-06-26

本文共 952 字,大约阅读时间需要 3 分钟。

本节书摘来自华章出版社《R语言数据分析》一书中的第1章,第1.6节,作者盖尔盖伊·道罗齐(Gergely Daróczi),潘怡 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.6 导入Excel电子表格

在学术界和商业界,除了CSV文件,Excel的xls(或xlsx,最近的一种新称呼)应该是应用最为广泛的进行存储和交换少量数据最为通用的数据格式。它最初源自Microsoft公司独有的二进制文件格式,对其文档的说明非常多(xls指南长达1100页,50M),但是对多种表格、宏及公司的导入不直接,目前为止也是这样。本节将仅探讨与Excel交互的与平台无关的R包。

一种选择是使用前面介绍过的RODBC包,与Excel驱动器交互,查询Excel电子表格。还可以借助第三方工具来访问Excel数据,例如使用Perl自动将Excel文件转换为CSV文件,然后再通过gdata包的read.xls函数导入到R。但有时候在Windows安装Perl过程比较繁琐,因此更多的时候,在Windows平台上人们会使用RODBC。

一些平台独立的基于Java的解决方案也提供了对Excel文件的读写操作,特别是对xlsx文件和Off?ice Open XML文件格式。在CRAN上提供了xlConnect和xlsx两个包来分别读取Excel 2007 以及97/2000/XP/2003文件。这两个包都使用了Apache POI Java API项目,需要主动维护。可以运行在任何支持Java的平台上,而不需要再另外安装Microsoft Excel或Off?ice程序。

另一方面,如果你不希望程序依赖于Perl或Java,则可以使用最新发布的openxlsx包。Hadley Wickham也发布了一个功能相似的包,但是稍微有所变化:readxl包能够读(不能写)xls和xlsx格式的文件。

记住:要为自己的应用选择最合适的工具!例如,如果要读取Excel文件而不希望依赖其他程序,我会选择readxl包,但如果要写入Excel 2003电子表格,并且要进行单元运算或者使用其他一些高级功能,有可能我们不能保存Java依赖关系,就应该选择xlConnect或xlsx包,而非openxlsx包。

转载地址:http://jyeyl.baihongyu.com/

你可能感兴趣的文章
Tomcat7后台通过get接收数据处理乱码
查看>>
CI路径中如何去掉index.php
查看>>
精简ICO图标可减小EXE程序文件大小
查看>>
lstm caffe几个变量的含义
查看>>
博客园是不是应该取消反对按钮或者改进反对按钮
查看>>
重写equals()方法时,需要同时重写hashCode()方法
查看>>
Excel打印质量引起的异常及解决方案
查看>>
2.GET与POST的区别
查看>>
tyvj1172自然数拆分
查看>>
Makefile <网络转载>
查看>>
IO流的应用————小型资源管理器
查看>>
C++输入输出流格式控制(转)
查看>>
【C++】C++中的string类的用法总结
查看>>
new pc
查看>>
zabbix之 zabbix server 跟 agent 更换ip地址
查看>>
WebAPI 实现前后端分离的示例
查看>>
自控力极差的人如何自救?
查看>>
java中高级面试题整理及参考答案
查看>>
冯·若依曼体系结构
查看>>
B00009 C语言分割字符串库函数strtok
查看>>