R语言基础培训第一讲 R语言入门ppt课件.ppt
《R语言基础培训第一讲 R语言入门ppt课件.ppt》由会员分享,可在线阅读,更多相关《R语言基础培训第一讲 R语言入门ppt课件.ppt(65页珍藏版)》请在三一办公上搜索。
1、R语言入门,2,什么是R?,R是一种统计绘图语言,也指实现该语言的软件。,The R Project for Statistical Computing,3,为什么要学会R?,SPSS(Statistical Package for the Social Sciences)的发明者诺曼奈伊(Norman Nie)说: “没有什么统计概念是R不能表现的。,5,R简 史,R语言是从S统计绘图语言演变而来,可看作S的方言。 S语言上世纪70年代诞生于贝尔实验室,由约翰钱伯斯(John Chambers)开发。 基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,在国外
2、学术界应用很广,对SPSS和 SAS有力冲击。 1995年由新西兰Auckland大学统计系的罗斯艾卡(Ross Ihaka)和罗伯特简特曼(Robert Gentleman),基于S语言的源代码,编写了一能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。,R 的起源,Robert Gentleman,Ross Ihaka,自1997年以后,有一个核心团队,这一团队能对 R 的源代码进行修改。,7,R的优点,多领域的统计资源 目前在R网站上约有8230个程序包,涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。免费开源统计分
3、析能力突出作图功能强大拓展与开发能力强,8,R的缺点,用户需要对命令熟悉 与代码打交道,需要记住常用命令。帮助系统均为英文占用内存 所有的数据处理在内存中进行,不适于处理超大规模的数据。运行速度稍慢 即时编译,约相当于C语言的1/20。,如何学习R?,熟悉语法训练思维善于求助熟能生巧保持兴趣,Never too late and too old to learn R ,10,R软件首页 http:/www.r-project.org/,11,Windows下载和安装R,下载完成后,双击R-3.2.4-win.exe 开始安装。一直点击下一步,各选项默认,语言建议选英文。,12,图 4 R登陆界
4、面(Windows版)路径: 开始所有程序R 3.2.4,菜单栏,快捷按钮,控制台,光标:等待输入,13,R图形界面:Rstudio,Rstudio是R的图形界面之一,可以让 R 语言代码更直观、明了地运行。 RStudio 同样 是 免费 和 开源 的 ,可以在网站上自由下载与使用(http:/ 开始安装。,RStudio 有以下几大优点:,代码字体高亮,代码完整性智能识别、自动缩进;可直接执行 R 程序代码;可运行多个 R 程序;可直接浏览工作表和数据;可随意缩放绘制的图形,并且有多种输出格式;整合 R 帮助和 R 使用文档;可查看 R 命令的运行记录。,15,17,R程序包(R Pack
5、ages),程序包是什么? R程序包是多个函数的集合,具有详细的说明和示例。 Window下的R程序包是经过编译的zip包。每个程序包包含R函数、数据、帮助文件、描述文件等。为什么要安装程序包? R程序包是R功能扩展,特定的分析功能,需要用相应的程序包实现。 例如:系统发育分析,常用到ape程序包,群落生态学vegan包等。,18,install.views(Environmetrics),19,三种平台上的程序包,20,R程序包,在CRAN 提供了每个包的源代码和编译好的程序包以vegan包为例,CRAN提供了:Package source: vegan_1.17-2.tar.gz MacO
6、S X binary: vegan_1.17-2.tgz Windows binary: vegan_1.17-2.zip Reference manual: vegan.pdf Window下程序包为zip文件,安装时不要解压缩。,21,安装程序包的方法,1 菜单安装在联网的条件下,按菜单栏【程序包】下拉选择【安装程序包】 ,选择所需的程序包进行实时安装;2 联网命令安装例如: 要安装vegan包,在控制台中输入 install.packages(vegan)3 本地安装路径:Packagesinstall packages from local files选择本地磁盘上存储zip包的文件夹
7、。4 脚本安装在联网的条件下,请运行Rpackages.install.R程序,即可完成本培训所需的程序包安装。,22,程序包使用与更新,程序包的中函数,都要先导入,再使用,因此导入程序包是第一步。在控制台中输入如下命令:library(lattice)library(ggplot2)所有程序包的更新update.packages()注意:R 命令对大小写敏感,因此使用命令方式安装和载入程序包时应特别注意。,23,查看程序包帮助文件,vegan 程序包内部都有哪些函数?分别有什么功能?查询程序包内容最常用的方法:1 菜单 帮助Html帮助2 查看pdf帮助文档,24,查看函数的帮助文件,函数的
8、默认值是什么? 怎么使用? 使用时需要注意什么问题? 需要查询函数的帮助。1 ?t.test 2 RGuiHelpHtml help3 apropos(t.test)4 help(t.test)5 help.search(t.test)6 查看R包pdf手册,25,26,帮助文件的内容,t.teststats #函数名及所在包 Fitting Linear Models #标题Description #函数描述Usage #默认选项Arguments #参数Details #详情Author(s) #作者References #参考文献Examples #举例,27,练习一 安装R并导入程序包
9、,1. 安装R和Rstudio软件、熟悉菜单2. 本地安装程序包: vegan3. 调用程序包,查看程序包的帮助library(vegan)查找vegan包中cca函数的帮助输入 ?cca(试试?cca)将其中的Example粘贴到控制台中,查看运行的结果。,R数据集创建,数据创建 向量,数组,矩阵,数据框,列表,因子数据输入 scan(),csv文件,excel文件,sas数据数据存储 write.table(), write.csv(), save(),向量vector,概念:用于存储数值型、字符型或逻辑型数据的一维数组。 例子: a - c(1, 2, 5, 3, 6, -2, 4) #
10、 数值型向量 b - c(one, two, three) # 字符型向量 c - c(TRUE, TRUE, TRUE) # 逻辑型向量 注意:单个向量中的数据必须是相同的类型(数值型、字符型或逻辑型)。,创建重复的向量, rep(2:5, 2) # 等价于 rep(2:5, times = 2) 1 2 3 4 5 2 3 4 5 rep(2:5, rep(2, 4) 1 2 2 3 3 4 4 5 5 rep(1:3, times = 4, each = 2) 1 1 1 2 2 3 3 1 1 2 2 3 3 1 1 2 2 3 3 1 1 2 2 3 3 paste(c(X,Y),
11、1:10, sep = -) #不规则1 X-1 Y-2 X-3 Y-4 X-5 Y-6 X-7 Y-8 X-9 Y-10 rep(factor(LETTERS1:3), 5) 1 A B C A B C A B C A B C A B C Levels: A B C,向量中元素的访问,a a3 1 5 # 向量 a 中第一、三、五个数据 ac(1, 3, 5) 1 1 5 6 # 向量 a 中第二到第六个数据 a2:6 1 2 5 3 6 -2,# 向量 a 中数值大于 3 的所有数据 aa3 1 5 6 4 # 去掉第一个值 a-1 1 2 5 3 6 -2 4 # 去掉前三个值 a-1:
12、-31 3 6 -2 4,矩阵matrix,概念:一个二维数组#创建一个 22 的矩阵 matrix(1:4, nrow = 2, ncol = 2) ,1 ,2 1, 1 3 2, 2 4 # 生成单位阵 diag(3) ,1 ,2 ,3 1, 1 0 0 2, 0 1 0 3, 0 0 1,mat1-matrix(1:12,3,4, byrow=T)mat2-matrix(1:12,3,4, byrow=F),矩阵子集(元素)的提取, x x2,2 # 第二行、第 2 列的元素 1 4 x2, # 第二行的所有元素 1 2 4 6 x ,2 # 第 2 列的所有元素 1 3 4 x2, c
13、(2, 3) # 第二行中第 2、3 列的元素 1 4 6,数据框data frame,使用函数 data.frame( )创建: mydata patientID age diabetes status patientdata patientdata1:2 # 第 1、2 列的所有元素 patientdata$age # $符合用于选取一个指定的变量。,列表list,R 数据类型中最为复杂的一种数据结构。列表就是包含任何类型的对象,可以是若干向量、矩阵、数据框,甚至其他列表的组合。通过函数 list( )来创建: mylist g h j k mylist - list(title = g,
14、 ages = h, j, k),因子factor,概念:是一种向量对象,它给自己的组件指定了一个离散的分类(分组),它的组件由其他等长的向量组成。用函数 factor( )创建一个因子,levels 按序(字母序或数值序)排列。#为 province 创建因子 province pf pf 1 四川 湖南 江苏 四川 四川 四川 湖南 江苏 湖南 江苏 Levels: 湖南 江苏 四川,数据的输入,1 键盘输入mydata - data.frame(age = numeric(0), gender = character(0), weight = numeric(0) ) mydata -
15、edit(mydata) # 输入或修改 mydata 中的数据2 使用 scan()函数mydata - scan( file = ex.data, what = list(, 0, 0 ) #将压缩型数据读入一个向量或列表3 导入 csv 文件mydata2 - read.table( file = D:/dbh.csv, header = T, sep = , ) mydata3 - read.csv( file = D:/dbh.csv, header = T) 4 网络中读取表格或csv文件tbl-read.csv(http:/,5 导入 Excel 数据library(RODBC)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- R语言基础培训第一讲 R语言入门ppt课件 语言 基础 培训 第一 入门 ppt 课件
链接地址:https://www.31ppt.com/p-1377166.html