欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 艺术 > R语言基础知识总结(超详细整理)

R语言基础知识总结(超详细整理)

2025/6/9 9:51:05 来源:https://blog.csdn.net/weixin_53920044/article/details/148412942  浏览:    关键词:R语言基础知识总结(超详细整理)

一、R语言简介

R是一种用于统计分析、数据可视化和科学计算的开源编程语言和环境。其语法简洁,内置丰富的统计函数和图形函数,广泛应用于数据科学、机器学习和生物统计等领域。


整体知识点目录:

R语言基础知识总结
│
├─ 安装与配置
│    ├─ 安装R环境
│    ├─ 配置RStudio
│    └─ 包管理(安装、加载)
│
├─ 基本语法
│    ├─ 变量与数据类型
│    ├─ 运算符
│    ├─ 流程控制(条件、循环)
│    └─ 函数定义与调用
│
├─ 数据结构
│    ├─ 向量(vector)
│    ├─ 矩阵(matrix)
│    ├─ 数据框(data.frame)
│    ├─ 列表(list)
│    └─ 因子(factor)
│
├─ 数据操作
│    ├─ 读取与写入文件
│    ├─ 子集选择与索引
│    ├─ 数据清洗
│    └─ 数据变换(排序、合并、分组)
│
├─ 可视化
│    ├─ 基础绘图函数
│    ├─ ggplot2简介
│    └─ 图形美化与定制
│
├─ 常用包介绍
│    ├─ tidyverse
│    ├─ data.table
│    ├─ dplyr
│    └─ readr
│
└─ 练习题与解析├─ 选择题├─ 判断题├─ 填空题├─ 简答题└─ 编程题

二、安装与环境配置

  1. 安装:访问CRAN镜像,下载适合操作系统的安装包并安装。
  2. RStudio:推荐使用RStudio IDE,提供代码编辑、调试、可视化和项目管理功能。
  3. Package管理:使用install.packages("包名")安装,使用library(包名)加载。
# 安装并加载ggplot2包
install.packages("ggplot2")
library(ggplot2)

三、基本语法

1. 变量与赋值

  • 赋值符号<-=
x <- 10
y = 3.14

2. 注释

# 单行注释

3. 数据类型

类型描述示例
numeric数值类型(浮点)3.14, 2
integer整数类型1L, 2L
character字符串"Hello"
logical布尔值TRUE, FALSE
factor分类变量factor(c("A","B"))
Date日期类型as.Date("2025-06-04")

4. 数据结构

  • 向量(vector):同一类型元素的一维数组

    v <- c(1, 2, 3, 4)
    
  • 矩阵(matrix):二维数组

    m <- matrix(1:6, nrow=2, ncol=3)
    
  • 数据框(data.frame):异构二维表

    df <- data.frame(Name=c("A","B"), Score=c(90,85))
    
  • 列表(list):可包含不同类型对象

    lst <- list(num=1, str="R", vec=c(1,2,3))
    

四、基本操作

1. 索引与切片

v[2]        # 第二个元素
m[1, ]      # 矩阵第一行
df$Score    # 数据框列访问
lst[["vec"]] # 列表元素访问

2. 统计函数

函数作用示例
mean(x)均值mean(v)
sum(x)求和sum(v)
sd(x)标准差sd(v)
summary(x)概括性统计summary(df)

五、函数与流程控制

1. 自定义函数

add <- function(a, b) {return(a + b)
}
add(2,3)

2. 条件语句

if (x > 0) {print("正数")
} else {print("非正数")
}

3. 循环语句

for (i in 1:5) {print(i)
}

六、数据输入输出

# 读取CSV
data <- read.csv("data.csv", header=TRUE)
# 写出CSV
write.csv(data, "out.csv", row.names=FALSE)

七、可视化

使用ggplot2包:

library(ggplot2)
ggplot(df, aes(x=Name, y=Score)) +geom_bar(stat="identity")

八、练习题(共30题)

一、选择题(每题2分,共10分)

  1. 下列哪种数据结构可存储不同类型元素?
    A. vector B. matrix C. list D. factor

    答案:C
    解析:list可包含多种类型元素。

  2. R中用于计算均值的函数是?
    A. sum() B. mean() C. sd() D. median()

    答案:B
    解析mean()用于计算均值。

  3. 下列赋值操作中不正确的是?
    A. x <- 5 B. y = 2 C. 3 -> z D. <- a 4

    答案:D
    解析<- a 4语法错误。

  4. 将数据框df按列访问Score列可用?
    A. df[“Score”] B. df$Score C. df[[“Score”]] D. 以上均可

    答案:D
    解析:三种方式均可访问。

  5. 下列哪种函数能展示数据框的摘要信息?
    A. head() B. dim() C. summary() D. str()

    答案:C
    解析summary()生成概括性统计。

二、判断题(每题1分,共5分)

序号题目正误
1R中字符串使用单引号和双引号均可。
2matrix可存储不同类型元素。
3install.packages()安装包时需联网。
4data.frame的行名称可以重复。
5函数rm()可删除变量。

三、填空题(每题2分,共10分)

  1. R中表示逻辑真值的关键字是 ________

    答案:TRUE

  2. 将数字向量v中的NA值删除可用函数 ________()

    答案:na.omit

  3. 将列表lst的第二个元素访问可写作 ________

    答案:lst[[2]]

  4. 读取CSV文件的函数是 ________

    答案:read.csv

  5. ggplot中添加散点图的几何函数是 ________()

    答案:geom_point

四、简答题(每题4分,共20分)

  1. 简述factor在R中的作用及使用场景。

    参考答案要点:factor用于存储分类变量,内部以整数和标签形式保存;适用于统计建模中的分类数据。

  2. 说明如何在R中安装和加载包,并举例说明。

    参考答案要点install.packages("包名")安装,library(包名)require(包名)加载。

  3. 解释data.frame与matrix的区别。

    参考答案要点:data.frame可存储异构类型,matrix只能存储同一类型元素;data.frame有行列名称。

  4. 描述ggplot2作图流程的三个核心要素。

    参考答案要点:数据(data)、映射(aes)、几何对象(geom_)。

  5. 谈谈向量化运算在R中的优势。

    参考答案要点:向量化运算无需显式循环,底层调用C语言实现,运行速度快且代码简洁。

五、编程题(每题5分,共25分)

  1. 写函数count_na,统计向量中NA值个数并返回。
count_na <- function(x) {sum(is.na(x))
}

解析is.na()返回逻辑向量,sum()累加TRUE个数。

  1. 编写函数normalize,将数值向量按min-max归一化到[0,1]。
normalize <- function(x) {(x - min(x, na.rm=TRUE)) / (max(x, na.rm=TRUE) - min(x, na.rm=TRUE))
}

解析:使用最小最大值计算归一化。

  1. 实现函数filter_above,返回大于阈值的向量子集。
filter_above <- function(x, thr) {x[x > thr]
}

解析:使用逻辑索引过滤。

  1. 写函数read_and_summary,读取CSV并返回摘要统计(summary)。
read_and_summary <- function(file) {dat <- read.csv(file, header=TRUE)summary(dat)
}

解析:结合I/O与统计函数。

  1. 用ggplot2绘制散点图,x轴为Sepal.Length,y轴为Sepal.Width(以iris数据集为例)。
library(ggplot2)
ggplot(iris, aes(x=Sepal.Length, y=Sepal.Width)) +geom_point() +labs(title="鸢尾花花萼尺寸散点图")

解析:演示常见可视化操作。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词