R 语言 统计分析 回归分析基础

R阿木 发布于 1 天前 5 次阅读


R 语言回归分析基础教程

回归分析是统计学中一种重要的数据分析方法,用于研究变量之间的依赖关系。在R语言中,回归分析是一个强大的工具,可以帮助我们理解数据背后的模式,并预测未来的趋势。本文将围绕R语言回归分析的基础,从简单的线性回归开始,逐步深入到更复杂的模型,如多项式回归、逻辑回归等。

线性回归

线性回归是最基本的回归分析方法,它假设因变量与自变量之间存在线性关系。

1. 数据准备

我们需要准备一些数据。以下是一个简单的数据集,包含两个变量:身高(Height)和体重(Weight)。

R
创建数据框
data <- data.frame(
Height = c(150, 160, 170, 180, 190),
Weight = c(50, 55, 60, 65, 70)
)

2. 线性回归模型

使用`lm()`函数创建线性回归模型。

R
创建线性回归模型
model <- lm(Weight ~ Height, data = data)

3. 模型摘要

使用`summary()`函数查看模型的摘要信息。

R
查看模型摘要
summary(model)

4. 模型诊断

为了确保模型的有效性,我们需要进行模型诊断。

R
模型诊断
par(mfrow = c(2, 2))
plot(model)

5. 预测

使用模型进行预测。

R
预测
new_data <- data.frame(Height = c(175, 185))
predictions <- predict(model, newdata = new_data)
print(predictions)

多项式回归

多项式回归是线性回归的扩展,它允许因变量与自变量之间存在非线性关系。

1. 数据准备

使用与线性回归相同的数据集。

2. 多项式回归模型

使用`poly()`函数将自变量转换为多项式。

R
创建多项式回归模型
model_poly <- lm(Weight ~ poly(Height, 2), data = data)

3. 模型摘要

查看模型摘要。

R
查看模型摘要
summary(model_poly)

4. 模型诊断

进行模型诊断。

R
模型诊断
par(mfrow = c(2, 2))
plot(model_poly)

5. 预测

进行预测。

R
预测
new_data_poly <- data.frame(Height = c(175, 185))
predictions_poly <- predict(model_poly, newdata = new_data_poly)
print(predictions_poly)

逻辑回归

逻辑回归用于分析因变量是二元分类的情况。

1. 数据准备

准备一个包含因变量(是否购买,Binary)和自变量(年龄,Age)的数据集。

R
创建数据框
data_logistic <- data.frame(
Age = c(25, 30, 35, 40, 45),
Binary = c(0, 1, 0, 1, 0)
)

2. 逻辑回归模型

使用`glm()`函数创建逻辑回归模型。

R
创建逻辑回归模型
model_logistic <- glm(Binary ~ Age, family = binomial, data = data_logistic)

3. 模型摘要

查看模型摘要。

R
查看模型摘要
summary(model_logistic)

4. 概率预测

使用模型进行概率预测。

R
概率预测
predictions_prob <- predict(model_logistic, type = "response")
print(predictions_prob)

结论

本文介绍了R语言中回归分析的基础,包括线性回归、多项式回归和逻辑回归。通过这些示例,我们可以看到R语言在统计分析中的强大功能。在实际应用中,我们可以根据具体问题选择合适的回归模型,并通过模型诊断和预测来分析数据。

扩展阅读

- R语言基础教程
- R语言高级统计分析
- 《R语言实战》

通过学习这些资源,您可以更深入地了解R语言在统计分析中的应用。