本文已使用 Google Cloud Translation API 自动翻译。
某些文档最好以原文阅读。
数据可视化过程是理解数据集中存在的复杂关系的关键。通过可视化数据,我们可以获得原本可能隐藏的洞察力。
数据可视化是将数据转换为图形格式的过程。这可以使用多种方法来完成,包括图表、图形和地图。
数据可视化很重要的原因有很多。它可以帮助我们:
数据可视化是一个强大的工具,应该在数据分析过程的每个阶段使用。在这篇文章中,我们将了解一些数据可视化的基础知识。我们将学习如何使用 R 编程语言创建图表和图形。
在我们开始可视化数据之前,我们需要有一些数据可以使用。对于这篇文章,我们将使用内置的 R 数据集“mtcars”。该数据集包含有关不同品牌和型号汽车的信息。
要加载数据集,我们将使用 data()
函数:
data("mtcars")
加载数据集后,我们可以使用 head()
函数查看它:
head(mtcars)
有许多不同类型的图表和图形可用于可视化数据。您使用的图表或图形的类型将取决于您正在处理的数据类型以及您想要传达的信息。
一些最常见的图表和图形类型是:
在本节中,我们将了解如何使用 R 创建这些常见图表类型中的一些。
条形图是最常见的图表类型之一。它们通常用于比较数据点。
要在 R 中创建条形图,我们可以使用 barplot() 函数:
barplot(mtcars$mpg)
我们还可以使用 barplot()
函数来比较多个数据点。例如,我们可以比较不同汽车品牌的mpg:
barplot(mtcars$mpg, mtcars$brand)
折线图是另一种常见的图表类型。它们通常用于随着时间的推移可视化数据。
要在 R 中创建折线图,我们可以使用 plot() 函数:
plot(mtcars$mpg)
我们还可以使用 plot()
函数来比较多个数据点。例如,我们可以比较不同汽车品牌的mpg:
plot(mtcars$mpg, mtcars$brand)
饼图是一种图表,用于将数据可视化为整体的比例。
要在 R 中创建饼图,我们可以使用 pie()
函数:
pie(mtcars$mpg)
我们还可以使用 pie()
函数来比较多个数据点。例如,我们可以比较不同汽车品牌的mpg:
pie(mtcars$mpg, mtcars$brand)
散点图是一种图表,用于可视化两个数值变量之间的关系。
要在 R 中创建散点图,我们可以使用 plot() 函数:
plot(mtcars$mpg, mtcars$hp)
我们还可以使用 plot()
函数来比较多个数据点。例如,我们可以比较不同汽车品牌的mpg:
plot(mtcars$mpg, mtcars$brand)
创建基本图表或图形后,您可能希望对其进行自定义以更好地传达数据。在 R 中自定义图表和图形有许多不同的选项。
您可能要考虑的一些选项是:
在本节中,我们将了解如何自定义我们在上一节中创建的一些图表和图形。
为图表或图形添加标题有助于更有效地传达数据信息。
要在 R 中为图表或图形添加标题,我们可以使用 title()
函数:
title("Miles per gallon by car brand")
向图表或图形添加标签有助于使数据更易于理解。
要在 R 中向图表或图形添加标签,我们可以使用 xlab()
和 ylab()
函数:
xlab("Car brand")
ylab("Miles per gallon")
更改图表或图形的颜色有助于使数据更具视觉吸引力。
要更改 R 中图表或图形的颜色,我们可以使用 col
参数:
barplot(mtcars$mpg, mtcars$brand, col = "red")
更改图表或图形的线条类型有助于使数据更具视觉吸引力。
要更改 R 中图表或图形的线条类型,我们可以使用 lty 参数:
plot(mtcars$mpg, mtcars$hp, lty = "dotted")
向图表或图形添加图例有助于使数据更易于理解。
要在 R 中向图表或图形添加图例,我们可以使用 legend()
函数:
legend("topright", mtcars$brand, cex = 0.5)
在这篇文章中,我们了解了数据可视化的基础知识。我们已经学习了如何使用 R 编程语言创建图表和图形。我们还学习了如何自定义图表和图形以更好地传达我们的数据。