이 문서는 Google Cloud Translation API를 사용해 자동 번역되었습니다.
어떤 문서는 원문을 읽는게 나을 수도 있습니다.
데이터 시각화 프로세스는 데이터 세트 내에 존재하는 복잡한 관계를 이해하는 데 핵심입니다. 데이터를 시각화하면 숨겨진 통찰력을 얻을 수 있습니다.
데이터 시각화는 데이터를 그래픽 형식으로 변환하는 프로세스입니다. 이것은 차트, 그래프 및 지도를 포함한 다양한 방법을 사용하여 수행할 수 있습니다.
데이터 시각화가 중요한 이유는 많습니다. 다음과 같은 도움이 될 수 있습니다.
데이터 시각화는 데이터 분석 프로세스의 모든 단계에서 사용해야 하는 강력한 도구입니다. 이번 포스트에서는 데이터 시각화의 몇 가지 기본 사항을 살펴보겠습니다. R 프로그래밍 언어를 사용하여 차트와 그래프를 만드는 방법을 배웁니다.
데이터 시각화를 시작하려면 작업할 데이터가 있어야 합니다. 이 게시물에서는 내장된 R 데이터 세트 mtcars
를 사용합니다. 이 데이터 세트에는 다양한 자동차 제조사 및 모델에 대한 정보가 포함되어 있습니다.
데이터셋을 로드하기 위해 data()
함수를 사용합니다:
data("mtcars")
데이터셋이 로드되면 head()
함수를 사용하여 데이터셋을 살펴볼 수 있습니다:
head(mtcars)
데이터를 시각화하는 데 사용할 수 있는 다양한 유형의 차트와 그래프가 있습니다. 사용하는 차트 또는 그래프 유형은 작업 중인 데이터 유형과 전달하려는 메시지에 따라 다릅니다.
가장 일반적인 유형의 차트 및 그래프는 다음과 같습니다.
이 섹션에서는 R을 사용하여 이러한 일반적인 차트 유형 중 일부를 만드는 방법을 살펴보겠습니다.
막대 차트는 가장 일반적인 차트 유형 중 하나입니다. 그들은 종종 데이터 포인트를 비교하는 데 사용됩니다.
R에서 막대 차트를 만들려면 barplot()
함수를 사용할 수 있습니다.
barplot(mtcars$mpg)
또한 barplot()
함수를 사용하여 여러 데이터 포인트를 비교할 수 있습니다. 예를 들어 다양한 자동차 브랜드의 mpg를 비교할 수 있습니다.
barplot(mtcars$mpg, mtcars$brand)
꺾은선형 차트는 또 다른 일반적인 유형의 차트입니다. 시간이 지남에 따라 데이터를 시각화하는 데 자주 사용됩니다.
R에서 꺾은선형 차트를 만들려면 plot()
함수를 사용할 수 있습니다.
plot(mtcars$mpg)
plot()
함수를 사용하여 여러 데이터 포인트를 비교할 수도 있습니다. 예를 들어 다양한 자동차 브랜드의 mpg를 비교할 수 있습니다.
plot(mtcars$mpg, mtcars$brand)
원형 차트는 데이터를 전체에 대한 비율로 시각화하는 데 사용되는 차트 유형입니다.
R에서 원형 차트를 만들려면 pie()
함수를 사용할 수 있습니다.
pie(mtcars$mpg)
또한 pie()
함수를 사용하여 여러 데이터 포인트를 비교할 수 있습니다. 예를 들어 다양한 자동차 브랜드의 mpg를 비교할 수 있습니다.
pie(mtcars$mpg, mtcars$brand)
산점도는 두 숫자 변수 사이의 관계를 시각화하는 데 사용되는 일종의 차트입니다.
R에서 산점도를 만들려면 plot()
함수를 사용할 수 있습니다.
plot(mtcars$mpg, mtcars$hp)
plot()
함수를 사용하여 여러 데이터 포인트를 비교할 수도 있습니다. 예를 들어 다양한 자동차 브랜드의 mpg를 비교할 수 있습니다.
plot(mtcars$mpg, mtcars$brand)
기본 차트 또는 그래프를 만든 후에는 데이터를 더 잘 전달할 수 있도록 사용자 지정하고 싶을 것입니다. R에는 차트와 그래프를 사용자 지정하기 위한 다양한 옵션이 있습니다.
고려할 수 있는 몇 가지 옵션은 다음과 같습니다.
이 섹션에서는 이전 섹션에서 생성한 일부 차트 및 그래프를 사용자 지정하는 방법을 살펴보겠습니다.
차트나 그래프에 제목을 추가하면 데이터 메시지를 보다 효과적으로 전달할 수 있습니다.
R에서 차트나 그래프에 제목을 추가하려면 title()
함수를 사용할 수 있습니다.
title("Miles per gallon by car brand")
차트나 그래프에 레이블을 추가하면 데이터를 더 이해하기 쉽게 만들 수 있습니다.
R에서 차트나 그래프에 레이블을 추가하려면 xlab()
및 ylab()
함수를 사용할 수 있습니다.
xlab("Car brand")
ylab("Miles per gallon")
차트 또는 그래프의 색상을 변경하면 데이터를 시각적으로 더 매력적으로 만드는 데 도움이 될 수 있습니다.
R에서 차트나 그래프의 색상을 변경하려면 col
인수를 사용할 수 있습니다.
barplot(mtcars$mpg, mtcars$brand, col = "red")
차트 또는 그래프의 선 유형을 변경하면 데이터를 시각적으로 더 매력적으로 만드는 데 도움이 될 수 있습니다.
R에서 차트 또는 그래프의 선 유형을 변경하려면 lty
인수를 사용할 수 있습니다.
plot(mtcars$mpg, mtcars$hp, lty = "dotted")
차트나 그래프에 범례를 추가하면 데이터를 더 이해하기 쉽게 만들 수 있습니다.
R의 차트나 그래프에 범례를 추가하려면 legend()
함수를 사용할 수 있습니다.
legend("topright", mtcars$brand, cex = 0.5)
이번 포스팅에서는 데이터 시각화의 기초에 대해 알아보았습니다. R 프로그래밍 언어를 사용하여 차트와 그래프를 만드는 방법을 배웠습니다. 또한 데이터를 더 잘 전달하기 위해 차트와 그래프를 사용자 지정하는 방법도 배웠습니다.