이 문서는 Google Cloud Translation API를 사용해 자동 번역되었습니다.
어떤 문서는 원문을 읽는게 나을 수도 있습니다.
ETL은 추출, 변환 및 로드를 나타냅니다. 여러 소스에서 데이터를 추출하여 데이터 웨어하우스에 로드할 수 있는 형식으로 변환한 다음 데이터 웨어하우스에 로드하는 프로세스입니다. ETL은 데이터 처리 및 분석의 중요한 부분이며 시간이 많이 걸리고 복잡한 프로세스일 수 있습니다.
AWS Glue는 분석을 위해 데이터를 쉽게 준비하고 로드할 수 있게 해주는 완전관리형 ETL 서비스입니다. 데이터 검색에서 데이터 변환 및 데이터 로드에 이르기까지 ETL의 모든 측면을 처리할 수 있습니다. Glue는 데이터를 추출, 변환 및 로드하는 코드를 자동으로 생성할 수 있습니다. 또한 데이터 소스를 자동으로 검색 및 등록하고 데이터를 적절한 데이터 유형에 매핑할 수 있습니다.
AWS Glue는 다양한 데이터 소스에서 데이터를 검색하고 추출할 수 있습니다. JDBC 드라이버를 사용하여 데이터 원본에 연결할 수 있으며 Amazon S3 데이터 원본에도 연결할 수 있습니다.
JDBC 데이터 소스에서 데이터를 추출하려면 먼저 Glue 연결을 생성해야 합니다. 연결은 데이터 소스에 연결하는 데 필요한 매개변수를 정의합니다. 연결을 생성하면 이를 사용하여 크롤러를 실행할 수 있습니다. 크롤러는 데이터 소스를 스캔하고 데이터에 대한 스키마를 생성하는 Glue 작업입니다. 스키마는 AWS Glue 데이터 카탈로그에 저장됩니다.
크롤러를 실행한 후에는 Glue 작업을 생성하여 데이터 원본에서 데이터를 추출할 수 있습니다. 작업은 데이터 원본에서 데이터를 읽고 Amazon S3 데이터 대상에 씁니다. 데이터를 새 Amazon S3 버킷에 쓰도록 선택하거나 기존 Amazon S3 버킷을 덮어쓸 수 있습니다.
데이터를 추출한 후 AWS Glue를 사용하여 변환할 수 있습니다. Glue는 다양한 데이터 변환 작업을 처리할 수 있는 강력한 ETL 엔진을 제공합니다.
데이터를 변환하려면 먼저 Glue 작업을 생성해야 합니다. Glue 작업은 실행될 ETL 프로세스를 정의합니다. AWS Glue 콘솔을 사용하여 Glue 작업을 생성하고 편집할 수 있습니다.
Glue 작업을 만들고 나면 Glue 변환을 작업에 추가할 수 있습니다. Glue 변환은 데이터 원본에서 데이터를 읽을 때 데이터를 수정하는 데 사용됩니다. 예를 들어 Glue 변환을 사용하여 데이터를 필터링하거나 열의 데이터 유형을 변경할 수 있습니다.
Glue 변환을 추가한 후 Glue 작업을 실행할 수 있습니다. 작업은 데이터 원본에서 데이터를 읽고, Glue 변환을 적용하고, 변환된 데이터를 Amazon S3 데이터 대상에 씁니다.
데이터를 변환한 후 데이터 웨어하우스에 로드할 수 있습니다. AWS Glue는 Amazon Redshift, Amazon DynamoDB 및 Amazon Aurora에 데이터를 로드할 수 있습니다.
데이터 웨어하우스에 데이터를 로드하려면 먼저 Glue 작업을 생성해야 합니다. Glue 작업은 실행될 ETL 프로세스를 정의합니다. AWS Glue 콘솔을 사용하여 Glue 작업을 생성하고 편집할 수 있습니다.
Glue 작업을 만들고 나면 Glue 데이터 로드 변환을 작업에 추가할 수 있습니다. Glue 데이터 로드 변환은 데이터를 데이터 웨어하우스에 로드하는 데 사용됩니다. 데이터를 새 테이블에 로드하도록 선택하거나 데이터를 기존 테이블에 추가할 수 있습니다.
Glue 데이터 로드 변환을 추가한 후 Glue 작업을 실행할 수 있습니다. 작업은 데이터 소스에서 데이터를 읽고, Glue 변환을 적용하고, 데이터를 데이터 웨어하우스로 로드합니다.
AWS Glue는 분석을 위해 데이터를 쉽게 준비하고 로드할 수 있게 해주는 완전관리형 ETL 서비스입니다. 데이터 검색에서 데이터 변환 및 데이터 로드에 이르기까지 ETL의 모든 측면을 처리할 수 있습니다. Glue는 데이터를 추출, 변환 및 로드하는 코드를 자동으로 생성할 수 있습니다. 또한 데이터 소스를 자동으로 검색 및 등록하고 데이터를 적절한 데이터 유형에 매핑할 수 있습니다.