이 글은 Coursera의 Google Data Analytics Professional Certificate의 강의 내용 일부를 발췌한 학습 내용입니다.
데이터 라이프 사이클
- 계획: 필요한 데이터 유형, 데이터 관리 방법, 데이터 책임자를 결정합니다.
- 캡처: 다양한 소스에서 데이터를 수집하거나 가져옵니다.
- 관리: 데이터를 유지하고 관리합니다. 데이터 저장 방법 및 위치, 데이터를 저장하는 데 사용하는 도구를 결정하는 일이 포함됩니다.
- 분석: 데이터를 사용하여 문제를 해결하고, 의사결정을 내리고, 비즈니스 목표를 지원합니다.
- 보관: 장기적으로 저장하거나 향후 참고를 위해 관련 데이터를 보관합니다.
- 폐기: 저장소에서 데이터를 삭제하고 데이터의 공유 사본을 모두 삭제합니다.
스프레드시트
스프레드시트를 사용하여 데이터를 수집하고 구성합니다. 예시로는, Microsoft Excel과 Google Sheets가 있습니다.
- 정보 수집, 저장, 구성, 정렬
- 패턴 식별, 각 특정 데이터 프로젝트에 적합한 방식으로 데이터 통합
- 그래프 및 차트와 같은 우수한 데이터 시각화 자료 생성
데이터베이스 및 쿼리 언어
데이터베이스는 컴퓨터 시스템에 저장된 구조화된 데이터 모음입니다.대표 프로그램으로는 MySQL, Microsoft SQL Server, BigQuery가 있습니다.
- 애널리스트가 데이터베이스에서 특정 정보를 분리할 수 있음
- 데이터베이스에 대한 요청을 더 쉽게 알아보고 이해할 수 있음
- 애널리스트가 분석을 위해 데이터베이스에서 데이터를 선택, 생성, 추가, 다운로드할 수 있음
시각화 도구
데이터 애널리스트는 그래프, 맵, 테이블, 차트 등의 다양한 시각화 도구를 사용합니다. 예시로는 Tableau와 Looker, R, 파이썬 등을 사용하기도 합니다.
- 복잡한 숫자를 사람들이 이해할 수 있는 스토리로 전환
- 이해관계자가 정보에 기반한 의사결정과 효과적인 비즈니스 전략으로 이어지는 결론을 찾아내도록 지원
작업에 맞는 도구 선택
데이터 분석 과정의 단계에 따라 다른 도구를 사용해야 합니다.
두 도구 모두 데이터 애널리틱스에 매우 유용하므로 일반적으로함께 사용하여 작업합니다.
예를 들어 데이터베이스에 데이터를 저장한 다음 분석을 위해 스프레드시트로 내보낼 수 있습니다. 스프레드시트에서 정보를 수집하는 경우 정보가 너무 많아지면 데이터베이스로 가져올 수도 있습니다.
'Data analytics' 카테고리의 다른 글
[Coursera/Google Data Analytics] 데이터 시각화 계획 (0) | 2024.01.03 |
---|