<데이터 분석이란 무엇인가?> 아티클을 읽고.
https://yozm.wishket.com/magazine/detail/1567/
[주제]
- 데이터 분석은 무엇인가?
- 왜 모두가 데이터 분석이 중요하다고 말하는가?
- 데이터 분석 프로세스를 단계별로 정리
[아티클 요약]
- 요약 :
- 데이터란? 데이터는 특정 사실이나 정보의 집합을 의미
- 데이터 분석이란? 데이터를 정리, 변환, 조작, 검사하여 유용한 인사이트를 도출하는 작업 → 모든 데이터로부터 패턴과 상관관계를 파악하여 복잡한 문제에 대한 해결책을 찾는다.
- 왜 중요한가?
- 고객 타깃팅 개선 - 제품 및 서비스를 현재 시장의 요구사항에 맞춤
- 성공과 성과를 측정 - 시장에서 얼마나 경쟁력이 있는지 측정
- 문제 해결에 도움 - 정보에 입각한 올바른 결정을 내릴 수 있음
- 데이터 분석 프로세스의 이해
- 주요 포인트 :
- 데이터 분석가는 도구와 프로세스를 사용하여 데이터의 수집,수정, 조사, 분석, 인사이트 도출, 지식 내재화를 담당한다.
- 정성 데이터와 정량 데이터의 차이점
- 정성적 데이터
- 이미지, 비디오, 텍스트, 오디오
- 측정하거나 계산 불가능
- 사람들의 감정, 동기, 의견, 인식, 편견 포함
- ‘무엇을’ ‘왜’ ‘어떻게’와 같은 질문에 답변
- 정량적 데이터
- 숫자로 표현
- 셀 수 있고 측정 가능하며 비교할 수 있다
- ‘얼마나 많이’ ‘얼마나 자주’ ‘얼마나 오래’와 같은 질문에 답변
- 정성적 데이터
- 데이터 분석 프로세스 개요
- 1단계: 답변이 필요한 질문 인식 및 식별
- 문제 정의 / 데이터 분석의 목적 / 무엇을 달성하고 싶나? / 분석이 왜 필요한가? 에 대한 답변
- 비즈니스 목표에 대한 이해도와 인사이트가 중요
- 2단계: 원시 데이터 수집
- 원시 데이터 목록
- 사용자 그룹, 설문 조사, 양식, 설문지, 내부 문서, 기업에서 이미 수행한 인터뷰 결과
- 고객 리뷰와 고객 만족도에 대한 피드백
- 거래 및 구매 내역 기록, 비즈니스 재무 또는 마케팅 부서에서 만든 자료와 및 재무 수치 보고서
- 회사에서 사용하는 CRM(고객 관계 관리 시스템)
- 웹사이트 및 소셜 미디어 활동과 월간 방문자를 현황 모니터링
- 소셜 미디어 고객 참여를 모니터링
- 자주 검색되는 키워드와 검색어 추적하기
- 사람들이 어떤 광고가 자주 클릭하는지 확인하기
- 고객 전환율 확인하기
- 이메일 오픈율을 확인하기
- 타사 서비스를 사용하여 회사의 데이터를 경쟁업체와 비교하기
- 데이터베이스 쿼리
- 공개 데이터 세트를 웹 스크래핑을 통해 수집. 웹 스크래핑은 웹사이트에서 데이터와 콘텐츠를 추출하고 수집하는 행위입니다.
- 원시 데이터 목록
- 3단계: 데이터 정제
- 필요한 데이터를 모두 수집했는가
- 데이터의 구조화 필요
- 정제 작업
- 아웃라이어(비정상적으로 크거나 작은 값) 찾기
- 오타 수정
- 데이터 오류 제거
- 중복 데이터 제거
- 형식의 불일치 수정
- 누락된 값을 확인하거나 잘못된 데이터 수정
- 일관성이 떨어지는 데이터 수정
- 관련성이 없는 데이터와 분석에 유용하지 않거나 필요하지 않은 데이터 제거하기
- 최종 분석의 정확도는 본 단계에서 좌우
- 4단계: 데이터 분석
- 1단계에서 정의한 질문과 목표에 따라 데이터를 분석
- 네 가지 다른 데이터 분석 기술
- 기술적 분석(Descriptive Analysis): 분석 프로세스의 기본이자 가장 첫 단계입니다. 수집된 데이터를 요약하며, "무슨 일이 일어났지?"라는 질문에 답하는 것을 목표로 합니다. 데이터의 핵심 포인트를 살피고, 이미 벌어진 일에 집중합니다.
- 진단적 분석(Diagnostic Analysis): 수집된 데이터를 사용하여 당면한 문제의 원인을 이해하고 패턴을 찾아내는 단계입니다. "왜 이런 일이 일어났지?"라는 질문에 답하는 것을 목표로 합니다.
- 예측 분석(Predictive Analysis): 미래 트랜드를 감지하고 예측하는 단계이며 기업의 미래 성장에 중요한 인사이트를 줍니다. “앞으로 어떤 일이 벌어질까?”라는 질문에 답하는 것을 목표로 합니다.
- 처방적 분석(Prescriptive Analysis): 위 세 단계에서 얻은 모든 인사이트를 하나로 모아 앞으로 다가올 일에 대한 대비책을 세우고 실행 가능한 계획을 수립하는 단계입니다. "무엇을 해야 할까?"라는 질문에 답하는 것을 목표로 합니다.
- 5단계: 결과 공유
- 결과 해석 → 결론 및 인사이트 도출
- 데이터 시각화 도구를 사용하여 보고서, 차트, 그래프, 해화형 대시보드 생성
- 1단계: 답변이 필요한 질문 인식 및 식별
[정리]
데이터 분석가는 스토리텔러이다. 재미있는 이야기를 만드는 이야기꾼은 아니다. 문제를 파악하고, 문제에 대한 원인을 고민하고, 해결방법을 제시하는 사람이다. 구체적인 데이터를 바탕으로 간결하게, 효과적으로 설득하는 사람이다. 직관적으로 시각화하여 누구나 이해할 수 있게 논리적인 흐름을 만드는 사람이다. 프로세스 정리 요약은 실무에서도 기억하며 떠올릴 지표로 보인다.
'내일배움캠프 > TIL' 카테고리의 다른 글
2024.10.17(목) 파이썬 & R언어까지 (0) | 2024.10.17 |
---|---|
2024.10.14(월) 파이썬 시작 (0) | 2024.10.14 |
2024.10.07(월) 문자 인코딩의 개념(Dbeaver 설치 중 변경 필요 시) (0) | 2024.10.07 |
2024.10.04(금) SQL로 피벗테이블 만들기 (0) | 2024.10.04 |
2024.10.04(금) 조회한 데이터가 상식적이지 않을 때 (0) | 2024.10.04 |