본문 바로가기
내일배움캠프/TIL

2024.10.08 아티클 스터디

by 에디터 윤슬 2024. 10. 8.

<데이터 분석이란 무엇인가?> 아티클을 읽고.

https://yozm.wishket.com/magazine/detail/1567/

 

데이터 분석이란 무엇일까? | 요즘IT

오늘날 데이터는 어디에나 있습니다. 그리고 우리가 생산하는 데이터는 해를 거듭할수록 증가하고 있습니다. 우리가 사용할 수 있는 데이터의 양은 방대하지만, 이 모든 데이터로 무엇을 할 수

yozm.wishket.com

 

[주제]

  • 데이터 분석은 무엇인가?
  • 왜 모두가 데이터 분석이 중요하다고 말하는가?
  • 데이터 분석 프로세스를 단계별로 정리

[아티클 요약]

  • 요약 :
    • 데이터란? 데이터는 특정 사실이나 정보의 집합을 의미
    • 데이터 분석이란? 데이터를 정리, 변환, 조작, 검사하여 유용한 인사이트를 도출하는 작업 → 모든 데이터로부터 패턴과 상관관계를 파악하여 복잡한 문제에 대한 해결책을 찾는다.
    • 왜 중요한가?
      1. 고객 타깃팅 개선 - 제품 및 서비스를 현재 시장의 요구사항에 맞춤
      2. 성공과 성과를 측정 - 시장에서 얼마나 경쟁력이 있는지 측정
      3. 문제 해결에 도움 - 정보에 입각한 올바른 결정을 내릴 수 있음
    • 데이터 분석 프로세스의 이해
  • 주요 포인트 :
    • 데이터 분석가는 도구와 프로세스를 사용하여 데이터의 수집,수정, 조사, 분석, 인사이트 도출, 지식 내재화를 담당한다.
    • 정성 데이터와 정량 데이터의 차이점
      • 정성적 데이터
        1. 이미지, 비디오, 텍스트, 오디오
        2. 측정하거나 계산 불가능
        3. 사람들의 감정, 동기, 의견, 인식, 편견 포함
        4. ‘무엇을’ ‘왜’ ‘어떻게’와 같은 질문에 답변
      • 정량적 데이터
        1. 숫자로 표현
        2. 셀 수 있고 측정 가능하며 비교할 수 있다
        3. ‘얼마나 많이’ ‘얼마나 자주’ ‘얼마나 오래’와 같은 질문에 답변
    • 데이터 분석 프로세스 개요
      • 1단계: 답변이 필요한 질문 인식 및 식별
        • 문제 정의 / 데이터 분석의 목적 / 무엇을 달성하고 싶나? / 분석이 왜 필요한가? 에 대한 답변
        • 비즈니스 목표에 대한 이해도와 인사이트가 중요
      • 2단계: 원시 데이터 수집
        • 원시 데이터 목록
          • 사용자 그룹, 설문 조사, 양식, 설문지, 내부 문서, 기업에서 이미 수행한 인터뷰 결과
          • 고객 리뷰와 고객 만족도에 대한 피드백
          • 거래 및 구매 내역 기록, 비즈니스 재무 또는 마케팅 부서에서 만든 자료와 및 재무 수치 보고서
          • 회사에서 사용하는 CRM(고객 관계 관리 시스템)
          • 웹사이트 및 소셜 미디어 활동과 월간 방문자를 현황 모니터링
          • 소셜 미디어 고객 참여를 모니터링
          • 자주 검색되는 키워드와 검색어 추적하기
          • 사람들이 어떤 광고가 자주 클릭하는지 확인하기
          • 고객 전환율 확인하기
          • 이메일 오픈율을 확인하기
          • 타사 서비스를 사용하여 회사의 데이터를 경쟁업체와 비교하기
          • 데이터베이스 쿼리
          • 공개 데이터 세트를 웹 스크래핑을 통해 수집. 웹 스크래핑은 웹사이트에서 데이터와 콘텐츠를 추출하고 수집하는 행위입니다.
      • 3단계: 데이터 정제
        • 필요한 데이터를 모두 수집했는가
        • 데이터의 구조화 필요
        • 정제 작업
          • 아웃라이어(비정상적으로 크거나 작은 값) 찾기
          • 오타 수정
          • 데이터 오류 제거
          • 중복 데이터 제거
          • 형식의 불일치 수정
          • 누락된 값을 확인하거나 잘못된 데이터 수정
          • 일관성이 떨어지는 데이터 수정
          • 관련성이 없는 데이터와 분석에 유용하지 않거나 필요하지 않은 데이터 제거하기
        • 최종 분석의 정확도는 본 단계에서 좌우
      • 4단계: 데이터 분석
        • 1단계에서 정의한 질문과 목표에 따라 데이터를 분석
        • 네 가지 다른 데이터 분석 기술
          • 기술적 분석(Descriptive Analysis): 분석 프로세스의 기본이자 가장 첫 단계입니다. 수집된 데이터를 요약하며, "무슨 일이 일어났지?"라는 질문에 답하는 것을 목표로 합니다. 데이터의 핵심 포인트를 살피고, 이미 벌어진 일에 집중합니다.
          • 진단적 분석(Diagnostic Analysis): 수집된 데이터를 사용하여 당면한 문제의 원인을 이해하고 패턴을 찾아내는 단계입니다. "왜 이런 일이 일어났지?"라는 질문에 답하는 것을 목표로 합니다.
          • 예측 분석(Predictive Analysis): 미래 트랜드를 감지하고 예측하는 단계이며 기업의 미래 성장에 중요한 인사이트를 줍니다. “앞으로 어떤 일이 벌어질까?”라는 질문에 답하는 것을 목표로 합니다.
          • 처방적 분석(Prescriptive Analysis): 위 세 단계에서 얻은 모든 인사이트를 하나로 모아 앞으로 다가올 일에 대한 대비책을 세우고 실행 가능한 계획을 수립하는 단계입니다. "무엇을 해야 할까?"라는 질문에 답하는 것을 목표로 합니다.
      • 5단계: 결과 공유
        • 결과 해석 → 결론 및 인사이트 도출
        • 데이터 시각화 도구를 사용하여 보고서, 차트, 그래프, 해화형 대시보드 생성

[정리]

데이터 분석가는 스토리텔러이다. 재미있는 이야기를 만드는 이야기꾼은 아니다. 문제를 파악하고, 문제에 대한 원인을 고민하고, 해결방법을 제시하는 사람이다. 구체적인 데이터를 바탕으로 간결하게, 효과적으로 설득하는 사람이다. 직관적으로 시각화하여 누구나 이해할 수 있게 논리적인 흐름을 만드는 사람이다. 프로세스 정리 요약은 실무에서도 기억하며 떠올릴 지표로 보인다.