본문 바로가기
[업무 지식]/Seaborn

[barplot] Grouped boxplots

by 에디터 윤슬 2024. 11. 9.
import seaborn as sns
sns.set_theme(style="ticks", palette="pastel")

# Load the example tips dataset
tips = sns.load_dataset("tips")
tips

seaborn

sns.boxplot(x="day", 
            y="total_bill",
            hue="smoker", 
            palette=["m", "g"],
            data=tips)
sns.despine(offset=10, trim=True)

설명

  • sns.set_theme(style="ticks", palette="pastel"): Seaborn의 테마를 설정하는 함수입니다.
    • style="ticks": 그래프에 눈금(ticks)이 강조된 깔끔한 스타일을 적용합니다.
    • palette="pastel": 파스텔 색상 팔레트를 사용하여 시각적으로 부드러운 색상을 적용합니다.
  • sns.load_dataset("tips"): Seaborn에서 제공하는 팁(tips) 데이터셋을 불러옵니다. 이 데이터셋은 레스토랑에서 손님들이 지불한 팁과 관련된 정보를 포함하고 있습니다.
    • 주요 변수:
      • total_bill: 총 지불 금액
      • tip: 팁 금액
      • sex: 성별 (Male, Female)
      • smoker: 흡연 여부 (Yes, No)
      • day: 요일 (Thur, Fri, Sat, Sun)
      • time: 식사 시간 (Lunch, Dinner)
      • size: 식사 인원 수
  • sns.boxplot(): Seaborn의 상자 그림(boxplot)을 그리는 함수로, 데이터의 분포와 이상치를 시각화할 수 있습니다.
    • x="day": X축에 표시할 변수를 지정합니다. 여기서는 요일(day)이 X축에 표시됩니다.
    • y="total_bill": Y축에 표시할 변수를 지정합니다. 여기서는 총 지불 금액(total_bill)이 Y축에 표시됩니다.
    • hue="smoker": 흡연 여부(smoker)에 따라 색상을 다르게 설정합니다. 즉, 흡연자와 비흡연자가 각각 다른 색상으로 구분됩니다.
    • palette=["m", "g"]: 색상 팔레트를 설정합니다. 여기서는 흡연자는 보라색("m")으로, 비흡연자는 녹색("g")으로 표시됩니다.
    • data=tips: 시각화할 데이터셋을 지정합니다. 여기서는 tips 데이터셋을 사용합니다.
  • sns.despine(offset=10, trim=True): 그래프의 경계선을 제거하거나 조정하는 함수입니다.
    • offset=10: 축 경계선을 그래프에서 약간 떨어뜨려서 표시합니다.
    • trim=True: 축 경계선을 데이터 범위에 맞게 잘라냅니다.
결론
  • 이 시각화는 다음과 같은 경우 유용하게 사용할 수 있습니다:
    • 여러 범주형 변수(예: 요일과 흡연 여부)에 따른 연속형 변수(예: 총 지불 금액)의 차이를 분석하고자 할 때.
    • 특정 그룹 간 평균 값을 비교하고자 할 때.
    • 실험 결과나 판매 데이터를 시각적으로 표현하고자 할 때.