import seaborn as sns
sns.set_theme(style="ticks", palette="pastel")
# Load the example tips dataset
tips = sns.load_dataset("tips")
tips
seaborn
sns.boxplot(x="day",
y="total_bill",
hue="smoker",
palette=["m", "g"],
data=tips)
sns.despine(offset=10, trim=True)
설명
- sns.set_theme(style="ticks", palette="pastel"): Seaborn의 테마를 설정하는 함수입니다.
- style="ticks": 그래프에 눈금(ticks)이 강조된 깔끔한 스타일을 적용합니다.
- palette="pastel": 파스텔 색상 팔레트를 사용하여 시각적으로 부드러운 색상을 적용합니다.
- sns.load_dataset("tips"): Seaborn에서 제공하는 팁(tips) 데이터셋을 불러옵니다. 이 데이터셋은 레스토랑에서 손님들이 지불한 팁과 관련된 정보를 포함하고 있습니다.
- 주요 변수:
- total_bill: 총 지불 금액
- tip: 팁 금액
- sex: 성별 (Male, Female)
- smoker: 흡연 여부 (Yes, No)
- day: 요일 (Thur, Fri, Sat, Sun)
- time: 식사 시간 (Lunch, Dinner)
- size: 식사 인원 수
- 주요 변수:
- sns.boxplot(): Seaborn의 상자 그림(boxplot)을 그리는 함수로, 데이터의 분포와 이상치를 시각화할 수 있습니다.
- x="day": X축에 표시할 변수를 지정합니다. 여기서는 요일(day)이 X축에 표시됩니다.
- y="total_bill": Y축에 표시할 변수를 지정합니다. 여기서는 총 지불 금액(total_bill)이 Y축에 표시됩니다.
- hue="smoker": 흡연 여부(smoker)에 따라 색상을 다르게 설정합니다. 즉, 흡연자와 비흡연자가 각각 다른 색상으로 구분됩니다.
- palette=["m", "g"]: 색상 팔레트를 설정합니다. 여기서는 흡연자는 보라색("m")으로, 비흡연자는 녹색("g")으로 표시됩니다.
- data=tips: 시각화할 데이터셋을 지정합니다. 여기서는 tips 데이터셋을 사용합니다.
- sns.despine(offset=10, trim=True): 그래프의 경계선을 제거하거나 조정하는 함수입니다.
- offset=10: 축 경계선을 그래프에서 약간 떨어뜨려서 표시합니다.
- trim=True: 축 경계선을 데이터 범위에 맞게 잘라냅니다.
결론
- 이 시각화는 다음과 같은 경우 유용하게 사용할 수 있습니다:
- 여러 범주형 변수(예: 요일과 흡연 여부)에 따른 연속형 변수(예: 총 지불 금액)의 차이를 분석하고자 할 때.
- 특정 그룹 간 평균 값을 비교하고자 할 때.
- 실험 결과나 판매 데이터를 시각적으로 표현하고자 할 때.
'[업무 지식] > Seaborn' 카테고리의 다른 글
[relplot] Scatterplot heatmap (0) | 2024.11.09 |
---|---|
[violinplot] Grouped violinplots with split violins (0) | 2024.11.09 |
[catplot] Grouped barplots (0) | 2024.11.09 |
[relplot] Line plots on multiple facets (0) | 2024.11.09 |
[displot] Facetting histograms by subsets of data (0) | 2024.11.09 |