본문 바로가기
[업무 지식]/Python

[seaborn] 데이터 시각화

by 에디터 윤슬 2024. 10. 31.

목차

    바 그래프 1

     
    # seaborn 라이브러리를 통한 그래프 그리기 
    p = ["#F4D13B","red"]
    sns.set_palette(p)
    
    plot1 = (sns.barplot(data=df33,x= "Gender",y= "Customer ID"))
    # containers: 각 막대 / labels: 각 막대의 높이를 텍스트로 반환 
    plot1.bar_label(plot1.containers[0], labels=df33['Customer ID'], fontsize=7, color='blue')
    plot1.set_title("User - bar chart")

     

     

    바 그래프 2

     
    # seaborn 라이브러리를 통한 그래프 그리기 
    plt.figure(figsize=(15, 8))
    dplot1 = sns.barplot(x="Date", y="user count", data=df9, palette='rainbow')
    dplot1.set_xticklabels(dplot1.get_xticklabels(), rotation=30)
    dplot1.set(title='Monthly Active User') # title barplot
    
    # 바차트에 텍스트 추가하기 
    # patches 는 각 막대를 의미 .
    for p in dplot1.patches:
        # 각 바의 높이 구하기
        height = p.get_height()
        # X 축 시작점으로부터, 막대넓이의 중앙 지점에 텍스트 표시 
        dplot1.text(x = p.get_x()+(p.get_width()/2), 
        # 각 막대 높이에 10 을 더해준 위치에 텍스트 표시             
        y = height+10, 
        # 값을 정수로 포맷팅
        s = '{:.0f}'.format(height),
        # 중앙 정렬
        ha = 'center')

     

    카운트그래프

     
    # seaborn 라이브러리를 통한 그래프 그리기 
    # 시즌별 카테고리별 유저수(count 값과 동일) 구하기 
    plt.figure(figsize=(6, 5))
    # hue 는 범례입니다. 
    dplot2 = sns.countplot(x='Category', hue='Gender', data=df2, palette='cubehelix')
    dplot2.set(title='bar plot3')

     

    히스토그램 그래프

     
    # seaborn 라이브러리를 통한 그래프 그리기 
    #나이별 데이터 count 나타내기 
    #분포를 나타내는 그래프로 데이터 갯수를 세어 표시
    
    sns.histplot(x=df2['Age'])

     

    박스플롯 그리기

     
    # seaborn 라이브러리를 통한 그래프 그리기 
    # 최대(maximum), 최소(minimum), mean(평균), 1 사분위수(first quartile), 3 사분위수(third quartile)를 보기 위한 그래프
    # 이상치 탐지에 용이(저번시간에 배운 IQR)
    sns.boxplot(x = df2['Purchase Amount (USD)'],palette='Wistia')

    # seaborn 라이브러리를 통한 그래프 그리기 
    # 박스플롯 응용
    dplot5 = sns.boxplot(y = df2['Purchase Amount (USD)'], x = df2['Gender'], palette='PiYG')
    dplot5.set(title='box plot yeah')

     

    상관관계 그래프

     
    # 상관계수 구하기 
    df10.corr()
    # seaborn 라이브러리를 통한 그래프 그리기 
    # annot: 각 셀의 값 표기,camp 는 팔레트 
    dplot10 = sns.heatmap(df10.corr(), annot = True, cmap = 'viridis') # camp =PiYG 도 넣어서 색상을 비교해보세요.
    dplot10.set(title='corr plot')

     

     

    조인트 그래프

     
    # seaborn 라이브러리를 통한 그래프 그리기 
    #두 변수에 분포에 대한 분석시 사용
    #hex 를 통해 밀도 확인
    sns.jointplot(x=df2['Purchase Amount (USD)'], y=df10['Review Rating'], kind = 'hex', palette='cubehelix')

     

    '[업무 지식] > Python' 카테고리의 다른 글

    [이상치 처리] Python  (0) 2024.11.07
    [결측값 처리] python 기초  (0) 2024.11.07
    [matplotlib] 데이터시각화  (0) 2024.10.31
    [10분 판다스] python 기초  (0) 2024.10.31
    [pandas 라이브러리] transform  (0) 2024.10.30