[업무 지식]/Machine learning2 [로지스틱회귀] 분류분석 타이타닉 생존 분류 문제주제: 탑승한 승객의 정보를 바탕으로 생존 유무를 예측하는 분류 문제종속변수(Y): 사망 - 0 / 생존 - 1독립변수(X): 티켓 등급, 성별, 요금 등PassengerId: 승객 식별자(Primary Key)Survival : 사망(0) 생존(1)Pclass: 티켓 등급(1,2,3 등급)Name: 이름Sex: 성별Age: 나이SibSp: 승객의 형제와 배우자 수Parch: 승객의 부모님과 자식 수변수 설명Ticket: 티켓 번호Fare: 요금Cabin: 객실 이름Embarked: 승선한 항구 C(Cherbourg), Q(Queenstown), S(Southampton)로지스틱회귀 이론Y가 범주형인 경우 선형함수의 한계X가 연속형 변수이고, Y가 특정 값이 될 확률이라면 왼.. 2024. 11. 19. [선형회귀] 회귀분석 자주 쓰는 함수sklearn.linear_model.LinearRegression: 선형회귀 모델 클래스coef_: 회귀 계수intercept: 편향(bias)fit: 데이터 학습predict: 데이터 예측선형회귀 실습'tips' 데이터를 가지고 전체 금액(X)를 알면 받을 수 있는 팁(y)에 대한 회귀분석을 진행한다.seaborn 시각화 라이브러리 데이터셋 'tips'tips_df = sns.load_dataset('tips')tips_df.head(3)전체 금액(total_bill)과 팁(tip)과의 선형성을 산점도로 확인한다sns.scatterplot(data = tips_df, x = 'total_bill', y = 'tip')종속변수(y), 독립변수(x) 설정# X: total_bill -- .. 2024. 11. 18. 이전 1 다음