전체 스터디
전체 스터디
  • 전체보기
  • 질문
  • 숙제
내 스터디
  • 스터디에 참여해보세요!
다른 스터디
  • (서강)코쉬코쉬 part2
    • 전체보기
    • 질문
    • 숙제
    • 잡담
  • 파이썬 기초 스터디
  • 네이버 정복 파이썬 크롤링
  • 페이스북 만드는 웹개발
  • 데이터사이언스 12시간 입문기
  • 파이썬 구글 Sheet 연동
  • 엑셀서당 - 훈장님의 기초 엑셀 트레이닝
  • 고전게임을 만들며 배우는 코딩의 기초
  • 내 업무를 거의 자동화하는 방법
  • SQL 입문 4시간
  • QR 코드 프로그래밍
  • 비전공자 개발지식 총정리
  • 초고속 퍼포먼스 마케터
  • 왓챠 함께 만들기
  • 퍼블리셔 초고속 입문기
  • 한국형 커뮤니티 만들기
  • airbnb 프론트엔드 카피 프로젝트
  • 워드프레스로 쿠팡 만들기
이종욱 리더
데이터사이언스 12시간 입문기
온라인
클래스 자세히 보기
김보경
6월 30일 21:55 · (서강)코쉬코쉬 part2
import pandas as pd
df=pd.read_csv('train.csv')
df_test=pd.read_csv('test.csv')
#<자율과제1> 
#step 1
C='Cabin'
df[C]=df[C].str[0]

df[C]=df[C].fillna('non')

df_test[C]=df_test[C].str[0]
df_test[C]=df_test[C].fillna('non')

df_test.isnull().sum()

# df[["PassengerId",C]]
#step2
df[C].value_counts()
df.loc[df[C]=='C',C]=0
df.loc[df[C]=='B',C]=1
df.loc[df[C]=='D',C]=2
df.loc[df[C]=='E',C]=3
df.loc[df[C]=='A',C]=4
df.loc[df[C]=='F',C]=5
df.loc[df[C]=='G',C]=6
df.loc[df[C]=='T',C]=7

df_test.loc[df_test[C]=='C',C]=0
df_test.loc[df_test[C]=='B',C]=1
df_test.loc[df_test[C]=='D',C]=2
df_test.loc[df_test[C]=='E',C]=3
df_test.loc[df_test[C]=='A',C]=4
df_test.loc[df_test[C]=='F',C]=5
df_test.loc[df_test[C]=='G',C]=6
df_test.loc[df_test[C]=='T',C]=7
df_test[C].value_counts()


참여자 데이터사이언스 12시간 입문기