전체 스터디
전체 스터디
  • 전체보기
  • 질문
  • 숙제
내 스터디
  • 스터디에 참여해보세요!
다른 스터디
  • (서강)코쉬코쉬 part2
    • 전체보기
    • 질문
    • 숙제
    • 잡담
  • 파이썬 기초 스터디
  • 네이버 정복 파이썬 크롤링
  • 페이스북 만드는 웹개발
  • 데이터사이언스 12시간 입문기
  • 파이썬 구글 Sheet 연동
  • 엑셀서당 - 훈장님의 기초 엑셀 트레이닝
  • 고전게임을 만들며 배우는 코딩의 기초
  • 내 업무를 거의 자동화하는 방법
  • SQL 입문 4시간
  • QR 코드 프로그래밍
  • 비전공자 개발지식 총정리
  • 초고속 퍼포먼스 마케터
  • 왓챠 함께 만들기
  • 퍼블리셔 초고속 입문기
  • 한국형 커뮤니티 만들기
  • airbnb 프론트엔드 카피 프로젝트
  • 워드프레스로 쿠팡 만들기
이종욱 리더
데이터사이언스 12시간 입문기
온라인
클래스 자세히 보기
강현석
6월 30일 12:52 · (서강)코쉬코쉬 part2
3주차 레벨업 과제 
#이름 특징 추출하기, 이름으로 나이 평균 내기(빈칸을 더 현명하게 처리)
import pandas as pd
df=pd.read_csv('data/train.csv')
df_test=pd.read_csv('data/test.csv')
df.loc[df['Name'].str.contains('Mr\.'),'Name']='Mr'
df.loc[df['Name'].str.contains('Mrs\.'),'Name']='Mrs'
df.loc[df['Name'].str.contains('Miss\.'),'Name']='Miss'
df['Name']=df['Name'].map({
    'Mr': int(0),
    'Mrs': int(1),
    'Miss': int(2)
})
df['Name']=df['Name'].fillna(int(3))
df['Name'].value_counts()
# 평균내기
df['Age']=df['Age'].fillna(df.groupby('Name')['Age'].transform('mean'))
#여러 특성을 지닌 데이터의 Decision Tree

data = {
    'weight': [28, 2, 9, 6],
    'movable': [True, True, True, False],
    'category': ['animal', 'plant', 'animal', 'plant']
}
target_index=3
target_names=['1번','2번','3번','4번']
print(target_names[target_index],": 동/식물을 분류합니다.")

if (data['movable'][target_index]): #움직인다
    if (data['weight'][target_index]<=6):
        print('plant')
    else:
        print('animal')
else: #움직이지 못한다.
    print('plant')
#다른 트리 만들기
if data['weight'][target_index]<=6:
    print("plant")
else:
    print("animal")
#Cabin의 객실 특징 추출, 숫자 변환
df['Cabin']=df['Cabin'].str[0]
df['Cabin']=df['Cabin'].fillna('C')
df['Cabin']=df['Cabin'].map({
    'C':0,
    'B':1,
    'D':2,
    'E':3,
    'A':4,
    'F':5,
    'G':6,
    'T':7,
})
df['Cabin'].value_counts()


참여자 데이터사이언스 12시간 입문기