데이터 사이언스 12시간 입문기
교육기간
4월 25일 ~ 7월 11일 6주간, 매주 토요일 10:30(2시간)
장소
성균관대
리더
조경재
준비물
최소사양의 노트북
조경재
안녕하세요, 이번 클래스를 맡은 조경재 리더 입니다..!

4월 25일부터 7월 11일까지 6주간, 매주 토요일 10:30(2시간) 성균관대 에서 교육을 진행합니다.

수업시간에 끝내지 못한 부분은 아래 인터넷 강의의 도움을 받아 추가 학습하면서 계속 질문해주세요. 그럼 다음 시간에 만나요!
WEEK0 사전준비 성균관대
자료요약
  • slide 설치 & 준비 메뉴얼
  • doc online book
들어가며
  • play OT와 간단한 설명 4분 40초
WEEK1 데이터로 타이타닉을 분석하라 성균관대
자료요약
  • slide 강의자료
  • doc online book
stage1 - 데이터 사이언스의 오해와 진실
  • play 데이터 사이언스 마인드 4분 29초
  • play 딥러닝이란 3분 23초
stage2 - 엑셀로 타이타닉 생존자 예측해보기
  • play 데이터 준비 3분 53초
  • play 피봇테이블 배우기 7분 15초
  • play 실전미션 도전 4분 51초
challenge1 - 각 티켓 등급에 따른 성별별 생존 가능성 예측하기
  • play 문제풀이 1분 23초
  • doc 솔루션
stage3 - Basic Feature Engineering
  • play feature 생성 8분 37초
  • play feature 추출 2분 14초
stage4 - Kaggle에 타이타닉 예측 제출하기
  • play 엑셀로 하는 머신러닝 2분 57초
  • play 테스트해보기 4분 31초
  • play kaggle에서 채점받기 3분 34초
  • play 앞으로 배울 것들 1분 44초
challenge2 - 나만의 방식으로 Kaggle에서 높은 점수 받기
  • play 문제풀이 23초
  • doc 솔루션
homework1 - 필요없다고 생각한 Name 필드로 부터 정보 얻기
  • doc 솔루션
homework2 - IRIS(붓꽃) 구분하기
  • doc 솔루션
WEEK2 데이터 사이언스를 위한 파이썬 특강 성균관대
자료요약
  • slide 강의자료
  • doc online book
stage1 - 주피터 노트북 사용해보기
  • play 주피터 노트북 실행하기 3분 13초
  • play 폴더 만들기 2분 18초
  • play 주피터 노트북 기본사용법 3분 20초
  • play 마크다운 배우기 5분 3초
  • play 마크다운 연습(list) 2분 25초
  • play 마크다운 연습(img) 5분 22초
  • play 마크다운 연습(표) 3분 14초
stage2 - 파이썬 기본과 데이터 입출력
  • play 파이썬 입문 3분 20초
  • play 파이썬의 변수(Variables) 4분 11초
  • play 변수 퀴즈 풀기 3분 41초
  • play 파이썬의 if 9분 38초
  • play 파이썬의 list, dictionary 9분 52초
challenge1 - 전화번호부 만들기
  • play 문제풀이 4분 5초
  • doc 솔루션
stage3 - 데이터 조작 (Numpy, Pandas)
  • play 판다스 배우기 10분 20초
  • play 데이터프레임 배우기 6분 15초
stage4 - 데이터 시각화 (matplotlib, seaborn)
  • play 간단한 그래프, 선 표현 12분 38초
  • play 시각화 기본 8분 36초
challenge2 - 타이타닉 Bar Chart로 표현하기
  • play 문제풀이 5분 59초
  • doc 솔루션
homework1 - Pandas DateFrame 연습
  • doc 솔루션
homework2 - seaborn의 count plot 사용하기
  • doc 솔루션
Level Up - 파일 입출력
  • doc online book
WEEK3 타이타닉에서는 누가 살아 남았을까? 성균관대
자료요약
  • slide 강의자료
  • doc online book
stage1 - Decision Tree를 배워보자
  • play 디시전트리 개념 5분 46초
  • play 디시전트리 구현하기 9분 55초
stage2 - 기계학습을 위한 Feature Engineering
  • play Feature Engineering (1) 11분 50초
  • play Feature Engineering (2) 8분 8초
challenge1 - Feature to Numeric
  • play 데이터 숫자 변환 6분 37초
  • doc 솔루션
stage3 - Scikit-learn으로 실제 코드 구현하기
  • play 사이킷런 배우기 5분 52초
  • play 사이킷런의 예측 4분 13초
stage4 - 분석 노하우로 학습 성공률 높이기
  • play kdeplot 그리기 7분
challenge2 - box plot 연습하기
  • play boxplot 그리기 2분 37초
  • doc 솔루션
homework1 - Name 특징에서 유용한 정보 남기고 kdeplot 사용하기
  • doc 솔루션
homework2 - PClass에 따른 Fare 빈칸 평균으로 채우고 학습 해보기
  • doc 솔루션
Level Up - 여러 특성을 지닌 Decision Tree
  • doc online book
WEEK4 데이터로 꽃의 종류를 구분해보자 + 우수고객 분석 성균관대
자료요약
  • slide 강의자료
  • doc online book
stage1 - Random Forest를 배워보자
  • play 랜덤포레스트 개념 4분 11초
  • play 랜덤포레스트 구현하기 5분 24초
  • play 데이터셋 개념 6분 44초
stage2 - Iris 문제 Feature Engineering
  • play 아이리스 Feature Engineering 3분 5초
  • play 아이리스 문제 분석 7분 1초
challenge1 - Pair plot 만들기
  • play pair plot 그리기 3분 12초
  • doc 솔루션
stage3 - Scikit-learn으로 Random Forest 구현하기
  • play 사이킷런으로 분석하기 9분 35초
  • play 사이킷런의 랜덤포레스트 2분 26초
stage4 - (고객 분석) 누가 내 우수고객이 될까?
  • play 고객분석 함께하기 8분 21초
  • play 모델의 prediction과 적용 5분 53초
challenge2 - 타이타닉 문제에서 학습 부분을 Random Forest로 바꿔보기
  • play Randomforest 적용하기 3분 25초
  • doc 솔루션
homework1 - 타이타닉 데이터셋 구성 다시하기
  • doc 솔루션
homework2 - 타이타닉 문제에 적용한 random forest의 파라미터를 변경해보기
  • doc 솔루션
WEEK5 워싱턴의 집 값을 예측하라 + 추천할 상품특성 찾기 성균관대
자료요약
  • slide 강의자료
  • doc online book
stage1 - Linear Regression을 배워보자
  • play 회귀분석 배우기 9분 59초
  • play 회귀분석 구현하기 2분 16초
stage2 - Visualization 연습하기
  • play 집값예측 문제 분석하기 5분 49초
  • play 상관계수와 히트맵 6분 33초
  • play 각종 시각화 2분 48초
challenge1 - Polynomial Linear Regression
  • play 다차항의 회귀분석 구현 4분 42초
  • doc 솔루션
stage3 - Scikit-learn으로 Linear Regression 구현하기
  • play 데이터셋 구성하기 8분 46초
  • play linear regression 구현하기 8분 27초
  • play Scikit-learn의 scoring 1분 50초
stage4 - (의류 사이즈 추천) 내게 꼭 맞는 핏은?
  • play 사이즈 분석 함께하기 4분 26초
  • play 모델의 prediction 4분 55초
challenge2 - 실제값과 예측값 비교하는 DataFrame 만들기
  • play 비교 데이터프레임 3분 34초
  • doc 솔루션
homework1 - Test 진행하기
  • doc 솔루션
homework2 - Linear Regression으로 타이타닉 생존자 예측해보기
  • doc 솔루션
WEEK6 진짜로 해보는 실전 분석 프로젝트 성균관대
자료요약
  • slide 강의자료
  • doc online book
  • doc 분석가이드와 코딩 시나리오
intro - 들어가며
  • play 실전 프로젝트 준비 2분 26초
  • play 이미지가 데이터인 이유 3분 41초
project - 실전 프로젝트 문제 설명
  • play 숫자 손글씨 인식 프로젝트 설명(1) 5분 19초
  • play 숫자 손글씨 인식 프로젝트 설명(2) 13분 25초
  • play 와인 품질 측정 프로젝트 설명(1) 7분 42초
  • play 와인 품질 측정 프로젝트 설명(2) 4분 52초
  • play 초보자를 위한 조언 2분 27초
solution - 실저 프로젝트 솔루션
  • play 숫자 손글씨 인식 프로젝트 함께하기 21분 26초
  • play 와인 품질 측정 프로젝트 함께하기 17분 57초
  • doc 모범 답안 모음
challenge - Support Vector Machine
  • play SVM 적용하기 7분 33초
  • doc 솔루션
outro - 나아가기
  • play 마무리 인사 1분 52초
homework1 - 프로젝트 마무리
  • doc 솔루션
homework2 - 평가지표 고안하기
  • doc 솔루션