- 스터디에 참여해보세요!
- 해커톤 주제: 추천시스템을 활용한 영화추천
- 팀명: 하얀집
- 참여인원: 4 (강협, 윤영채, 이지영, 이시은)
week5 - 해커톤 주제 선정
Dacon 사이트 참고.
퇴근시간 버스승차인원 예측 경진대회
교통 | 제주시 | 공공 교통 위치 빅데이터와 AI로 버스 승객 이용 분석 | 회귀, RMSE
(https://www.dacon.io/competitions/official/229255/overview/)
각자 코드 분석해보기
week5
월, 19:00-20:00
불참석자 없음.
해커톤 주제선정 및 사전학습자료 선정 등, 준비를 진행하였습니다.
week3
의사 결정 나무에 대해 배웠으며 scikit-learn라이브러리를 통해 training set과 validation set으로 나누어 학습 데이터를 넣는 것을 알게 되었습니다. 또한 타이타닉 (test.xslx)파일의 데이터에서 빈칸을 채우는 더 효과적인 방법에 대해서도 생각할 수 있었습니다.
<span style="font-size: 1.2em;">- 06/29 18:00-19:30
- 뉴 4회차 스터디 진행</span>
<span style="font-size: 25.344px;">- 의사결정 나무 및 랜덤포레스트에 대해 리뷰</span>
<span style="font-size: 25.344px;">- 추후 프로젝트 관련 방향성 논의 및 학습 방향 수립</span>
<span style="font-size: 1.2em;">- 06/08 20:00-21:00 </span>
<span style="font-size: 1.2em;">- 뉴 3회차 스터디 진행.</span>
- 타이타닉을 통한 머신러닝, 시험기간으로 간략히 진행.
part 2. week2
numpy, pandas를 불러와 주피터 노트북에서 시각화하기 연습. (산포도, scatter, box plot)
<span style="font-size: 1.2em;">실습문제와 타이타닉 데이터 문제 첨부 합니다. </span>
과제제출
https://aiden-write.tistory.com/271
numpy와 pandas 를 연습해보았습니다.
https://aiden-write.tistory.com/272
캐글에서 데이터를 가져오는 작업을 해보았습니다.
https://aiden-write.tistory.com/273
가져온 타이타닉 데이터를 통해서 시각화를 연습했습니다.
- 06/08 17:00-18:00
- 뉴 2회차 스터디 진행.
- numpy and pandas 에 대하여 미진한 부분 체크.
- seaborn 라이브러리 시각화를 몇개 더 해보기로 함.
jupyter 노트북을 사용하여 파이썬으로 데이터분석을 해보았습니다. (파일 읽어오기, 데이터 시각화 등)
과제 캡처물과 데이터의 범례가 너무 커 해석이 어려운 경우 어떻게 해결하면 좋을지 첨부된 파일에 작성하였습니다.
타이타닉 생존율 예측을 하여 피벗테이블로 만들어보고 캐글에 제출해보았습니다. 붓꽃에 관한 분류도 피벗테이블로 만들어보았습니다.
- 06/01 17:00-18:00
- 뉴 1회차 스터디 진행.
- 미참석자 : 고예현 님
- 피벗테이블을 통한 타이타닉 분석에 대한 논의.
- 피벗테이블을 통한 붓꽃분류와 타이타닉 분석에 대한 차이 논의.