데이터 사이언스 사관학교 Part 2
내 스터디
- 스터디에 참여해보세요!
최도근 리더
데이터사이언스 12시간 입문기
온라인
웹크롤링 week6
데이터사이언스 week2, week6
총 3주차 온라인강의 수강했습니다!
숙제 제츨 드립니다.
2번째 숙제는 어려워서 답을 참고했습니다....
타이타닉은 다루기 어렵네요.. ;;;
1번째 숙제 최종 선택 모델은 PolynomiaFeatures이고 점수는 81점입니다.
숙제제출드립니다.
head - 불러온 데이터 의 상위 5개 행 출력
info - 데이터의 전반적인 정보 / 구성하는 행과 열의 크기, 컬럼명, 컬럼의 자료형 등 출력
describe - 데이터의 컬럼별 요약 통계량 / mean, max, mdian 등
숙제 제출합니다!
Name 부분을 정리할때
df.loc[ df['Name'].str.contains('Mr\.'), 'Name'] = 'Mr.'
에서 '\'가 들어가는 이유가 뭔지 궁금합니다!
숙제 제출합니다.
Stage 4의 challenge 2는 matplotlib으로는 어떻게 만들어야 할지 솔루션을 봐도 잘 모르겠네요 ㅠㅠ
레벨업 부분에서 질문드립니다!
f= open('test.csv', 'w)
f=open('test.csv','r')
의 차이가 파일을 불러오는건 동일한데 위의 경우에는 파일 작성이고
밑의 경우에는 읽기전용으로 보면 되는건가요?
또, f.readline() 은 한줄씩 프린트 하는건가요?!
7월 14일 19:40
답변이 늦어 죄송합니다, 못보고 넘어갔습니다.
아래의 경우는 읽기만 하는게 맞습니다:)
readline은 한줄씩 읽는 것(불러들이는 것)입니다.
좋아요 0
pandas의 .contains(X)에서 X자리에 찾는 문자열을 넣을 수 있죠? 일반적인 숫자, 알파벳, 한글은 그냥 넣어도 되지만 .은 다른 기능도 숨어 있습니다.
이런 특수문자 앞에 \를 넣어주면 그 기능을 없애고 실제 문자만 검색합니다.
mr\. → mr.
mr\[3\] → mr[3]
우측이 실제 검색되는 문자열
보다 정교한 검색이 가능하도록 몇몇 특수문자에 특수한 기능이 딸려 있는데 그걸 다시 없애는 기능이예요.(심화: 정규식 참고)