전체 스터디
전체 스터디
  • 전체보기
  • 질문
  • 숙제
내 스터디
  • 스터디에 참여해보세요!
다른 스터디
  • 멀티캠
    • 전체보기
    • 질문
    • 숙제
    • 잡담
  • 파이썬 기초 스터디
  • 네이버 정복 파이썬 크롤링
  • 페이스북 만드는 웹개발
  • 데이터사이언스 12시간 입문기
  • 파이썬 구글 Sheet 연동
  • 엑셀서당 - 훈장님의 기초 엑셀 트레이닝
  • 고전게임을 만들며 배우는 코딩의 기초
  • 내 업무를 거의 자동화하는 방법
  • SQL 입문 4시간
  • QR 코드 프로그래밍
  • 비전공자 개발지식 총정리
  • 초고속 퍼포먼스 마케터
  • 왓챠 함께 만들기
  • 퍼블리셔 초고속 입문기
  • 한국형 커뮤니티 만들기
  • airbnb 프론트엔드 카피 프로젝트
  • 워드프레스로 쿠팡 만들기
신재용 리더
네이버 정복 파이썬 크롤링
온라인
클래스 자세히 보기
남주현
11월 18일 22:17 · 멀티캠

1.링크드인에서  채용정보를 수집

(HR, 인사, 직원경험 등 관련부분 24시간 기준)

https://www.linkedin.com


2. 키워드 분석

 1) Jop description에 자주 나오는 단어

 2) 해당 공고가 속한 업계

 3) 1)과 2)의 상관관계 분석


 3. 24시간 단위로 수행하며, 데이터가 누적되어 기간별로 비교분석이 되면 좋겠음

신재용
11월 18일 23:19

우선 스터디에서 다루는 내용은 Python을 이용해 웹 페이지를 수집하는 1번까지입니다.

제가 링크드인을 잘 다루지 못하기 때문에 정확히 찾아내지는 못했는데, 말씀하신 HR, 인사, 직원경험 등에 대한 정형화된 데이터가 있다면 어렵지 않게 수집이 가능합니다.

키워드분석은 재량껏 진행해주셔야 하는데, 마지막 주차에는 2-1)의 빈도분석까지만 구현하는걸 목표로 잡으시길 추천드립니다. 우리 스터디의 천준수님은 빈도분석을 위해 형태소 분석을 고려하시는것 같습니다. 

기간별로 데이터를 누적시키기 위해서는 엑셀을 사용하시길 추천드립니다. 추후에 개인적으로 진행하는 프로젝트가 고도화되면 다른 데이터베이스가 필요해지겠지만, 초기 단계에서는 엑셀이 빠르게 테스트하고 시각화해보기 가장 좋은 데이터베이스라고 생각합니다.

좋아요 0
    참여자 네이버 정복 파이썬 크롤링