멀티캠
전체 스터디
  • 전체보기
  • 질문
  • 숙제
내 스터디
  • 스터디에 참여해보세요!
다른 스터디
  • 멀티캠
    • 전체보기
    • 질문
    • 숙제
    • 잡담
  • 파이썬 기초 스터디
  • 네이버 정복 파이썬 크롤링
  • 페이스북 만드는 웹개발
  • 데이터사이언스 12시간 입문기
  • 파이썬 구글 Sheet 연동
  • 엑셀서당 - 훈장님의 기초 엑셀 트레이닝
  • 고전게임을 만들며 배우는 코딩의 기초
  • 내 업무를 거의 자동화하는 방법
  • SQL 입문 4시간
  • QR 코드 프로그래밍
  • 비전공자 개발지식 총정리
  • 초고속 퍼포먼스 마케터
  • 왓챠 함께 만들기
  • 퍼블리셔 초고속 입문기
  • 한국형 커뮤니티 만들기
  • airbnb 프론트엔드 카피 프로젝트
  • 워드프레스로 쿠팡 만들기
신재용 리더
네이버 정복 파이썬 크롤링
온라인
신재용
12월 17일 22:39 · 멀티캠

6주차 수업시간에 사용한 코드입니다.

맨 위 주석에 간단한 설명이 적혀있어요.

신재용
12월 10일 22:25 · 멀티캠

5주차 스터디에서 작성한 코드입니다.

신재용
12월 3일 22:28 · 멀티캠

4주차 수업시간에 작성한 beautifulsoup 태그 예외처리 함수입니다.


def get_text(tag, replace="N/A"):
    if not tag:
        return replace
    return tag.text


자세히 보기
신재용
11월 27일 00:09 · 멀티캠

3주차 챌린지2 답안입니다.

# requests 라이브러리를 불러온다.
import requests
# bs4에서 BeautifulSoup만 불러온다.
from bs4 import BeautifulSoup

# 안티크롤링을 회피하기 위해 헤더의 User-Agent 요소를 가짜로 만든다.
h = {"User-Agent": "Mozilla/5.0"}

# range(1, 4) : [1, 2, 3] 형태의 리스트를 반환
# i에 차례대로 1, 2, 3이 할당됨
for i in range(1, 4):
    # headers 인수를 h로 지정해 ycombinator 뉴스 페이지를 요청한다.
    raw = requests.get("https://news.ycombinator.com?p=" + str(i), headers=h)

    # 의미 없는 html 문자열을 파싱해 의미를 가지는 객체로 만든다.
    html = BeautifulSoup(raw.text, "html.parser")

    # class가 athing인 모든 요소를 선택해 list 형태로 반환한다.
    # list 형태이기 때문에 articles[0], articles[1]... 처럼 인덱싱 가능
    articles = html.select(".athing")

    # articles list에서 요소를 하나씩 꺼내서 article에 할당한다.
    for article in articles:
        # article 요소에서 class가 rank인 첫번째 요소를 선택한다.
        rank = article.select_one(".rank").text
        title = article.select_one(".storylink").text
        print(rank, title)


자세히 보기
신재용
11월 26일 23:59 · 멀티캠

간단한 파일 입출력 사용법입니다.

# 파일에 쓰기

# open 모드 r: 읽기, w: 쓰기, a: 이어쓰기
f = open("test.txt", "a")

# 파일에 한 줄 쓰기
f.write("hello world")
print("hi world", file=f)

# 파일 닫기
f.close()


#########################################

# 파일 읽기

# open 모드 r: 읽기, w: 쓰기, a: 이어쓰기
f = open("test.txt", "r")

for line in f.readlines():
    print(line.strip())

# 파일 닫기
f.close()



자세히 보기
신재용
11월 18일 21:09 · 멀티캠

[공지]

3주차 강의자료를 아래 두 개의 문서로 대체합니다.

기존 3주차, 4주차 강의자료에서 중요도가 떨어지는 부분을 제외했고, 실습중 사용할 웹페이지가 개편되어 새로 코드를 작성했습니다.

https://www.notion.so/WEEK3-9f008766023944fda6d94ad55741b243

https://www.notion.so/WEEK3-2-433361edc51e4e788e5d9001cb444176

자세히 보기
신재용
11월 12일 21:36 · 멀티캠

[과제]

6주차 미니프로젝트 기획하기

ex)

1. 나이키 한정판 발매 사이트를 수집한다.

https://www.nike.com/kr/launch/?type=upcoming&activeDate=date-filter:AFTER

2. 수집한 데이터에 한정판 신발이 있다면 텔레그램 메시지로 전송한다.

3. 매일 아침 10시에 자동으로 1~2번의 과정을 수행한다.

------------------------------------------------------------------------------

제출해주시면 실현 가능성을 검토하겠습니다.

경우에 따라 크롤링이 도저히 불가능한 사이트가 있습니다.

자세히 보기
신재용
11월 6일 00:57 · 멀티캠

수업중에 보여드렸던 HTML 추가 자료입니다.

https://url.kr/QtD9xw

남주현
11월 5일 19:37 · 멀티캠
등록했습니다. 잘 부탁드려요:).
안길현
11월 5일 19:35 · 멀티캠
저도 함께 하게 됐어요~ 끝까지 열심히 하겠습니다~!
천준수
11월 5일 19:34 · 멀티캠
저도 함께 하게 됐어요~ 잘 부탁드립니다!
정인영
11월 5일 19:33 · 멀티캠
안녕하세요~ 잘 부탁드려요:).
참여자 네이버 정복 파이썬 크롤링
너무 고민말고 물어보세요!
kakao 카카오톡 상담
kakao 적성 테스트
부담없이 채팅 상담하세요. 친절한 코알라가 대기중입니다:)