goodthings4me.tistory.com
'다음 영화'에서 영화관의 정보에 대해 파이썬 크롤링을 하는 문제 해결 코드임. json 데이터에서 영화 제목, 이미지 주소를 가져오고, 영화 이미지 다운로드하는데 폴더가 없으면 만들어서 저장하는 작업을 수행하는 문제임
다음(daum) 영화 제목 추출과 이미지 다운로드 저장하기

문제 해결 소스 코드
import requests
from bs4 import BeautifulSoup
import json
import os
from datetime import date
# daum_movie_url = 'https://movie.daum.net/premovie/theater'
# json_url = 'https://movie.daum.net/api/premovie?page=1&size=20&flag=Y'
def daum_movie(pages):
for page in range(1, pages + 1):
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'}
url = f'https://movie.daum.net/api/premovie?page={page}&size=20&flag=Y'
# url = 'https://movie.daum.net/api/premovie'
# payload = {
# 'page': page,
# 'size': 20,
# 'flag': 'Y'
# }
response = requests.get(url, headers=headers)
if response.status_code == 200:
print(type(response.text))
data = json.loads(response.text)
contents = data['contents']
contents_len = len(contents)
print(contents_len)
if not contents_len:
return False
folder_name = f'./theater_img/{date.today()}'
if not os.path.exists('./theater_img'):
os.makedirs(folder_name)
movie_info = []
for content in data['contents']:
print(content['titleKorean'])
print(content['mainPhoto']['imageUrl'])
title = content['titleKorean']
movie_image = content['mainPhoto']['imageUrl']
movie_info.append(title + '$' + movie_image)
print(folder_name + f'/{title}.jpg')
with open(folder_name + f'/{title}.jpg', 'wb') as f:
image = requests.get(movie_image, headers=headers).content
f.write(image)
# print(movie_info)
else :
print(response.status_code)
daum_movie(4)
- 코드를 작성하면서 테스트를 해보니 payload를 주었을 경우, 영화 목록이 10개만 가져올 수 있었음
- 그래서, 주석처리 후 파라미터를 직접 대입해서 처리해보니 전체 영화 목록이 있는 json 데이터를 받게 됨
- 함수의 인자(페이지수)는 임의로 줘도 되나(josn 데이터가 없으면 return시킴), 페이지수를 찾아서 주는 것이 좋을 듯.
1년 몇 개월 전에 짜 놓은 네이버 영화 평점 크롤링 소스 보기>>
파이썬 크롤링(Crawling) 연습 - 네이버 영화 평점/리뷰, 영화코드 추출
■ 네이버 영화 사이트에 있는 평점/리뷰의 제목과 평점을 추출하여 dict로 저장하고, 영화코드를 파일로 저장해보기 import urllib.request from bs4 import BeautifulSoup from itertools import count def get_..
goodthings4me.tistory.com
블로그 인기글
유튜브 영상 등의 URL 주소를 QR코드로 만들기
네이버 QR코드, makeQR, MUST QRcode, 무료 온라인 QRCode 생성기 등의 웹사이트에서 유튜브 영상 등의 URL을 입력하여 QR코드를 만들 수 있다. QR코드를 생성할 수 있는 사이트와 프로그램 URL 주소를 붙여넣기 한 후 "QR 코드 생성" 버튼을 클릭하면 큐알코드가 이미지로 생성되고, 다운로드도 할 수 있는 사이트 https://truedoum.com/useful/qrcode/ # 유튜브에서 동영상 URL을 복사하는 방법 유튜브에서 QR코드를 만들 동영상을 검색한다. 해당 동영상을 클릭한다. 동영상 위에서 마우스 우클릭 후 나오는 팝업창에서 “동영상 URL 복사”를 클릭하거나 영상 하단의 “공유”를 클릭하여 나온 창에서 URL를 복사한다. 아래의 웹사이트 중 하나를 선택한 후 복사..
goodthings4me.tistory.com
엑셀 시트 분리 저장 - 엑셀 파일의 시트를 분리하여 저장하기
엑셀을 사용하다 보면 엑셀 시트를 분리해서 저장해야 할 때가 있다. 최근에도 이런 경우가 발생하여 구글링 후 엑셀 시트 분리 업무를 수행하고 내친김에 다른 사람들도 사용할 수 있도록 파이썬 tkinter로 프로그램으로 만들어 보았다. Excel Sheets 분리 저장하는 프로그램(with 파이썬 Tkinter) ※ 프로그램 다운로드(네이버 MYBOX에서 공유) : ExcelSeparateSheets.zip ▶ 프래그램을 실행하면 다음과 같이 초기 화면이 보인다. 찾아보기 : 엑셀 파일이 있는 폴더를 선택한다. (프로그램이 있는 최상위 디렉터리가 열린다) 실행하기 : 프로그램 실행 버튼 상태 변경 순서 : 실행전 → 실행 중 → Sheet "OOO" 분리 저장 중 → 실행 완료 실행 결과 확인 : 엑셀 파..
goodthings4me.tistory.com
폐업 신고 절차와 부가가치세 신고하는 방법
폐업 신고 시 세무서 안 가고 온라인으로 신고하는 방법인 '국세청 홈택스를 이용하여 폐업 신고하는 절차와 폐업 후 해야 하는 부가가치세 신고, 인건비 저리, 종합소득세 신고 등에 대해 포스팅합니다. 폐업 신고 시 홈택스 이용하는 방법과 부가가치세 등 신고 절차 여러가지 사유로 폐업을 해야 할 때, 예전에는 세무서를 방문해야 했지만 국세청 홈택스가 생긴 이후에는 사업자 등록이나 폐업 등을 인터넷으로 할 수가 있게 되었습니다. 특히, 코로나 시국인 요즘은 더더욱 온라인 신청 업무가 더 활성화되었죠. 폐업을 한다는 것 자체가 우울한 일인데, 발품을 파는 것보다는 커피 한잔 하면서 인터넷으로 간단하게 처리하는 게 좋을 듯하여 그 절차를 올려봅니다. 폐업은 폐업 신고와 함께 폐업 후 절차까지 모두 마쳐야 불이익이..
goodthings4me.tistory.com
'코딩 연습 > 코딩배우기' 카테고리의 다른 글
openpyxl 엑셀 파일 확장자(.xls) 에러 해결하는 방법 (0) | 2022.04.10 |
---|---|
파이썬 소수 찾기 (0) | 2022.04.09 |
파이썬 GUI 모듈 tkinter 연습(쿠팡 파트너스 상품 링크 관리 프로그램 만들기) (0) | 2022.04.07 |
파이썬 truncate() 함수로 텍스트 파일 내용 삭제하기 (0) | 2022.04.07 |
로또 당첨번호 회차별 엑셀 저장(파이썬 크롤링) (0) | 2022.03.30 |
댓글