본문 바로가기

코딩 연습/코딩배우기166

폴더 파일리스트 추출하여 엑셀에 저장하고, 파일명 바꾸기(파일이름 일괄변경 포함) 지정한 폴더에 있는 파일을 읽어와서 엑셀에 저장하는 코드와, 불러들인 파일명에 대응하여 주어진 이름(엑셀에 '변경 파일명' 컬럼 이용)으로 파일 이름을 바꾸는 코드를 만들어봤다. ◆ 지정 폴더 내 파일들을 읽고 파일명을 엑셀에 저장하기 먼저, 탐색기 폴더(위 이미지 참고)에 있는 파일 리스트를 읽어오는 코드는 다음과 같다. [소스 코드] Tkinter로 만든 실행 파일(exe) 다운로드 import pathlib import openpyxl def read_files(dir_path, filename): wb = openpyxl.Workbook() ws = wb['Sheet'] # wb.active xl_filename = filename + '.xlsx' ws.cell(1, 1).value = 'No'.. 2022. 3. 15.
국민 내일배움카드 'K-디지털 기초역량훈련' 내용과 파이썬으로 과정명 크롤링하기 직장을 다니든 안 다니든 자기 계발을 국가가 지원하는 제도인 '국민내일배움카드'를 들어보았을 것이다. 이 카드를 활용하는 사이트인 '직업훈련포털 HRD-Net(https://www.hrd.go.kr)'의 'K-디지털 기초역량 훈련'에 대해서 알아보고, 해당 과정의 웹 페이지 내용(과정명 등)에 대해 크롤링(스크래핑)하는 연습을 해보려고 한다. 'K-디지털 기초역량훈련' 내용과 과정명 등에 대한 크롤링해보기 K-디지털 기초역량훈련 K-디지털 기초역량 훈련은 디지털 분야에서 일하고 싶은 비전공자의 디지털 기초역량을 습득을 위해 기초 코딩, 웹·앱 개발 등을 입문 과정부터 배우도록 지원하는 제도로, 업무와 훈련을 병행할 수 있도록 100% 원격으로 진행되며, 국민내일배움카드 지원금액 이외로 1인당 50만 원까.. 2022. 3. 11.
파이썬 pyshorteners 라이브러리로 단축 URL(단축 링크) 만들기 유튜브 영상 주소(URL), 쿠팡 파트너스 등 제휴 마케팅 사이트의 긴 주소(URL)를 네이버 블로그, SNS, 이메일, 문자메시지 등에 삽입할 수 있도록 파이썬 pyshorteners 라이브러리 활용하여 단축 URL을 만드는 방법을 설명하려고 한다. 파이썬 라이브러리로 단축 URL 만들어보기 네이버 블로그, SNS 등에 쿠팡 파트너스 등의 제휴 마케팅 사이트 주소(광고 배너 링크나 키워드 링크 URL 등)를 넣으면 검색에서 불이익을 받는 경우가 있다고 하여 긴 URL을 짧게 만드는 단축 URL을 많이 사용한다. 그런데, 단축 URL을 사용할 때 주의해야 할 점이 있다. 한 번 사용하고 버릴 단축 URL이라면 상관없지만, 중요한 사이트이거나 계속해서 사용할 경우에는 이름이 있거나 오랜 기간 서비스를 하고.. 2022. 2. 16.
juso.go.kr 도로명 주소, 엑셀로 분리하는 방법을 파이썬으로 해보기 juso.go.kr의 도로명 주소를 보면, 형태가 4가지로 나오는데 '건물번호'까지만 있는 것과 괄호 안에 동명칭, 건물 명칭이 있는 것, 그리고 괄호 안에 동명칭만 있거나 동명칭은 없고 건물 명칭만 있는 것 등이다. 도로명 주소를 엑셀을 이용해 주소를 구분(분리)하는 방법도 있지만, 파이썬의 openpyxl 라이브러리 사용하여 빠르게 분리하는 방법도 있다. 파이썬으로 도로명 주소 분리해보기 먼저, 괄호 안에 동명칭이나 건물 명칭이 있는 것은 엑셀로 쉽게 분리할 수 있으니 그 부분은 분리했다고 하고, 건물번호까지 각각을 분리하는 방법을 코드로 구현해보았다. ☞ "강원도 속초시 미시령로3359번길 9(교동, 현대아파트)"에서 (교동, 현대아파트) 부분은 괄호 부분을 find() 함수로 찾아서 mid() 등.. 2022. 2. 9.
juso.go.kr에서 파이썬으로 도로명주소 등 추출 juso 사이트의 검색란에 '고양시 아파트'처럼 키워드를 입력하여 우편주소, 도로명 주소, 도로명 영문주소, 지번 주소를 추출해보는 파이썬 크롤링 연습용 코드를 작성해봤다. 파이썬으로 juso 사이트에서 주소 추출하기 juso.go.kr의 검색란에 검색 키워드(예로, 고양시 아파트)를 입력하고 검색하면 도로명주소와 지번주소, 영문과 국문 변환, 우편번호 등을 확인할 수 있다. 여기서 도로명주소와 지번주소, 영문 도로명주소, 우편번호 등을 파이썬으로 크롤링해볼 것이다. 일단, 주소(URL)를 살펴보면, https://www.juso.go.kr/support/AddressMainSearch.do?currentPage=1&countPerPage=10&&searchType=HSTRY&searchKeyword=고.. 2022. 2. 2.
파이썬으로 아파트 관련 기본 정보 추출해보기(공공데이터포털 API 사용법) 아파트 관련 정보가 필요하여 공공데이터 포털(data.go.kr)에서 국토교통부 공동주택 기본 정보제공 서비스에 대한 오픈 API 활용신청 후 파이썬으로 코딩 후 데이터를 추출해보았다. 공공데이터 포털 API 사용해 아파트 정보 추출 공공데이터 포털에서 추출한 공동주택 관련 기본 정보제공 서비스에는 2가지 서비스가 있는데, 1) 공동주택 기본 정보조회 단지 코드를 이용해 단지명, 법정동 주소, 분양 형태, 난방방식, 건축물대장상 연면적, 동수, 세대수, 시공사, 시행사, 관리사무소 연락처, 관리사무소 팩스, 홈페이지 주소, 단지 분류, 도로명주소, 호수, 관리방식, 복도 유형, 사용승인일, 관리비 부과면적, 전용면적별 세대 현황, 단지 전용면적합, 법정동 코드를 조회할 수 있는 공동주택 기본 정보제공 서.. 2022. 1. 24.
공공데이터 포털 api 사용법 - 파이썬으로 아파트 단지 코드 추출 ※파이썬으로 아파트 표준 데이터(공동주택 기본 정보) 관련 정보를 얻기 위해 공공데이터 포털에서 제공하는 단지 코드를 API를 활용해보았다. 그런데 전국에 있는 아파트 전체에 대한 코드가 아니라 관리비 공개 의무 단지만을 대상으로 하는 코드만 제공하는지 실제 아파트 숫자보다 적었다. 공공데이터 포털 오픈 API로 아파트 단지 코드 추출해보기 공동주택 관리비의 투명성 등을 확보한다는 취지로 지정된 "관리비 공개 의무 단지"는 다음과 같다고 되어있다. ☞ 참고 : 공동주택관리 정보시스템 http://www.k-apt.go.kr/cmmn/kaptworkintro.do 300세대 이상 공동주택, 승강기가 설치되었거나 중앙(지역) 난방방식을 갖춘 150세대 이상인 공동주택, 주택 150세대 이상인 주상복합 아파트.. 2022. 1. 23.
파이썬 사전 타입 OrderedDict()와 dict() 차이점, 그리고 변환 파이썬 OrderedDict()는 순서 있는 딕셔너리이다. 순서가 없는 dict()에 3.6 버전에서부터 순서를 부여하긴 했으나 자료 호환성 측면과 순서가 중요한 경우, OrderedDict()를 사용한다. 그런데 문제는 중첩(nested)된 OrderedDict 형태였다. 파이썬 OrderedDict()를 dict() 타입으로 변환 최근 창호 관련 홍보, 부동산 매물 확보와 부동산 분양 등의 홍보 등을 위한 DM 주소 확보를 위해 공공데이터 포털에서 아파트 관련 정보를 추출하고 있는데, 아파트 단지 코드가 필요하여 관련 open api를 활용하여 추출해야 했다. 그런데, 샘플 데이터인 xml 데이터를 파싱 해서 보니 OrderedDict 타입으로 되어있었다. 이 자료를 엑셀로 저장하기 위해 dict 타.. 2022. 1. 20.
공공데이터를 활용한 아파트 도로명 주소 등 추출해보기 공공데이터를 openapi로 제공하는 data.go.kr에서 아파트 관련 정보를 얻기 위해 api 사용 연습을 해보았는데, 구글에서 관련 자료들을 참고하여 시도하니 큰 어려움은 없었으나 1일당 제공하는 데이터의 양이 적은 것도 있어서, 표준 데이터(공동주택 기본 정보)를 활용했고, 그에 대한 샘플 자료를 대상으로 한 api 호출 내용을 정리해보았다. 아파트(공동주택) 기본 정보 api 호출 연습 등에 대한 정리 1. 본 작업을 하게 된 동기 얼마 전에 창호 샷시 교체 사업을 하는 회사에 다니는 지인의 부탁으로 아파트 dm을 보낼 주소(도로명 주소 기반 아파트 주소)를 구해달라는 부탁을 받았다. 인근 아파트에 리플릿이나 전단지 배포를 위해 사람을 고용하여 동, 호수마다 전단지를 한 장씩 배포하는 것은 해당.. 2022. 1. 18.
웹 페이지 <script> 태그 CDATA, 넌 뭐하는 넘이니... 웹 페이지 내 파이썬 스크래핑(크롤링)으로 CDATA 추출하는 방법 CDATA를 쓰는 이유는, 웹 브라우저의 구문 분석(XML Parser) 문제 때문에 사용하기도 하고, 웹 사이트에서 데이터를 추출할 때, 과도하게 추출하는 것을 막기 위한 조치, 즉 스크래핑(크롤링) 못하도록 여러 장치를 두는 한 방법으로도 사용하는 것이라고 한다. CDATA 있는 웹 페이지(샘플) ''' +855 (0)23 21 59 60 c.vattanakpagna@acclime.com https://cambodia.acclime.com/ ''' 크롤링 해보기 from requests_html import HTMLSession import re url = 'https://www.eurocham-cambodia.org/member/5.. 2022. 1. 15.