본문 바로가기

코딩 연습283

파이썬 정규식 r'[^\w]' 의미와 re.sub(r'[^\w\s]', '', text) 사용 파이썬 정규식 r'[^\w]'정규식 r'[^\w]'는 특정 패턴을 찾기 위해 사용되는 것으로 각 부분의 의미를 설명하면, r'' : r은 "raw string"을 의미하며, 이 형식으로 문자열을 정의하면 이스케이프 문자(\)가 특별한 의미를 갖지 않고 그대로 문자열로 처리됩니다. 예를 들어, \n은 줄 바꿈이 아닌 문자로 인식됩니다. [ ] : 대괄호([ ])는 문자 클래스를 정의합니다. 이 안에 있는 문자 중 하나와 일치하는 경우를 찾습니다. ^ : 대괄호 안에서 ^는 "not"을 의미합니다. 즉, 대괄호 안에 있는 문자들을 제외한 모든 문자와 일치합니다. \w : \w는 알파벳 대문자(A-Z), 소문자(a-z), 숫자(0-9) 및 언더스코어(_)를 포함하는 모든 단어 문자를 의미합니다. 즉, \w는 .. 2025. 2. 1.
파이썬 정규표현식 r'"(.*?)" ' 과 re.DOTALL 알아보기 구글 gemini api로 특정 문자열을 다듬어서 반환하는 코드가 아래 리스트로 나와서 문자열만을 다시 추출하기 위해 정규표현식을 사용함 파이썬 정규식 r'"(.*?)" ' 과 re.DOTALL  ▷구글 gemini api 반환 결과['{\n', '"rewritten_sentences": "헌화로는 헌화가에서 이름을 따온 도로예요. 순정공이 강릉 태수로 부임할 때, 그의 부인인 수로부인이 절벽 위 철쭉을 꺾어달라고 했대요. 하지만 위험해서 아무도 못했는데, 소를 끌던 노인이 나서서 꽃을 꺾어 바치며 헌화가를 불렀대요."\n', '}'] ▷ 정규표현식matches = re.findall(r'"(.*?)"', data, re.DOTALL) 정규표현식 "(.*?)"는 문자열에서 큰따옴표(")로 감싸인 내용을 .. 2025. 2. 1.
블로그 글 복사 - 네이버 블로그 텍스트 추출 네이버 블로그의 텍스트가 필요할 때 마우스 문장 하나씩 드래그하여 복사하는 방법도 있고, 혹시 블로그 글 복사 방지가 되어있을 때 브라우저의 설정에서 막힌 스크립트를 풀고 드래그를 하는 방법도 있지만, 아래처럼 프로그램을 만들어서 사용하는 방법도 있습니다.   프로그램 다운로드  네이버 블로그 텍스트 추출하기위 프로그램의 소스코드는 다음과 같습니다. 프로그램 사용법 보기 import refrom tkinter import *import tkinter as tkimport tkinter.messagebox as msgboximport webbrowserimport requestsfrom bs4 import BeautifulSouproot = Tk()root.title('네이버 블로그 텍스트 추출')root.. 2024. 11. 24.
티스토리 글쓰기 - 파이썬 selenium 자동 등록 코드 2년 전에 티스토리 API를 활용하여 자동 등록하는 코드를 만들었는데, 이용을 안 하다가 최근에 다시 해볼까 해서 정보를 찾아보니 티스토리 등록 API가 없어졌다고 한다. 그래서 selenium을 만들어서 테스트한 후 그 코드를 올려봅니다.  티스토리에 html 파일 자동 등록하기티스토리에 여러개의 글을 html 파일 형태로 등록하기 위해서는 다음과 같은 절차로 진행합니다.카테고리를 하나 만든다. (카테고리가 없으면 생략해도 되지만, 아래 코드는 '테스트'라는 카테고리에 등록함)티스토리에 포스팅 등록할 html 파일을 먼저 만든다.selnium을 사용하여 티스토리에 자동으로 html 모드 방식으로 등록하도록 코드를 작성한다. (아래 코드) 등록 페이지 먼저 확인하기  1. 티스토리 카테고리 만들기  2... 2024. 11. 21.
동영상 음원추출 - 파이썬 moviepy 사용 동영상에서 오디오 음원을 추출하고 싶을 때 파이썬 moviepy 라이브러리를 사용하니 아주 쉽게 영상 음원 추출이 가능했어요. 내 영상을 웹 사이트에 올릴 필요 없이 PC에 있는 동영상을 선택만 하면 바로 mp3로 만들어 준답니다.   동영상 음원추출 파이썬 코드로 작성해서 사용하기유튜브 동영상을 다운로드 받는 프로그램을 사용해서 영상을 받았는데, 오디오 음원 추출이 하고 싶을 때가 있습니다. 유튜브 영상 다운로드 프로그램 받기 보통은 웹 사이트에 영상을 올려서 동영상 음원 추출을 하곤 하는데, 파이썬의 movepy 라이브러리를 사용하면 간편하게 영상 음원 추출이 가능합니다. 이 라이브러리와 Tkinter를 사용하면 아주 간단하게 동영상 오디오 추출 프로그램을 만들 수 있습니다.  ※ 파이썬 moviep.. 2024. 11. 7.
html color에 사용할 rgb 색상표 만들기 html 코딩 시 color의 색상 코드를 입력할 때 참고할 수 있는 rgb 색상표를 Matplotlib 라이브러리 파이썬 코드로 쉽게 만들 수 있어서 올려봅니다.  RGB 색상표 코드 확인하기  rgb 색상표 만드는 파이썬 코드색상표 영문 이름, HEX 코드, 그리고 색상을 테이블로 표시되는 html 코드를 생성합니다.from matplotlib import colors as mcolors# 시작 테이블 태그colors_html = ''' Color Name HEX Display '''for key, hex_value in mcolors.CSS4_COLORS.items(): print(f"{key:20} : {hex_value}") # RGB.. 2024. 9. 8.
블로그스팟 포스팅 URL 글 목록 전체 가져오기 Blogger 블로그스팟 API를 사용하면, 아주 쉽게 블로그의 포스트 URL만 가져올 수 있다. 구글 검색 등록, 빙 검색 등록, 네이버 웹마스터 검색 등록을 하기 위해서 블로그 스팟 api를 사용하니 엄청 편해요.블로그스팟 포스팅 URL 가져오기on 코드 사용 예시 구글 api 키는 발급받았다는 가정 하에, pip install google-api-python-client 명령으로 설치한 googleapiclient 패키지를 사용하여 Blogger 블로그의 포스트 URL을 가져오는 파이썬 예제 코드임 api_key : Google Cloud Console에서 생성한 본인의 API 키 사용blog_id : 블로그스팟의 블로그 ID, Blogger에 로그인했을 때 주소(https://www.blogger.. 2024. 8. 25.
네이버 주식 데이터 추출(크롤링), 판다스 그래프 그리기 판다스를 배우는 단계에서 시계열 데이터인 네이버 주식 현황을 크롤링한 코드로 matplotlib와 seaborn으로 그래프를 그리는 코드 연습을 해봤다. 네이버 주식 데이터 크롤링(파이썬) 네이버 주식에 대한 크롤링은 파이썬으로 간단하게 작성이 가능함. 삼성전자 코드로 예시 데이터를 추출했고, 다른 기업으로 변경할 때는 해당 기업의 코드만 변경하면 됨 import requests import time import pandas as pd total_data = [] stock_code = '005930' # 삼성전자 for page in range(1, 11): print(f'Page - #{page}') url = f'https://m.stock.naver.com/api/stock/{stock_code}.. 2024. 3. 30.
판다스 날짜 추출 - 연,월,일 분리 날짜 데이(2023-01-01)에서 연,월,일을 각각 분리하여 다른 열(컬럼)에 저장하는 판다스 날짜 추출 연습 코드. 월, 일의 경우 2자리를 유지하도록 추출하기 위해 문자열 포맷팅을 사용함 판다스로 날짜에서 연,월일, 추출해보기 ▶ 날짜 컬럼이 있는 엑셀 파일 : test.xlsx ▶ 판다스로 엑셀 파일을 불러오기 'test.xlsx' 파일을 읽어와 데이터프레임으로 저장한 후, 그 데이터프레임을 출력하는 작업을 수행함 ▶ 엑셀 파일이 아닌 dict 타입 날짜를 사용하여 연, 월, 일 분리하기 dict를 DataFrame으로 만든 후 날짜 컬럼 'startDt' 열에 대해 to_datetime()와 dt 접근자를 사용하여 연도, 월, 일을 추출하고 각각 'year', 'month', 'day' 열에 저.. 2024. 3. 28.
파이썬 워드클라우드 설치, konlpy Okt() 사용 파이썬 워드클라우드 설치 후 마스크 이미지로 워드클라우드 모양을 만들어 보았는데, konlpy의 Okt()를 사용하지 않으면 문장의 형태소 문제로 인해 제대로 된 텍스트 마이닝이 되지 않았다. 본 글에서는 파이썬과 윈도우 환경에서 konlpy의 Okt()를 사용하기 위한 자바 jdk 설치, konlpy 라이브러리 설치, 그리고 워드클라우드를 표시하기 위한 마스크 이미지를 만들 수 있는 파이썬 코드를 작성해보려고 한다. 자바 jdk 설치 konlpy 라이브러리를 사용하기 위해서는 자바 JDK가 설치되어 있어야 한다고 하여, JDK 17 버전을 받아서 설치함 JDK(Java SE Development Kit) 17 다운로드(오라클 사이트) 다운로드 파일 설치 시 "Next>"만 계속 클릭하여 설치를 완료한다.. 2024. 2. 14.