본문 바로가기
코딩 연습/코딩배우기

11번가 실시간 쇼핑 검색어 추출해서 저장하기(python tkinter)

by good4me 2022. 1. 10.

goodthings4me.tistory.com

11번가의 검색란 우측에 있는 키워드 롤링 부분을 클릭하면, 실시간 쇼핑 검색어 20개가 보인다. 이 부분에 대해 파이썬으로 스크래핑 후 csv 파일로 저장하는 소스코드와 Tkinter로 UI를 만들어 실행 파일로 생성하는 방법을 참고용으로 기록함.

파이썬 Tkinter로 11번가의 실시간 쇼핑 검색어 순위 추출 및 저장하기

 

파이썬 소스코드

from tkinter import *
import tkinter.messagebox as msgbox
import re
import webbrowser
import pyperclip
import requests
import json
from csv import *


root = Tk()
root.title('검색어 순위')
root.geometry('450x350+700+100')
root.resizable(False, False)


def popul_11st(popul_cnt):
    # popul_cnt 순위 지정
    popul_url = f'https://www.11st.co.kr/AutoCompleteAjaxAction.tmall?method=getKeywordRankJson&type=hot&isSSL=Y&rankCnt={popul_cnt}&callback=fetchSearchRanking'
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36',
    }    
    r1 = requests.get(popul_url)

    if r1.status_code == 200:
        r1.encoding = 'utf-8'
        fr = r1.text.find('({')
        to = r1.text.find('})')
        r1_str = r1.text[fr + 1 : to + 1]  # 슬라이스로 추출
        dict_data = json.loads(r1_str)

        search_cnt = 0
        ## 인기 검색어 상품을 csv로 저장
        with open('11st_popul.csv', 'w', encoding='utf-8-sig', newline='') as f:
            thewriter = writer(f)  # csv.writer()
            header = ['Rank', 'Keyword', 'SearchCount', 'Link']
            thewriter.writerow(header)

            for items in dict_data['items']:
                print(f'{str(items["currentRank"]).zfill(2)}_{items["keyword"]}[{items["searchCount"]}] / {items["pcSearchLink"]}')
                search_cnt += int(items["searchCount"])

                product_link = items["pcSearchLink"]
                link = f'=HYPERLINK("{product_link}", "{product_link}")'  # 하이퍼링크 작업
                info = [str(items["currentRank"]).zfill(2), items["keyword"], items["searchCount"], link]
                thewriter.writerow(info)
    
    return search_cnt


##### Tkinter Code #####

def func_quit():
    root.destroy()


def copy_url():
    print(lbl_result['text'], lbl_result.cget('text'))
    pyperclip.copy(lbl_result['text'])
    # print(lbl_result.text.get())


# 시작 버튼
def start():
    ## 입력란이 비었는지 확인함
    val = txt_entry_url.get()  # str로 넘어온다.(특수문자 포함)

    # 숫자가 아닌 것 찾기(단, ''는 못 찾고 오류나서 예외처리함)
    p = re.compile('\D')
    match = p.search(val)
    # print(match)
    try:
        if not match and int(val) > 0:
            keyword_cnt = int(txt_entry_url.get())

            state_var.set('실행중.....')
            root.update_idletasks()

            result = popul_11st(keyword_cnt)  # 함수 호출
            print(result)

            if result:
                res = f'* 인기 검색어 {keyword_cnt}개 [검색 합계 {result:,}건]이 csv 파일로 저장됨'
                lbl_result.configure(text=res, font=('Arial', 9))
            else:
                lbl_result.configure(text='추출 실패, 입력된 숫자 확인 요망', font=('Arial', 9))

            state_var.set('작업 완료..!!')
        else:
            msgbox.showwarning('Info', '숫자(양의 정수)를 입력하세요!')
            return
    except:
        msgbox.showwarning('Info', '숫자(양의 정수)를 입력하세요!')
        return


def read_me():
    msgbox.showwarning('Info',
            '본 프로그램은 11번가 쇼핑사이트에 의존적인 프로그램이기 때문에 사이트 UI가 변경되면 '
            '실시간 검색어를 추출할 수 없습니다.\n\n'
            '순위별 검색어, 검색수, 링크(URL)를 추출하고, 추출된 데이터는 프로그램이 있는 폴더에 csv 파일로 저장됩니다.\n')


def callback(url):
    webbrowser.open_new(url)


# 제목 표시 row 들어갈 공간
lbl_use_frame = Frame(root)
lbl_use_frame.pack(fill='x', padx=2, pady=2)

txt_url = '11번가 인기 검색어 추출'
lbl_url_txt = Label(lbl_use_frame, text=txt_url, font=('Helveticabold', 11, 'bold'), justify='left', fg='blue')
lbl_url_txt.pack(side='left', fill='x', padx=7, pady=5, ipadx=1)

lbl_ad = Label(lbl_use_frame, padx=5, pady=5, text='[4u.ne.kr]', width=5, fg='blue', cursor='hand2')
lbl_ad.pack(side='right', padx=20, pady=5)
lbl_ad.bind('<Button-1>', lambda e: callback('http://4u.ne.kr/'))


# 값 입력(URL, 숫자) 설명 LabelFrame
url_frame = LabelFrame(root, text="")
url_frame.pack(fill="x", padx=10, pady=5, ipady=5)

# 입력 레이블
lbl_url = Label(url_frame, text='검색할 인기 검색어 숫자 입력(최대 200) :', width=30)
lbl_url.configure(font=('Arial', 10, 'bold'))
lbl_url.pack(side='left', padx=5, pady=5)

# 입력 란
txt_entry_url = Entry(url_frame)
txt_entry_url.config(width=10, justify='right')
txt_entry_url.insert(0, '20')
txt_entry_url.pack(side='left', fill='x', padx=8, pady=5, ipady=3)

# Read ME
btn_close = Button(url_frame, text='Read Me', width=10, fg='black', cursor='hand2', command=read_me)
btn_close.pack(side='right', padx=5, pady=5)


# 결과 출력 프레임
list_frame = Frame(root)
list_frame.pack(fill='both', padx=10, pady=5)

# 결과 출력
lbl_result = Label(list_frame, text='* 본 프로그램이 있는 폴더에 "11번가 인기검색어.csv" 파일로 저장함 ', fg='black')
lbl_result.configure(font=('Arial', 9,))
lbl_result.pack(side='left', padx=5, pady=5)


# 프로그램 실행 표시 들어갈 공간
lbl_execute_frame = Frame(root)
lbl_execute_frame.pack(fill='x', padx=5, pady=5)

state_var = StringVar()
state_var.set(' ')
lbl_state_txt = Label(lbl_execute_frame, textvariable=state_var)
lbl_state_txt.configure(font=('Arial', 12, 'bold', 'italic'), height=2)
lbl_state_txt.pack(side='right', fill='x', padx=5, pady=5)


# 실행 프레임 - 시작, 닫기
frame_run = Frame(root)
frame_run.pack(fill='x', padx=10, pady=5)

btn_close = Button(frame_run, padx=5, pady=5, text='닫기', width=12, fg='black', cursor='hand2', command=func_quit)
btn_close.pack(side='right', padx=5, pady=5)

btn_start = Button(frame_run, padx=5, pady=5, text='추출 시작', width=12, fg='black', cursor='hand2', command=start)
btn_start.configure(font=('Arial', 10, 'bold'))
btn_start.pack(side='right', padx=5, pady=5)

root.mainloop()

good4me.co.kr


Tkinter로 구현한 화면

구현 프로그램 다운로드

 

11번가 검색어 추출 tkinter 구현 - 시작

 

11번가 검색어 추출 tkinter 구현 - 실행 결과

 

pyinstaller로 실행 파일 만드는 명령

- pyinstaller 4.xx 버전인 경우, 바이러스 탐지(오인??) 문제가 있어서 3.6버전으로 해야 한다고 함

# 설치 명령
pip install pyinstaller==3.6

# 실행 파일(.exe) 만들기
pyinstaller -w -F 소스코드명.py

 

댓글