BeautifulSoup를 이용한 멜론차트 웹크롤링입니다.
노래제목은 ellipsis rank01 태그의 <a> 에 저장되어있고
가수이름은 ellipsis rank02 태그에 <a> 에 저장되어있음.
-실행결과
전체소스코드
import requests
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Trident/7.0; rv:11.0) like Gecko'}
response = requests.get('https://www.melon.com/chart/index.htm',headers=header) #멜론차트는 헤더정보를 입력해줘야함
html = response.text
from bs4 import BeautifulSoup #BeautifulSoup import
soup = BeautifulSoup(html, 'html.parser') #html.parser를 사용해서 soup에 넣겠다
title = soup.find_all("div",{"class":"ellipsis rank01"}) #노래제목
singer = soup.find_all("div",{"class":"ellipsis rank02"}) #가수
real_title = []
real_singer = []
for i in title:
real_title.append(i.find('a').text)
for j in singer:
real_singer.append(j.find('a').text)
rank = 50
for r in range(rank):
print( '%2d위 : %s - %s'%(r+1, real_singer[r],real_title[r]))