본문 바로가기
[업무 지식]/Crawling

[RSS 파싱] XML(RSS) 스크레이핑

by 에디터 윤슬 2024. 12. 31.
# 기상청 RSS 다운로드
# 서울/경기도 지역의 중기 예보 날씨
# http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnId=109

# ElementTree 모듈을 읽어 들입니다.
from xml.etree import ElementTree

# parse() 함수로 파일을 읽어 들이고 ElementTree 객체를 만듭니다.
tree = ElementTree.parse('rss.xml')

# getroot() 메서드로 XML의 루트 요소를 추출합니다.
root = tree.getroot()

# findall() 메서드로 요소 목록을 추출합니다.
# 태그를 찾습니다(자세한 내용은 RSS를 열어 참고해주세요).
for item in root.findall('channel/item/description/body/location/data'):
    # find() 메서드로 요소를 찾고 text 속성으로 값을 추출합니다.
    tm_ef = item.find('tmEf').text
    tmn = item.find('tmn').text
    tmx = item.find('tmx').text
    wf = item.find('wf').text
    print(tm_ef, tmn, tmx, wf) # 출력합니다.

 

서울/경기도 지역의 중기예보