본문 바로가기

웹 크롤링

파이썬 웹 크롤링 comp.fnguide 재무 데이터 가져오기: pd.read_html() 전업 개발자가 아닌 분들도 파이썬 웹 스크래핑/크롤링에 관심 많은 것 같습니다. 아무래도 다른 분야보다 활용할 수 있는 곳이 다양하기 때문이 아닌가 싶습니다. 그중에서도 특히 개인 투자자 분들이 더 적극적이라는 느낌을 받습니다. 최근에 지인으로부터 재무제표를 수집할 수 있는 방법에 대해서 질문을 받았고, 관련해서 해당 내용을 좀 찾아봤습니다. 네이버 블로그에 이미 해당 내용이 잘 정리된 글이 있어서, 그 코드에 pd.read_html()을 덧붙여 보았습니다. 종목코드만 입력하고 코드를 실행하면 해당 기업의 재무 정보를 판다스 데이터프레임 형태로 가져올 수 있습니다. https://blog.naver.com/htk1019/221266979613 파이썬 웹 스크레이퍼 만들기 8편. Fnguide 데이터가져오.. 더보기
파이썬 이미지 크롤링: 코드 세줄로 이미지 다운로드 받기 오늘은 딱 세줄의 코드로 웹 사이트에서 이미지를 다운로드하는 방법을 알아보겠습니다. 이미지 url을 이용해서 내 컴퓨터에 저장하는 방법은 여러 가지가 있지만 이 방법이 아마 가장 손쉬운 방법일 거라 생각합니다. 필요한 준비물은 다음과 같습니다. 1. 아나콘다가 설치된 주피터 노트북 환경 2. 다운로드하고자 하는 이미지 url 이미지 크롤링 코드 패턴 아래 코드를 실행시키면 현재 스크립트가 있는 위치와 동일한 폴더에 이미지가 저장되는 것을 확인할 수 있습니다. import urllib.request url = 이미지 url urllib.request.urlretrieve(url, '파일 이름') 예를 들어 아마존에서 상품 이미지를 다운로드하고 싶다면, 이미지 url을 알면 컴퓨터에 저장할 수 있습니다. 크.. 더보기