본문 바로가기

카테고리 없음

파이썬 이미지 크롤링: 코드 세줄로 이미지 다운로드 받기

오늘은 딱 세줄의 코드로 웹 사이트에서 이미지를 다운로드하는 방법을 알아보겠습니다. 이미지 url을 이용해서 내 컴퓨터에 저장하는 방법은 여러 가지가 있지만 이 방법이 아마 가장 손쉬운 방법일 거라 생각합니다.

 

필요한 준비물은 다음과 같습니다.

1. 아나콘다가 설치된 주피터 노트북 환경

2. 다운로드하고자 하는 이미지 url

 

이미지 크롤링 코드 패턴

아래 코드를 실행시키면 현재 스크립트가 있는 위치와 동일한 폴더에 이미지가 저장되는 것을 확인할 수 있습니다.

 

import urllib.request
url = 이미지 url
urllib.request.urlretrieve(url, '파일 이름')

 

예를 들어 아마존에서 상품 이미지를 다운로드하고 싶다면, 이미지 url을 알면 컴퓨터에 저장할 수 있습니다.

 

크롬 브라우저에서 F12를 누르면 내가 원하는 사진의 url을 찾아낼 수 있습니다.

 

 

 

코드 실습

위 상품 이미지 url을 이용해서 코드를 실행시켰습니다. 코드가 실행되고 폴더에 사진이 저장되었습니다.

 

import urllib.request
url = 'https://images-na.ssl-images-amazon.com/images/I/810wq1cOY7L._AC_SX679_.jpg'
urllib.request.urlretrieve(url, 'test.jpg')

 

 

여러 개의 이미지 url을 알고 있다면 위의 코드를 반복문을 돌리면 수십 장의 이미지도 바로 저장할 수 있습니다. 물론 이미지 url을 어떻게 효율적으로 알아내느냐는 다른 문제입니다. 

 

이런 식으로 한방에 샤샤삭 할 수도 있습니다. 하나하나 힘들게 저장하셨다면 이런 방법도 있으니까 생각해보시면 좋을 것 같습니다.

 

 

 

- 이 글은 아나콘다(Anaconda3)가 설치된  주피터 노트북에서 작성되었습니다.