본문으로 바로가기

[PHP] SHOEZOO 사이트 스크래핑

category 프로그램/PHP 2016/02/22 09:21
[PHP] SHOEZOO 사이트 스크래핑

사용자 삽입 이미지

해당 사이트의 정보를 스크래핑 하여서 가공을 하는 작업입니다.
보시는것처럼 다양한 메뉴가 존재 하지만 원하는 정보를 가져오기 위해서는 각 링크의 속성이나 HTML 태그를 분석해야 합니다.

사용자 삽입 이미지

이번에는 간단하게 할 수 없는것이 브랜드와 사이즈도 있고 사용자가 선택할수 있는 정보가 많습니다.
일단은 목록페이지에서는 각 제품의 링크를 획득한 후에 다시 한번더 제품 상세 페이지에 들어가서 정보를 정확하게 수집을 해야 합니다.

사용자 삽입 이미지

제품 상세페이지를 보시면은 이미지도 5장정도 되고, 사이트를 선택할 수도 있어서 해당 옵션을 모두 가져와서 그에 맞게 각 데이터를 가공해야 합니다.
이 작업이 보기보다 상당히 시간이 소요 되며, 해당 작업을 위해서는 DB를 이용하여서 중복이나 동일이름이지만은 브랜드나 옵션이 다른것을 구분해서 작업을 해야 합니다.


스크래핑을 원하시는분은 공지사항을 참조해주시기 바랍니다.
크리에이티브 커먼즈 라이센스
Creative Commons License

트랙백

http://trudy.kr/trackback/78

댓글을 달아 주세요

Trudy
Trudy 님의 블로그
MENU
VISITOR 오늘122 / 전체614993