Toggle menu
Toggle personal menu
Not logged in
Your IP address will be publicly visible if you make any edits.

권영기/web crawler: Difference between revisions

From ZeroWiki
imported>trailblaze
No edit summary
imported>trailblaze
No edit summary
Line 4: Line 4:


Python을 이용해서 Web Crawler를 제작하면서 Python의 사용법을 익히고, 원하는 웹 페이지를 긁기 위한 Web Crawler를 제작한다. (네이버웹툰(돌아온 럭키짱, 신의 탑...), 네이버 캐스트, 그 외의 각종 웹페이지..)
Python을 이용해서 Web Crawler를 제작하면서 Python의 사용법을 익히고, 원하는 웹 페이지를 긁기 위한 Web Crawler를 제작한다. (네이버웹툰(돌아온 럭키짱, 신의 탑...), 네이버 캐스트, 그 외의 각종 웹페이지..)


= 필요기술 =
= 필요기술 =
Line 14: Line 15:
   HTML, CSS, JavaScript - 웹 페이지 분석
   HTML, CSS, JavaScript - 웹 페이지 분석
   Python
   Python


= 진행 과정 =
= 진행 과정 =


== 필요한 문서 ==
== 필요한 문서 ==


* http://docs.python.org/
* http://docs.python.org/
== 시작 ==
== 시작 ==


Line 26: Line 31:


=== 소스에서 URL만 추출하기 ===
=== 소스에서 URL만 추출하기 ===


=== 파일 다운로드하기 ===
=== 파일 다운로드하기 ===



Revision as of 23:49, 14 July 2012

목적

Python을 이용해서 Web Crawler를 제작하면서 Python의 사용법을 익히고, 원하는 웹 페이지를 긁기 위한 Web Crawler를 제작한다. (네이버웹툰(돌아온 럭키짱, 신의 탑...), 네이버 캐스트, 그 외의 각종 웹페이지..)


필요기술

  • HTML
  • CSS
  • JavaScript
  • Python
  HTML, CSS, JavaScript - 웹 페이지 분석
  Python


진행 과정

필요한 문서


시작

웹 페이지 소스 긁어오기

소스에서 URL만 추출하기

파일 다운로드하기