首页 > 代码库 > python爬虫,爬豆瓣top250电影

python爬虫,爬豆瓣top250电影

python爬虫,爬豆瓣top250电影


import string
import re
import urllib2

class DouBanSpider(object) :
    def __init__(self) :
        self.page = 1
        self.cur_url = "http://movie.douban.com/top250?start={page}&filter=&type="
        self.datas = []
        self._top_num = 1
    def get_page(self, cur_page) :
        url = self.cur_url.format(page = (cur_page - 1) * 25)
        my_page = urllib2.urlopen(url).read().decode("utf-8")
        return my_page
    def find_title(self, my_page) :
        temp_data = http://www.mamicode.com/[]>

python爬虫,爬豆瓣top250电影