首页 > 代码库 > [应用]来点实际,利用CB刷简历更新时间程序(python)

[应用]来点实际,利用CB刷简历更新时间程序(python)

实际上就是一个python的curl应用。应tom的要求,现在公布给大家。希望能对大家有用。

http://onefishum.blog.163.com/bl ... 052013324114213898/ 

目前高端的工作是越来越难找了。本人做了51、zhaopin、猎聘网的刷简历程序,都和此类似,但目前这几个号称最大的招聘网站,根据我一段时间的跟踪分析,发现从去年开始,人员需求基本为0,大部招聘都是假的。所以开发才想做一个刷新简历更新时间程序,以便加大自身机会(工作不换工资不涨,为了活呀,只能发挥技术优势了)。如果大家有好的机会,也可以帮我推荐一下喔。(96年开始c/c++,98年开始linux,99年开始php。游戏、网站、应用、设计通吃)      这个是我研究curl时写的一个python的脚本习做。最开始是用的shell脚本。为了提高一点点效率,现在改成了python的。这个希望对大家起一个抛砖引玉的作用。猎聘相对比较容易,适合大家练练手。其它网站除了zhaopin的图形验证码比较麻烦外。应该都是比较容易的。


#!/usr/bin/python#-*- coding:utf-8 -*-
import os
import sys
import pycurl
import hashlib
import urllib
import StringIO
import string

reload(sys)    
sys.setdefaultencoding(‘utf8‘)

_DEBUG=False
def posturl(url,postdata):
        global _DEBUG 
        curl = pycurl.Curl()
        html=StringIO.StringIO()
        # curl -b cookie写入
        curl.setopt(pycurl.COOKIEFILE, ‘cookie‘)
        # curl -c cookie读入
        curl.setopt(pycurl.COOKIEJAR, ‘cookie‘)
        # curl -d 使用post模式
        curl.setopt(pycurl.POST,True)
        curl.setopt(pycurl.POSTFIELDS, postdata)
        #curl.setopt(pycurl.POSTFIELDS, urllib.urlencode(postdata))
        # 设置url
        curl.setopt(pycurl.URL,url)
        # ssl认证
        #curl.setopt(pycurl.SSL_VERIFYHOST, False)
        #curl.setopt(pycurl.SSL_VERIFYPEER,False)
        # 设置agent
        #curl.setopt(pycurl.USERAGENT,r"User-Agent: Dalvik/1.4.0 (Linux; U; Android 2.3.7; Milestone Build/SHOLS_U2_05.26.3)")
        curl.setopt(pycurl.WRITEFUNCTION, html.write)
        curl.setopt(pycurl.FOLLOWLOCATION, 1)

        if _DEBUG :
                # 连接服务器信息
                curl.setopt(pycurl.VERBOSE, True)
                htmlcode=str(curl.getinfo(pycurl.HTTP_CODE))
                print r‘返回码:‘+ htmlcode
                print ‘URL:‘,curl.getinfo(pycurl.EFFECTIVE_URL)
        curl.perform()
        return html.getvalue().encode(‘utf8‘)
#def posturl(url,postdata):

if __name__ == "__main__":
        username=‘你的用户名‘
        passwd=‘你的密码‘
        login=posturl(r‘http://www.lietou.com/user/ajaxlogin/?isMd5=1‘,‘user_login=‘+username+‘&user_pwd=‘+str(hashlib.md5(passwd).hexdigest()))
        print login

        login=posturl(r‘http://c.lietou.com/resume/refreshresume/‘,‘res_id=123456‘)
        print login
        
注:
     res_id应该是你的简历id,这块我偷懒了。没有用程序自己去抓和分析。大家可以用foxfire的firebug或httpfox抓一下。对于每个人来讲这个值是死的。真没有必要耗cpu。


原文作者:user88

原文链接:http://forum.cubietech.com/forum.php?mod=viewthread&tid=346&extra=page%3D1