首页 > 代码库 > python 抓取网上OJ试题
python 抓取网上OJ试题
学校工作需要,需架设一台内网OJ服务器,采用了开源的hustoj.试题下载了hustoj的freeprblem的xml文件。导入时出现很多错误,不知什么原因。另外要将历年noip复赛试题加上去,但苦于历年noip的xml文件只有3、4个。cogs上有几乎全部的历年noip于是想到了用python+pyquery抓取后转化成xml。至于不选beautifulsoup而选pyquery是感觉pq语法接近jquery,使用起来比较方便,而且速度可能更快!
ver0.9已经完成,但是由于cogs的格式没有统一,自己经验不足,发现有很多错误,有待进一步改进!
ver1.0打算主要改正这些错误,尽量使得试题抓取无误。以后可以考虑数据抓取,导入问题
python 抓取网上OJ试题
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。