爬取公司网络流量去年到今年的数据，对数据进行统计处理

首页 > 代码库 > 爬取公司网络流量去年到今年的数据，对数据进行统计处理

爬取公司网络流量去年到今年的数据，对数据进行统计处理

2024-08-16 03:04:09 221人阅读

每天的数据差不多是这样的：

技术分享

抓取网页数据，进行保存：

import urllib
import time
import calendar
year_list=[2016]
month_list=[1,2,3,4,5,6,7,8,9,10,11,12]
for year in year_list:
    if year==2015:
        for month in month_list[6:]: 
            
            
            days=range(calendar.monthrange(year, month)[1]+1)[1:]
            for day in days:
                
                date1=str(year)+"-"+str(month)+"-"+str(day)
                date2=time.strptime(date1, "%Y-%m-%d")
                datestring=time.strftime("%Y-%m-%d",date2)
                url="https://myview.chinanetcenter.com/api/bandwidth-channel.action?u=howbuy&p=Howbuy123&date="+datestring
                filename = urllib.urlretrieve(url,filename="E:\\xml\\2015\\"+datestring+".xml") #modify path
                time.sleep(5)

    else:
        
            
        days=days=range(calendar.monthrange(year, 6)[1]+1)[7:]
        for day in days:
                
            date1=str(year)+"-"+str(6)+"-"+str(day)
            date2=time.strptime(date1, "%Y-%m-%d")
            datestring=time.strftime("%Y-%m-%d",date2)
            url="https://myview.chinanetcenter.com/api/bandwidth-channel.action?u=howbuy&p=Howbuy123&date="+datestring
            filename = urllib.urlretrieve(url,filename="E:\\xml\\2016\\"+datestring+".xml") #modify path
            time.sleep(5)

处理每天数据的平均值，最大值，最小值一直大于130的值统计处理，并且生成xls表格

import xml.dom.minidom
import urllib
import time
import calendar
import os
import xlrd
import xlwt
from xlwt import *
value_list=[]
datalist=[]
data=http://www.mamicode.com/()"E:\\zh\\"):#modify path
    print filenames
    print path
    print dir
    for filename in filenames:
        
        dom = xml.dom.minidom.parse("E:\\zh\\"+filename) #modify path
        root = dom.documentElement
        bands = root.getElementsByTagName(‘bandwidth‘)
    
        for i in range(bands.length):
        
            bandschild=bands[i]
            bandschildvalue=http://www.mamicode.com/float(bandschild.firstChild.data)".xml"),vmax,average)
        datalist.append(data)
        value_list=[]
        data=http://www.mamicode.com/()>import xml.dom.minidom
import urllib
import time
import calendar
import os
import xlrd
import xlwt
from xlwt import *
value_list=[]
datalist=[]
data=http://www.mamicode.com/()"E:\\zh\\2016\\"):#modify path
    
    for filename in filenames:
        
        dom = xml.dom.minidom.parse("E:\\zh\\2016\\"+filename) #modify path
        root = dom.documentElement
        bands = root.getElementsByTagName(‘bandwidth‘)
    
        for i in range(bands.length):
        
            bandschild=bands[i]
            bandschildvalue=http://www.mamicode.com/float(bandschild.firstChild.data)".xml"),ii)
            datalist.append(data)
            data=http://www.mamicode.com/()>

本文出自 “12109115” 博客，请务必保留此出处http://12119115.blog.51cto.com/12109115/1859896
爬取公司网络流量去年到今年的数据，对数据进行统计处理

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 爬取公司网络流量去年到今年的数据，对数据进行统计处理

爬取公司网络流量去年到今年的数据，对数据进行统计处理

看完仍有疑问？有类似问题直接问程序猿