用shell分析nginx日志百度网页蜘蛛列表页来访情况

首页 > 代码库 > 用shell分析nginx日志百度网页蜘蛛列表页来访情况

用shell分析nginx日志百度网页蜘蛛列表页来访情况

2024-08-08 10:40:17 218人阅读

#!/bin/bash
#desc: this scripts for baidunews-spider
#date:2014.02.25
#testd in CentOS 5.9 x86_64
#saved in /usr/local/bin/baidu-web.sh
#written by coralzd@gmail.com www.zjyxh.com
dt=`date -d "yesterday" +%m%d`
if [ $1x != x ] ;then
  if [ -e $1 ] ;then
     grep -i "Baiduspider/2.0" $1 > baiduspider-${dt}.txt
     num=`cat baiduspider-${dt}.txt|wc -l`
     echo "baiduspider number is ${num},file is baidu-${dt}.txt"
     cat baiduspider-${dt}.txt|awk ‘{print $7}‘|sort |uniq -c|sort -r >`ls ${1}|cut -c 1-10`-${dt}.txt
     echo "$1 was done"
    else
       echo "$1 not exsist!"
  fi
else
     echo "usage: $0 file_path"
fi

本次用shell分析百度网页蜘蛛跟百度新闻蜘蛛一个方法，无非就是把关键词由baiduspider-news换为baiduspider/2.0。

本文出自 “崔晓辉的博客” 博客，请务必保留此出处http://coralzd.blog.51cto.com/90341/1590956

用shell分析nginx日志百度网页蜘蛛列表页来访情况

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 用shell分析nginx日志百度网页蜘蛛列表页来访情况

用shell分析nginx日志百度网页蜘蛛列表页来访情况

看完仍有疑问？有类似问题直接问程序猿