搜索
查看: 669|回复: 0

[技术杂烩] linux下查看百度蜘蛛爬行次数命令大全

[复制链接]

8183

主题

8226

帖子

8910

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
8910
发表于 2019-10-12 17:10:01 | 显示全部楼层 |阅读模式
Linux shell指令
1. 百度蜘蛛来光顾的次数
  1. cat access.log | grep Baiduspider | wc
复制代码
最左面的数值显现的就是光顾次数。
2. 百度蜘蛛的具体记载(Ctrl C可以终止)
  1. cat access.log | grep Baiduspider
复制代码
也可以用下面的指令:
  1. <p>cat access.log | grep Baiduspider | tail -n 10</p><p>cat access.log | grep Baiduspider | head -n 10</p>
复制代码
只看最终10条或最前10条,这用就能知道这个日志文件的开端记载的时间和日期。
3. 百度蜘蛛抓取主页的具体记载
  1. cat access.log | grep Baiduspider | grep “GET / HTTP”
复制代码
百度蜘蛛好像对主页非常酷爱每个钟头都来光顾,而谷歌和雅虎蜘蛛更喜爱内页。
4. 百度蜘蛛派性记载时间点散布
  1. cat access.log | grep “Baiduspider ” | awk ‘{print $4}’
复制代码
5. 百度蜘蛛光顾页面按次数降序列表
  1. cat access.log | grep “Baiduspider ” | awk ‘{print $7}’ | sort | uniq -c | sort -r
复制代码
文中的Baiduspider 改成Googlebot都可以检查谷歌的数据,鉴于大陆的特殊性,我们应该对百度的log更为关注。

GM起点所有资源均免费下载,回复帖子即出现下载地址!站长QQ:969806969
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站长QQ969806969|润芒论坛|GM部落|GM016论坛|jjj555论坛|鲁ICP备16008334号-17|GM起点

GMT+8, 2024-4-26 21:27 , Processed in 1.640625 second(s), 19 queries .

Powered by Discuz! X3.4

© 2008-2020 www.gmqd.com

快速回复 返回顶部 返回列表