当前位置:首页 > 建站技术 > 正文内容

如何封禁AhrefsBot,SemrushBot,MJ12bot等垃圾蜘蛛爬虫

二向箔2022-08-07 09:11:43建站技术1164

AhrefsBot,SemrushBot,MJ12bot等蜘蛛都是国外做网站第三方分析的平台(类似于国内的站长工具),分析的数据(网站内链,外链,历史,权重等)提供给做谷歌SEO的人员使用,按说不屏蔽也没什么关系。

但是如果他爬取频率太高,影响了网站正常的访问,或者给网站服务器造成很大的压力,那么我们可以选择直接屏蔽掉这些蜘蛛

1,采用robots.txt 文件来屏蔽

User-agent: AhrefsBot
Disallow: /
User-agent: DotBot
Disallow: /
User-agent: SemrushBot
Disallow: /
User-agent: Uptimebot
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: YandexBot
Disallow: /

如果还有其他蜘蛛再往下面添加即可,但是robots.txt 文件只是约定俗成的文件,也有很多蜘蛛不会遵守规则,如果你的网站是linux  Nginx服务器,那么可以采用下面这种方式。


2,如果是Nginx服务器,可以在网站的配置文件里面加上这段代码

if ($http_user_agent ~* (SemrushBot|MJ12bot|AhrefsBot|DotBot|YandexBot)) {
return 403;
}

这样蜘蛛再来的时候抓取不到数据,就不会再来了。百度,搜狗,神马,头条等国内搜索引擎的蜘蛛不受影响


3,直接封禁爬虫的IP地址,这种方式简单粗暴,立竿见影。


例如:官方公布的AhrefsBot爬虫IP段如下:


54.36.148.0/24

54.36.149.0/24

54.36.150.0/24


195.154.122.0/24

195.154.123.0/24

195.154.126.0/24

195.154.127.0/24


如果你使用的是阿里云服务器,找到阿里云服务器安全组,配置入网方向IP地址禁入

ban-AhrefsBot-ip.png


扫描二维码推送至手机访问。

版权声明:本站内容为原创和部分整理自网络,如有侵权务必联系我们删除,保障您的权益,本站所有软件资料仅供学习研究使用,不可进行商业用途和违法活动,本站不承担任何法律责任。

本文链接:http://www.erxbo.com/post/35.html

标签: 蜘蛛屏蔽
分享给朋友:

“如何封禁AhrefsBot,SemrushBot,MJ12bot等垃圾蜘蛛爬虫” 的相关文章

flex 布局时,如何固定一栏宽度?

用width可以。也可以用以下方法:flex: 0 0 200px;每个参数的意思:1 | 0 -- 不拉长(flex-grow) 2 | 0 -- 不缩短(flex-shrink) 3...

ERROR:cannot verify www.sqlite.org's certificate, issued by ‘/C=US/O=Let's Encrypt/CN=R3’: Issued

wget命令下载不安全的https 域名下的内容时会提示cannot verify www.sqlite.org's certificate, issued by ‘/C=US/O=Let's Encrypt/CN...

宝塔面板手动升级从5.9平滑升级到6.x以上版本

兼容的操作系统:Centos7.x升级方式:使用命令升级注意:    1、Centos6请勿执行此升级命令    2、升级过程耗时较长且可能会受网络因素影响导致升级失败    3、如果升级后无法正常启动面板,请重新执行升级命令 ...

帝国cms网站迁移“访问端目录不存在”

帝国cms网站迁移“访问端目录不存在”

帝国网站迁移后,在配置移动端网址和目录的时候,有时候会出现访问端目录不存在的情况,先检查一下路径对不对,然后在设置一下宝塔面板就可以了。1,把宝塔面板防跨站攻击去掉2,把网站文件权限都改成755或者7773,复制移动端根目录路径,填到多端访问配置中,提交修改...

帝国cms中tagsinfo标签和showtags标签的区别?

帝国cms中tagsinfo标签和showtags标签的区别?

一个调用tags相关新闻,另一个是调用tags本身...

帝国cms后台登录地址修改(帝国cms后台地址可以修改吗)

很多小伙伴使用帝国cms的过程中,为了安全起见,想要修改后台登录地址,这是完全可以的帝国cms默认后台登录地址:xxx.com/e/admin可以修改成任意地址,例如:xxx.com/e/erxbo   只需要把admin目录重新命名就好了不过需要注意的是,修改后台目录之后,在生...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。