WordPress网站建设宣传图片

网站被黑,被搜索引擎收录垃圾信息删除处理教程

释放双眼,带上耳机,听听看~!

现在有非常多的站点被黑导致网站被搜索引擎收录了许多的色情、赌博信息,导致网站被降权,或者搜索品牌词的时候出现的站点信息变成了垃圾信息等情况,尽管有的企业不依赖SEO转化,但是品牌词有搜索量的公司遇见这种情况也是比较重要的问题。

注意:这篇文章是教你怎么处理/删除:被搜索引擎收录垃圾信息,而不是教你处理网站被黑(至于网站被黑这问题怎么处理,则太宽泛了,问题原因数不胜数,不是一篇文章说的清楚的)。

处理流程

下面我先说下处理流程步骤,然后根据流程对应一个个给出详细建议、解决:

  1. 确认站点存在的问题,及时修复,木马、导致被黑的原因处理干净。
  2. 被黑链接通常存在特定的URL特征,将被黑链接设置为404页面以及状态码
  3. 提取被黑链接制作死链文件
  4. 提交死链到百度搜索资源平台
  5. 关注死链抓取状态
  6. 等待收录信息更新

详细步骤

1、2、步骤处理建议

前面也提到了,关于第1、第2步骤的处理,是无法在一篇文章的说明清楚的,不同的站点使用不同的程序、不同的版本、服务器环境等,因素又很多,没有通用案例的情况下,只能靠技术人员处理,如果你不了解技术方面情况,请你联系公司的技术人员、或者建站公司进行处理。

不过:将被黑链接设置为404页面以及状态码这个是重点,如果仅仅只是返回404页面,而HTTP状态码还是200或者其他的,是不行的哦!

通常的建议如下几点,就是来降低站点被黑的概率:

  • 不要使用盗版主题、插件
  • 及时更新程序版本
  • 及时更新服务器环境软件

后期有时间的话我会考虑把一些处理过的且比较常见的案例发布成文章方便大家,如果你的站点只是搜索页面被利用,则可以看我之前发的文章进行参考处理:网站搜索页面出现大量垃圾网页被收录怎么处理

3、自动提取已收录被黑链接并制作死链文件

当完成第2步骤处理:已经将被黑链接设置为404页面以及状态码,则可以开始提取已收录的被黑链接,先准备一个txt文件,名称就设置为silian.txt吧,用于记录保存处理后的404链接。

然后通过在搜索引擎使用site语法获取当前域名的收录链接。

例如:

site:linfengnet.com
百度搜索site语法使用示例

如果问题发现及时,只有及其少量的几个,那么人工点击对应的结果然后复制到准备的txt保存即可,但是通常出现这样的问题,往往是已经有很多被收录的垃圾信息了,人工处理是非常耗时间的,通常是通过爬虫或者自动化程序进行抓取,这里我写的软件,就派上用场了,具体请你查看:百度已收录404链接自动提取软件+使用教程-免费

考虑篇幅长度,这篇文章只做处理流程相关内容好些。

当我们提取完成后,就把这个保存着404链接的txt上传到你网站的根目录或者是运行目录。

然后就可以把这些要删除的收录链接提交到百度资源平台了。

4、5、提交死链到百度搜索资源平台

站点绑定资源平台

如果已绑定的则忽略,这部分内容主要是引导小白用户。

百度资源平台地址:https://ziyuan.baidu.com/

如果你没有百度账号,就直接点右上角的登陆,然后在登陆界面点注册按照流程注册,这种很基础的网上冲浪操作就不详细说了。

登陆后点击用户中心>站点管理>添加网站>安装出现的提示添加你自己的网站。

网站被黑,被搜索引擎收录垃圾信息删除处理教程 1

提交死链

你需要确保你的死链文件(你的域名/silian.txt)是可访问状态,然后提交。

在百度站长资源平台,选择你绑定并需要处理的对应站点,资源提交》死链提交》设置一下更新周期》把你死链文件路径写入,然后提交就好了。

更新周期我一般是写1天更新一次,没啥情况你照这样写就可以了。

百度站长资源平台死链提交页面

提交后过几天看下抓取情况,有时候会很快抓取,有时候很慢。自己确认这个路径可以访问即可。

成功提交后,你可以死链提交页面下方看到死链文件的状态:

百度站长资源平台死链提交文件状态

这里再说一个站长我之前处理的经验,就是有时候我点击手动更新,百度好像很久都不会去抓取,还不如重新提交快抓取…不知道是bug还是我的错觉。印象中我处理的蛮多个站点都会这样。所以有时候自己的同一个死链文件更新的时候,想要快点抓取,就先删除之前提交的,在提交新的。

6、等待收录信息更新

当你确认死链文件已经被抓取后,则可以开始等待百度对你站点收录信息的更新,这个时间取决于不同的站点情况,没有一个固定。只要确保上述流程都正确,没啥特别情况耐心点即可。

一般情况下如果站点降权之类的处理完成后都会恢复。

不过要注意的,到这里还没完,因为site语法出现的收录信息是不完整的,一段时间后可能又会放出其他的之前收录的垃圾信息链接,这里就建议你配合我之前分享的:WordPress/PHP网站实现死链(404链接)自动收集提交处理一起处理。

自己定期的去资源平台看下死链文件抓取状态(时间和是否正常),如果404链接有更新,而蜘蛛长时间没有来抓取,就自己删除重新提交下即可。

注意:

有的小伙伴可能在想,我配置好404链接再按照WordPress/PHP网站实现死链(404链接)自动收集提交处理方法配置完会简单省事,这样可以吗?

我给出的建议:是通常情况下,受到抓取频率的影响,只使用自动收集方式,不一定能够处理把收录的垃圾信息处理完或者需要很长的周期的…

所以还是建议按当前的文章的流程处理后配置WordPress/PHP网站实现死链(404链接)自动收集提交处理提到的方法一起处理。

相关内容

WordPress/PHP网站实现死链(404链接)自动收集提交处理

网站搜索页面出现大量垃圾网页被收录怎么处理

网站被黑应该怎么做 — 网站被黑操作指南网站被黑应该怎么做 — 网站被黑操作指南搜索学堂_百度搜索资源平台

死链工具操作参考 百度搜索资源平台

百度spider对常用的http返回码的处理逻辑:

1、404

404返回码的含义是“not FOUND”,百度会认为网页已经失效,那么通常会从搜索结果中删除,并且短期内spider再次发现这条url也不会抓取。

2、503

503返回码的含义是“service Unavailable”,百度会认为该网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503,百度spider不会把这 条url直接删除,短期内会再访问。届时如果网页已恢复,则正常抓取;如果继续返回503,短期内还会反复访问几次。但是如果网页长期返回503,那么这 个url仍会被百度认为是失效链接,从搜索结果中删除。

3、403

403返回码的含义是“forbidden”,百度会认为网页当前禁止访问。对于这种情况,如果是新发现的url,百度spider暂不会抓取,短期内会 再次检查;如果是百度已收录url,当前也不会直接删除,短期内同样会再访问。届时如果网页允许访问,则正常抓取;如果仍不允许访问,短期内还会反复访问 几次。但是如果网页长期返回403,百度也会认为是失效链接,从搜索结果中删除。

4、301

301返回码的含义是“moved Permanently”,百度会认为网页当前跳转至新url。当遇到站点迁移,域名更换、站点改版的情况时,推荐使用301返回码,尽量减少改版带来的 流量损失。虽然百度spider现在对301跳转的响应周期较长,但我们还是推荐大家这么做。

结尾

文章到这里,关于网站被黑,被搜索引擎收录垃圾信息删除处理教程就分享完成了,如果你需要付费的技术支持,欢迎联系我。

最后再吐槽下太多网站使用非常老旧版本的程序甚至是盗版的程序,导致这种情况很泛滥…尤其这样的问题出现在一些”专业”的建站公司上,见过不少一下子服务器几百个网站中招的…emmm…

注意要把自己网站安全问题处理好哦。

给TA打赏
共{{data.count}}人
人已打赏
SEO基础SEO技巧WordPress与SEOWordPress技巧

WordPress/PHP网站实现死链(404链接)自动收集提交处理

2023-12-26 18:51:06

Python RequestsPython异常处理Python爬虫Python笔记

Python requests 异常Max retries exceeded with url: 请求地址… (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)')))"))}解决

2024-1-6 14:34:35

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索
展开目录