删除百度搜索引擎收录的死链与无效快照

百度站长死链提交工具介绍

  • 死链提交工具生效时间为 3 天
  • 死链提交有两种方式:文件提交、规则提交
  • 死链提交工具仅识别 404 数据,请提交 404 数据;如误使用本工具,且站点内容不为死链,则提交不会生效
  • 死链提交工具是网站向百度提交死链的数据推送工具,被推送死链将被百度搜索屏蔽。网站存在大量死链,将影响网站的站点评级

百度站长平台提交死链

注册百度站长平台帐号,然后登录进去找到” 数据引入” -> “死链提交”。
baidu-zhanzhang-1

文件提交方式

第一步,制作死链文件

处理网站已存在的死链,并将这些死链页面设置成为 404 页面,即百度访问它们时返回 404 代码。将需要提交的死链列表制作成一个死链文件,制作方法与 sitemap 格式及制作方法一致。死链文件的格式为 txt 或者 xml,每个地址文件最多包含 50000 个网址且需小于 10MB,推荐使用 xml 格式。死链 xml 文件示例内容如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.techgrow.online/posts/cd6beb9c/index.html</loc>
<lastmod>2019-02-26</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.techgrow.online/posts/67ba58dd/index.html</loc>
<lastmod>2019-02-26</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>

第二步,将死链文件放置在网站根目录下

比如您的网站为 example.com,您已制作了一个 silian_example.xml 死链文件,则将 silian_example.xml 上传至网站根目录即 example.com/silian_example.xml

第三步,提交死链文件

  • 找到” 数据引入” -> “死链提交” -> “文件提交”
  • 提交死链文件时,每次最多可提交 20 条死链文件地址
  • 提交死链文件,填写死链文件地址(如: www.example.com/silian_example.xml ),选择更新时间,然后提交
    baidu-zhanzhang-2

第四步,管理已提交的死链文件

提交完之后,可在数据反馈里看到已提交的死链文件,如果死链文件里面有新的死链,可以选择文件后,点击手动更新文件,即对更新的死链链接进行了提交。
baidu-zhanzhang-3

规则提交方式

第一步

找到” 数据引入” -> “死链提交” -> “规则提交”

第二步,提交死链规则

填写死链规则,死链规则需要以 / 或?结尾。/ 结尾表示删除一个目录,例如:http://www.example.com/silian/ 包含 silian 目录下的所有链接。? 结尾表示 CGI 形式的通配链接,例如:http://www.example.com/silian? 包含长相为 silian?* 的所有链接。相同的死链规则一个月内只能提交一次。
baidu-zhanzhang-4

第三步,管理已提交的死链规则

死链规则提交完之后,同样可在数据反馈里看到已提交的死链规则,如果死链规则里面有新的死链,可以选择规则后,点击手动更新死链,即对更新的死链链接进行了提交。

删除百度搜索的快照

第一步,获取百度快照链接

baidu-delete-cache-0

第二步,提交需要删除的百度快照 / 索引链接

打开百度服务中心的意见反馈页面,找到 “快照删除与更新”,然后填写百度快照 / 索引链接,最后点击 “提交” 按钮进行提交。
baidu-delete-cache-1

第三步,查看快照删除的处理进度

找到百度服务中心页面的 “我的反馈”,点击进去可以在页面上看到快照删除与更新的处理进度。百度处理快照删除与更新的速度较慢,提交后一般需要 24 小时左右请求才会被处理。
baidu-delete-cache-2

死链 XML 文件格式详细说明

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<?xml version="1.0" encoding="utf-8"?>
<!-- urlset,urlset 用来标记整个文档的开头,最少出现 1 次 最多出现 1 次 -->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<!-- url,url 标记每条信息的开始和结束,最少出现 0 次 最多出现 50000 次 -->
<url>
<!-- loc,该条数据的存放地址,最少出现 1 次 最多出现 1 次,类型为 URL 地址,最小长度 1 个字符 最大长度 256 个字符 必须符合正则表达式(http://)(.+) -->
<loc>http://www.techgrow.online/posts/cd6beb9c/</loc>
<!-- lastmod,指该条数据的最新一次更新时间,最少出现 0 次 最多出现 1 次,类型为日期或日期时间,格式为 YYYY-MM-DD 的日期或者
格式为 YYYY-MM-DDThh:mm:ss 的日期时间(请注意日期与时间之间以“T”分隔) -->
<lastmod>2019-02-26</lastmod>
<!-- changefreq,指该条数据的更新频率,最少出现 0 次 最多出现 1 次,类型为字符串,有效值为:always、hourly、daily、weekly、monthly、yearly、never -->
<changefreq>daily</changefreq>
<!-- priority,用来指定此链接相对于其他链接的优先权比值,此值定于 0.0-1.0 之间,最少出现 0 次 最多出现 1 次,类型为小数,最小值为(包含)0.0 最大值为(包含)1.0 -->
<priority>1.0</priority>
</url>
</urlset>