如何批量檢測被百度收錄的死鏈? 二維碼
109
前段時間服務(wù)器被入侵,掛了很多博彩之類的黑頁,而且全部被百度收錄。 現(xiàn)在把漏洞補好了,但刪除黑頁文件以后成了死鏈,要怎么讓百度刪除收錄呢? 在網(wǎng)上找了一下,似乎只有檢測網(wǎng)址是否被收錄的工具,而沒有檢測收錄的是不是死鏈的工具。 自己理清了下思路,找辦法找出了所有被收錄的死鏈,并寫下這篇文章。 不知道有沒有更好的方法,大家可以告訴我,先分享給大家,如果有大神請忽視或者告訴我更好的方法,一起學(xué)習(xí)交流吧。 下面教程開始 先在百度找到xenu可以模擬爬蟲爬取所有連接,我下載了個漢化版。 我們先用這個工具查詢所有被收錄的頁面。 打開軟件,填入簡版百度site網(wǎng)站地址,之所以用簡版是可以減少鏈接查詢時間和內(nèi)容。(請把xxx.bizcn.com換成你的網(wǎng)址) http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Axxx.bizcn.com 等待檢測完成。 點擊導(dǎo)出為制表符分隔的文件。 導(dǎo)出的文件,我們可以看到格式是:網(wǎng)址+空格+狀態(tài)碼 那么寫一個正則,把需要的網(wǎng)址提取出來就行,比如www.baidu.com下的404頁面就是 /http:\/\/www.baidu.com(.*?)\s404/i(以http://www.baidu.com開頭,\s代表空格,404,/i代表匹配大小寫)不會正則怎么辦? 為了方便大家,我把文件作了修改,大家只要把head改成標(biāo)致性開頭,state改成狀態(tài)碼就行,file改成導(dǎo)出的文件路徑就行。 head怎么改,舉個例子, 你的網(wǎng)站是http://www.baidu.com/abc.html,那么你就寫http://www.baidu.com/ 你的網(wǎng)站是http://abc.baidu.com/abc.html,那么你就寫http://abc.baidu.com/ 把正則寫入php,在php環(huán)境下運行g(shù)et.php。那么結(jié)果就出來了。 這時你只需要全選,復(fù)制到一個txt文件,上傳到網(wǎng)站空間,再到百度站長平臺死鏈提交填入文件路徑就行就可以。 我們知道,思路是通過爬取找出所有被收錄的鏈接,然后按條件列出來而已。 這樣的話,只要把開頭輸入的site網(wǎng)址改一下,也可以查詢其他搜索引擎的收錄。 把正則改一下,可以獲得如標(biāo)題等其他內(nèi)容。在此就不一一敘述。 以信載商,良心建站。遨游始終秉承“一次建站、終身維護”的宗旨,竭誠為客戶提供最優(yōu)質(zhì)的互聯(lián)網(wǎng)服務(wù)。遨游建站率先植入seo優(yōu)化理念,讓你的網(wǎng)頁更利于搜索引擎抓取,關(guān)鍵詞排名更靠前。可仿站、可定制。無論是傳統(tǒng)型企業(yè)官網(wǎng)、集團型品牌官網(wǎng),還是營銷型網(wǎng)站、電商型網(wǎng)站、定制型網(wǎng)站、特殊行業(yè)網(wǎng)站(醫(yī)療、教育),全部搞定。 公司:網(wǎng)站建設(shè)_小程序設(shè)計_競價托管代運營公司;郵箱:1013601535@qq.com 手機:17073547034;QQ: 1013601535 在線留言咨詢,24小時內(nèi)回復(fù)
我想咨詢 *
企業(yè)名稱
手機號碼 *
您的姓名
所在城市 提交 |
網(wǎng)站建設(shè)問題
熱門標(biāo)簽
最新發(fā)布 |