站點(diǎn)流量異常追查文檔 二維碼
163
百度站長平臺幾乎每天都會接到站長關(guān)于流量的詢問,很多站長發(fā)現(xiàn)站點(diǎn)流量發(fā)生很大變化后,第一反應(yīng)就是認(rèn)為自己被誤判降權(quán)了,情緒激動者不經(jīng)審核立即開始在公開媒體聲討百度為自己造勢。但經(jīng)過百度站長平臺追查,大部分站點(diǎn)都不是真的被懲罰了,或者說并不是因為站點(diǎn)主觀原因被懲罰。所以,為了解開站長關(guān)于站點(diǎn)流量大幅下滑的謎團(tuán),更好地幫助站長查找原因,我們推出了《站點(diǎn)流量異常追查文檔》,希望能給站長一些啟示。 目錄: 先普及一個概念:什么是流量異常 一,運(yùn)維篇 1、CDN 2、robots 3、UA/IP 4、安全問題/管理不善 A、域名泛解析 B、網(wǎng)站被黑 C、網(wǎng)頁被掛馬 D、UGC站點(diǎn)被SPAMMER群發(fā) 二,特征頁分析 1、分析流程圖 2、查找特征頁面 3、分析異常特征 A、排名無,流量無 B、部分排名無,流量損失較大 三,相關(guān)因素——外鏈爆增 1、首頁、頻道頁、重要頁面被惡意投票 2、用戶創(chuàng)建頁面、垃圾個人頁、內(nèi)容頁被惡意投票 3、拼接搜索結(jié)果頁漏洞 4、如何預(yù)防產(chǎn)生拼接搜索結(jié)果頁 什么是流量異常 來自百度搜索的流量突然間降了50%以上,且是持續(xù)性的,即已經(jīng)連續(xù)四至五天流量沒有明顯漲幅變化。如下圖所示:
如果出現(xiàn)上述現(xiàn)象,建議大家從運(yùn)維角度、頁面特征,以及相關(guān)因素來判斷原因。
一、站點(diǎn)流量異常原因之運(yùn)維篇 1、CDN
一些網(wǎng)站會使用CDN加速服務(wù),最近每周站長平臺都會接到一兩個跟CDN加速問題有關(guān)的案例。CDN這里存在一個問題:不同的CDN服務(wù)商在全國分布的節(jié)點(diǎn)數(shù)不同,站點(diǎn)在使用CDN服務(wù)時,同一地區(qū)CDN給蜘蛛返回的IP地址要和給用戶的一致。那么現(xiàn)實(shí)情況是,部分CDN服務(wù)商出于成本考慮與資源使用率的問題,會在不告知用戶的情況下變更IP地址以節(jié)約成本,這樣就導(dǎo)致蜘蛛在去抓的時候,會遇到新IP和老IP的問題,在站點(diǎn)沒有告知更換IP的情況下,蜘蛛會認(rèn)為站點(diǎn)目前存在問題,首先是減少抓取量,其次會判斷是否把不可訪問的頁面下掉,這時候就出現(xiàn)了用戶訪問IP與蜘蛛抓取IP不一致的情況。所以建議站點(diǎn)在選擇CDN服務(wù)時要選擇穩(wěn)定的CDN服務(wù)商,其次如果IP更換最好通過站長平臺抓取診斷工具抓取測試,如果IP不正確可以點(diǎn)擊下圖紅框“報錯”提示給站長平臺
2、Robots 站長應(yīng)該對robots都不陌生,但為什么還要提呢?有這樣一種情況:站點(diǎn)需要更新robots文件,對站內(nèi)部分內(nèi)容禁止或放開抓取。但由于操作后沒有檢查是否生效,站長會默認(rèn)為已經(jīng)生效。同時還有一個生效周期的問題,那么站點(diǎn)需要在百度站長平臺提供的robots檢測工具中做一個抓取測試來驗證是否生效。 如果看到robots內(nèi)容和你更改后的內(nèi)容不一致,有幾種可能:第一種可能是網(wǎng)站沒有全面布局,因為有的站點(diǎn)服務(wù)器可能在很多地方,你需要確認(rèn)robots是否已全部推送;第二種可能是百度沒有及時做更新,可以通過robots檢測工具下方的更新按鈕來告訴百度Robots有變化。
3、UA/IP UA封禁一般不會是站點(diǎn)主觀錯誤操作,往往是意外情況,站點(diǎn)在程序中過濾誤操作UA封禁,而通常卻不知道自己封禁了蜘蛛。只有在逐步的排查才會發(fā)現(xiàn)這種概率很小的問題。所以在流量異常中我們在運(yùn)維篇中把這項列進(jìn)去,讓站點(diǎn)注意這些個細(xì)節(jié)。 那么當(dāng)您的網(wǎng)站不希望Baiduspider訪問時,才需要該設(shè)置,如果您希望Baiduspider訪問您的網(wǎng)站,useragent相關(guān)的設(shè)置中是否有Baiduspider UA,并及時修改。禁止所有來自百度的抓?。?User-agent: Baiduspider Disallow: / IP封禁往往是遇到CC攻擊的時候不知道哪些是真百度蜘蛛和仿冒百度蜘蛛而封禁了蜘蛛IP,這里我們建議通過DNS反查方式讓站點(diǎn)了解哪些是真實(shí)蜘蛛,根據(jù)平臺不同驗證方法不同,如linux/windows/os三種平臺下的驗證方法分別如下: A、在linux平臺下,您可以使用host ip命令反解ip來判斷是否來自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。
B、在windows平臺或者IBM OS/2平臺下,您可以使用nslookup ip命令反解ip來 判斷是否來自Baiduspider的抓取。打開命令處理器 輸入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。 C、在mac os平臺下,您可以使用dig 命令反解ip來 判斷是否來自Baiduspider的抓取。打開命令處理器 輸入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。 更多內(nèi)容請訪問:http://zhanzhang.baidu.com/college/articleinfo?id=34 4、安全/管理不善 安全問題在站長平臺能觀察到的絕大多數(shù)屬于管理問題,站點(diǎn)被黑客鉆了漏洞而受到了懲罰等,且懲罰力度與站點(diǎn)漏洞的存在時間成正比。 A、域名泛解析 近幾個月域名泛解析是一個非常經(jīng)典的案例,很多網(wǎng)站由于安全意識薄弱、密碼簡單被黑客鉆了空子,解析出了大量非本站內(nèi)容的低質(zhì)頁面,導(dǎo)致百度搜索引擎對整站采取了臨時措施,使得站點(diǎn)流量掉了很多甚至清零。 B、網(wǎng)站被黑 網(wǎng)站被黑跟泛解析也有相似之處,網(wǎng)站內(nèi)有大量的垃圾頁面都是黑客創(chuàng)造出來的,導(dǎo)致受到懲罰,給站點(diǎn)帶來致命的打擊。 C、網(wǎng)頁被掛馬 其實(shí)這也是被黑的一種,但比被黑釋放垃圾頁面更為隱蔽,這類案例主要出現(xiàn)在企業(yè)網(wǎng)站或者是一些比較小的網(wǎng)站上,黑客直接在頁面上放置展現(xiàn)廣告代碼,而且會判斷來訪者是普通用戶還是蜘蛛,然后區(qū)別對待;或者是僅給某一個地區(qū)的用戶訪問掛馬頁面,給蜘蛛和其他大部分所在地展現(xiàn)正常頁面等,這些其實(shí)都是非常隱蔽的行為,沒有用戶舉報站點(diǎn)也很難發(fā)現(xiàn),但百度搜索引擎無法容忍這樣的頁面出現(xiàn)在搜索結(jié)果里,自然這些站點(diǎn)會受到懲罰。 D、UGC站點(diǎn)被SPAMMER群發(fā) 最后說UGC站點(diǎn),所有以用戶貢獻(xiàn)內(nèi)容的站點(diǎn)在審核機(jī)制上一定要加強(qiáng)防范,目前平臺能夠接到的不少案例都是UGC站點(diǎn)存在監(jiān)管不利,導(dǎo)致有大量的垃圾內(nèi)容在線上,當(dāng)垃圾內(nèi)容與正常內(nèi)容的比例達(dá)到一定閾值,就有可能整站被百度搜索引擎懲罰。 二、站點(diǎn)流量異常原因之特征頁分析 1、分析流程圖
流程圖會按照三步來讓站點(diǎn)確認(rèn)到底是正常下跌還是異常下跌,在此站長第一步首先要找到特征頁面 2、查找特征頁面 首先說什么叫特征頁面,即流量下滑比較多的頁面,這類頁面又是結(jié)構(gòu)化頁面,內(nèi)容不同頁面所搶的關(guān)鍵詞不同,但頁面框架結(jié)構(gòu)是統(tǒng)一的。比如關(guān)鍵詞“北京旅游、上海旅游、天津旅游”對應(yīng)A類頁面,那么在此類關(guān)鍵詞消失后,這個A類頁面也沒有流量,于是A類頁面就是我們說的特征頁面,要看看A類頁面發(fā)生過哪些變化。首先找出昔日的流量對比,過去一段時間與現(xiàn)狀的差距。其次回憶一下近期此類頁面有怎樣的改動,這些改動是否存在運(yùn)維篇的問題,那么觀察幾日后給出流量損失范圍。 3、分析異常特征 從流量損失范圍大體可以判定兩種情況: A、排名無,流量無 上面所講的關(guān)鍵詞排名無,網(wǎng)站流量無——很有可能是受到了懲罰,可能是局部懲罰也可能是站點(diǎn)整體被懲罰。具體原因可以參見之前推出的石榴算法及綠蘿2.0算法,當(dāng)然大量算法我們沒有公布出來,各位可以參考《百度網(wǎng)頁搜索質(zhì)量白皮書》,觀察站點(diǎn)是否存在此類問題。參考鏈接: 百度綠蘿算法2.0更新公告 石榴算法—低質(zhì)量頁面終結(jié)者 對買賣鏈接行為的提醒,出售鏈接同樣會受打擊 B、部分排名無,流量損失較大 例如,特征頁面A本對應(yīng)多個關(guān)鍵詞,有些關(guān)鍵詞下已找不到A,而有些仍然可以找到,基本可以說明該頁面并不在懲罰范圍內(nèi),可能是百度算法在做調(diào)整。而如果所有關(guān)鍵詞下都難以找到A頁面,那極有可能是被懲罰了。 三、站點(diǎn)流量異常原因之相關(guān)因素:外鏈爆增
站長平臺在接到很多案例中,有很大一部分是因為外鏈異常而流量受到較大影響的,在此先給大家說一下外鏈工具顯示數(shù)據(jù)來源及規(guī)則:外鏈工具是統(tǒng)計站點(diǎn)在一段時間內(nèi),鏈接到您網(wǎng)站的URL、被鏈接網(wǎng)頁URL、錨文本等內(nèi)容,站長可以通過這些數(shù)據(jù)識別和判斷哪些是符合預(yù)期的外鏈投票、哪些是不符合預(yù)期的。那么如果發(fā)生外鏈爆增時絕大部分站點(diǎn)是不符合預(yù)期的增長,這里我們從三種情況出發(fā)來剖析和解決此類問題。 1、首頁、頻道頁、重點(diǎn)頁面被惡意投票 A、此類事件主要是在被鏈接URL被莫名的站點(diǎn)大量投票,如果遇到此種現(xiàn)象一定要注意,很有可能是惡意投票行為,目的是通過大量垃圾站點(diǎn)對站點(diǎn)的投票,降低站點(diǎn)在百度搜索引擎中的評價。 B、此類問題的措施只能是站點(diǎn)加大拒絕力度,從而屏蔽掉無意義的投票鏈接 2、用戶創(chuàng)建頁面,垃圾個人頁,內(nèi)容頁 A、UGC站點(diǎn)尤其要關(guān)注這點(diǎn),之前談過要加大審核及處理力度,杜絕讓用戶創(chuàng)建垃圾內(nèi)容、個人頁面。不良分子為了排名的效果更好,會再對這些垃圾頁進(jìn)行投票。這里特別要提醒的是,如果站點(diǎn)審核力度及時就不會發(fā)生此類事情,只有站點(diǎn)內(nèi)容長期處于無人管理的狀態(tài)時才會出現(xiàn)如此問題。 B、此類問題的措施只能是站點(diǎn)加大審核力度,關(guān)閉垃圾頁面,同時拒絕這些垃圾投票的域名及站點(diǎn) 3、拼接搜索結(jié)果頁漏洞 拼接搜索結(jié)果頁是通過地址欄參數(shù)變化而動態(tài)創(chuàng)建出的頁面,例如下圖這些頁面,TITLE中往往包含了過多的垃圾詞,提交給搜索引擎后,為了排名效果再對這些頁面進(jìn)行投票而產(chǎn)生了過量的外鏈投票。
此類頁面不良分子就是鉆了拼接搜索結(jié)果頁的title、description可以顯示拼接代碼中的垃圾內(nèi)容。理論上百度搜索引擎會拒絕收錄這樣的頁面,但畢竟站點(diǎn)數(shù)量巨大還會出現(xiàn)遺漏。所以如果想解決此類問題,可以在百度站長平臺反饋中心反饋下述內(nèi)容: 1)舉例已收錄被鏈接頁面 2)給出搜索此類頁面關(guān)鍵詞的鏈接 3)描述頁面收錄量及外鏈量(給出外鏈分析中的數(shù)據(jù)) 4、如何預(yù)防產(chǎn)生拼接搜索結(jié)果頁 上面也說了,拼接搜索結(jié)果頁是不良分子鉆了可以控制頁面的title、description內(nèi)容而制造了大量的頁面,從而進(jìn)行投票的行為。那么如果在拼接搜索結(jié)果頁中禁止這些無效參數(shù)展示在Title和Description中自然就沒有這個漏洞,下圖以攜程為例,拼接頁面中的title和description都是固定內(nèi)容,無論頁面參數(shù)怎么變化這些都不會改變。
具體內(nèi)容可以參考之前平臺發(fā)布的相關(guān)文章《防止網(wǎng)站內(nèi)部搜索被他人惡意利用》 以信載商,良心建站。遨游始終秉承“一次建站、終身維護(hù)”的宗旨,竭誠為客戶提供最優(yōu)質(zhì)的互聯(lián)網(wǎng)服務(wù)。遨游建站率先植入seo優(yōu)化理念,讓你的網(wǎng)頁更利于搜索引擎抓取,關(guān)鍵詞排名更靠前。可仿站、可定制。無論是傳統(tǒng)型企業(yè)官網(wǎng)、集團(tuán)型品牌官網(wǎng),還是營銷型網(wǎng)站、電商型網(wǎng)站、定制型網(wǎng)站、特殊行業(yè)網(wǎng)站(醫(yī)療、教育),全部搞定。 公司:網(wǎng)站建設(shè)_小程序設(shè)計_競價托管代運(yùn)營公司;郵箱:1013601535@qq.com 手機(jī):17073547034;QQ: 1013601535 在線留言咨詢,24小時內(nèi)回復(fù)
我想咨詢 *
企業(yè)名稱
手機(jī)號碼 *
您的姓名
所在城市 提交 |
網(wǎng)站建設(shè)問題
熱門標(biāo)簽
最新發(fā)布 |