百度《勁風算法》 二維碼
4
2月27日,百度搜索資源平臺發(fā)布了《勁風算法即將上線》的官方公告,針對惡劣聚合頁問題進行規(guī)范和控制。為了更好的幫助廣大開發(fā)者了解勁風算法,避免出現(xiàn)類似問題影響站點、智能小程序在搜索中的表現(xiàn),我們結(jié)合算法發(fā)布后大家關(guān)注度較高的問題逐一拆解說明,請廣大開發(fā)者參考。 上線時間:2019年02月27日 打擊對象:主要針對站點著陸頁惡意構(gòu)造聚合頁面內(nèi)容的行為,包含:頁面內(nèi)容與站點本身所屬領(lǐng)域不符、無專注領(lǐng)域、多為采集拼湊內(nèi)容。頁面內(nèi)容與標題及頁面中標記的標簽不符。網(wǎng)站搜索功能生成的靜態(tài)搜索結(jié)果頁??斩?、無有效信息、失效的聚合頁。 算法意義:保障搜索用戶的體驗、保證搜索結(jié)果公平。 勁風算法懲罰的目的 勁風算法,主要懲罰的對象是針對惡劣的聚合頁。 不管是網(wǎng)站還是百度智能小程序,都在勁風的懲罰范圍內(nèi)。而基于這個算法的面世,其主要問題是行業(yè)內(nèi),存在很多單純以獲得流量為目的,不管用戶搜索需求滿足度以及搜索體驗的聚合頁。百度為了保障搜索用戶在使用搜索引擎時的整體體驗,同時保證搜索排序的公平公正性。上線了勁風算法。就是為了懲罰創(chuàng)造這一類聚合的網(wǎng)站。 而針對惡劣聚合頁,主要分為四種類型: 1、站點內(nèi)容跨領(lǐng)域或過于分散 這個指的是網(wǎng)站中包含了太多領(lǐng)域的詞匯。例如你既要做游戲、又搞教育,還參與了加盟,甚至有電影。不僅搜索引擎無法識別你網(wǎng)站自身的專注領(lǐng)域,用戶訪問你站點的聚合頁后,得到的體驗也是極差的。 這種網(wǎng)站一般都是通過采集拼湊的內(nèi)容。而這種網(wǎng)站也基本可以理解為是完全基于流量目的的流量站。只能是站長單方面獲得了流量,但對用戶、對搜索引擎都是傷害的。 2、標題與內(nèi)容不相符 這里所說的標題,更多的可以理解為是我們聚合頁面的關(guān)鍵詞,例如這個聚合頁你的關(guān)鍵詞是SEO培訓,而里面調(diào)取的內(nèi)容有介紹游戲的、介紹電影的等與關(guān)鍵詞本身不相關(guān)的內(nèi)容。這樣即便搜索用戶進入到你這個聚合頁,還是不能很好的解決用戶需求! 3、利用站內(nèi)搜索生成的聚合頁 利用站內(nèi)搜索功能,批量生成靜態(tài)頁面,這種操作是批量生成聚合頁的慣用手法。多為大內(nèi)容量較大的網(wǎng)站盛行。 SEO通過大量的關(guān)鍵詞整理,然后技術(shù)人員以這些詞為站內(nèi)的搜索詞,將返回的搜索結(jié)果批量生成另一種模板的頁面。稱之為利用站內(nèi)搜索做聚合頁最典型的方式。 這種頁面生成的技術(shù)含量最難點在于自身搜索引擎的技術(shù)能力。而很多網(wǎng)站又沒有專業(yè)的搜索引擎團隊,即便生成出來的內(nèi)容,相關(guān)性差、頁面可讀性低。同樣是勁風算法打擊的對象。 4、內(nèi)容為空,或較少,以及失效的聚合頁 批量生成的聚合頁,以SEO為首,單純以獲取流量為目的的頁面。大多都會存在聚合頁內(nèi),調(diào)取的內(nèi)容過少,甚至為空的現(xiàn)象。 這種類型的頁面可想而知,毫無用戶體驗可言。所以勁風算法對其進行懲罰也是早晚的事情! 什么情況決定了勁風算法的懲罰周期呢 從經(jīng)驗上來看,網(wǎng)站構(gòu)成勁風算法的懲罰條件后。會從以下兩個維度進行考慮(個人推斷): 1、對搜索生態(tài)造成影響的程度,例如你聚合頁的體量很大,且造成了一定時間內(nèi)大量搜索用戶體驗較差的情況。 2、聚合頁滿足懲罰條件過多的,上面提到的4種情況中,滿足一條就會遭受懲罰,但很有可能同時符合4種降權(quán)條件:既是領(lǐng)域分散的網(wǎng)站,又利用站內(nèi)搜索批量生成靜態(tài)頁,且內(nèi)容為空的、過少的多的自己都沒統(tǒng)計過。 更多的會圍繞這兩個維度的情況,進行智能給出懲罰周期! 命中勁風算法后,如何進行整改,恢復? 那,命中勁風算法之后,我們就等著恢復嗎?如果不對網(wǎng)站進行整改是基本不可能恢復的。所以恢復的前提是你已經(jīng)改過自新了!而針對整改我給出如下建議: 從大原則上,來看勁風算法懲罰的問題 前提要明確,聚合頁還是可以做的,只不過針對不能滿足搜索用戶需求,單純以獲取自然搜索來源流量為目的的,是不能再做了。你也不要報著上有對策、下有政策的心態(tài),想辦法去規(guī)避被懲罰。即便這一次你沒有命中,那么按照百度的慣例,還會有下一次的勁風算法2.0等著你。 具體的一些整改措施 1、針對網(wǎng)站領(lǐng)域過于分散的 建議確定好一個主要的領(lǐng)域,且將其他領(lǐng)域的內(nèi)容robots掉,屏蔽搜索引擎抓取,且不再參與搜索引擎排名; 更完美的方式是對其他領(lǐng)域的內(nèi)容進行刪除,并將刪除的內(nèi)容URL在百度搜索資源平臺提交404,確保網(wǎng)站無恙。 2、針對題文不相符的 如果你有精力與資源,可以對應每一個聚合頁的主題進行審查,確保聚合頁下內(nèi)容都是針對當前聚合頁主題所延展的相關(guān)內(nèi)容。 從技術(shù)角度看,建議通過內(nèi)容相似度計算的方式將網(wǎng)頁內(nèi)的主體文本進行提取計算。得出當前聚合頁的主題與內(nèi)容的相似度得分。 并通過實際觀察,確保相似度得分在哪個值上,是可以解決搜索用戶需求的。 例如通過觀察,我認為相似度得分達到62%(便于理解的假設(shè)值)的,基本都是相關(guān)頁面,那么針對低于62%的暫時就別在前端頁面進行展示了,如果這類URL被訪問到建議設(shè)置404,并提交百度搜索資源平臺! 3、針對利用搜索批量生成的 利用站內(nèi)搜索批量生成的內(nèi)容,其最關(guān)鍵的問題在于其內(nèi)容無法滿足用戶需求。畢竟你的搜索引擎技術(shù)無法與百度相比。這里給出的建議是: 招聘精通搜索引擎的技術(shù)人員,針對搜索調(diào)取的內(nèi)容相關(guān)進行大幅度提升。從而提升用戶的體驗度。 利用第3點提到的相似度判斷方式,讓編輯協(xié)助完成低于62%的聚合頁的內(nèi)容撰寫工作。以此不斷提升滿足62%的內(nèi)容量。 技術(shù)能力達不到的,可以通過其他辦法進行嘗試,但最終還是無法確保滿足用戶需求的,建議刪除或者robots操作。 4、針對內(nèi)容為空或過于少,甚至無效的 內(nèi)容為空,甚至過少。在你站點內(nèi)容資源很豐富沒得到更多調(diào)取到聚合頁的情況時,可以采取以下方式: 將更多品類的內(nèi)容進行搜索整理,從而提升聚合頁下內(nèi)容整體的豐富度,前期要保證相關(guān)性。例如我這個聚合頁是圍繞爬蟲抓取策略展開的,那么其調(diào)取的內(nèi)容都應該基于爬蟲抓取的策略,不能劍走偏鋒,適得其反! 其次,也可以給予你的聚合頁關(guān)鍵詞進行分類。例如爬蟲抓取、爬蟲算法、搜索引擎爬蟲、baiduspider,我們認為是一類聚合頁。當內(nèi)容為空或少于X條時,我們可以通過擴展調(diào)取的維度進行補全。 從技術(shù)需求的實現(xiàn)角度可以為:如果當前聚合頁下調(diào)取內(nèi)容為0或不足X條時,那么調(diào)取當前聚合頁所屬關(guān)鍵詞同類別的其他內(nèi)容,補全X條。 這樣一來,通過擴大調(diào)取的品類,以及給關(guān)鍵詞做分類形成補全規(guī)則問題就能很少的得到解決! 但如果你的內(nèi)容資源信息很少,那么建議設(shè)定的邏輯為:當內(nèi)容低于X條,甚至為空時,當前頁面返回404。另外,由于我們這些做了404的頁面已經(jīng)被收錄或者爬蟲抓取了,建議再提交百度搜索資源平臺的死鏈提交工具,進行完備。確保不會讓搜索引擎認為你網(wǎng)站存在大量的死鏈接! 勁風算法:針對惡劣聚合頁問題 2020年2月,百度搜索技術(shù)團隊發(fā)現(xiàn),部分網(wǎng)站及智能小程序通過惡意構(gòu)造聚合頁面內(nèi)容來獲取搜索排名,獲得搜索用戶關(guān)注,上線勁風算法,控制惡意構(gòu)造聚合頁的問題對搜索用戶的影響。 聚合頁,是指頁面并無文章主體內(nèi)容,而是多個頁面的索引鏈接圍繞在特定主題下的信息整合頁。 惡劣聚合頁問題主要包括以下四種類型: 1、頁面內(nèi)容與站點本身所屬領(lǐng)域不符,或站點無專注領(lǐng)域,多為采集拼湊內(nèi)容。 問題示例1:站點內(nèi)容領(lǐng)域分散 2、頁面內(nèi)容與標題及頁面中標記的標簽不符。 問題示例2:頁面內(nèi)容與標題不符 3、由網(wǎng)站搜索功能生成的靜態(tài)搜索結(jié)果頁。 問題示例3:靜態(tài)搜索結(jié)果頁 4、空短、無有效信息、失效的聚合頁。 問題示例4:無有效信息的聚合頁 百度搜索引擎14個算法 ?綠蘿算法:首次發(fā)布于2013年2月,主要用于打擊超鏈中介、出賣鏈接、購買鏈接等超鏈作弊行為。 石榴算法:首次發(fā)布于2013年7月,主要打擊含有大量低質(zhì)彈窗廣告及大量混淆頁面主體內(nèi)容等垃圾廣告的頁面。 冰桶算法:首次發(fā)布于2014年8月,針對強行彈窗app下載、用戶登錄、大面積廣告等低質(zhì)站點和頁面進行調(diào)整,對用戶可直接使用的優(yōu)質(zhì)資源進行優(yōu)先展現(xiàn)。 天網(wǎng)算法:首次發(fā)布于2016年8月,主要是針對部分站點存在盜取用戶隱私的行為進行打擊。主要表現(xiàn)為網(wǎng)頁嵌惡意代碼(多為JS代碼),用于盜取網(wǎng)民的QQ號、手機號。 藍天算法:首次發(fā)布于2016年11月,目的是嚴厲打擊新聞源網(wǎng)站售賣軟文、目錄行為。 烽火算法:首次發(fā)布于2017年2月,主要用于對出現(xiàn)惡意劫持行為的站點進行干預處理,全力打擊有損用戶體驗和安全的行為。 颶風算法,首次發(fā)布于2017年7月,旨在嚴厲打擊以惡劣采集為內(nèi)容主要來源的網(wǎng)站。 清風算法:首次發(fā)布于2017年9月,在嚴懲網(wǎng)站通過網(wǎng)頁標題作弊,欺騙用戶并獲得點擊的行為;從而保證搜索用戶體驗,促進搜索生態(tài)良性發(fā)展。 閃電算法:首次發(fā)布于2017年10月,主要針對移動網(wǎng)站首屏加載時間,移動網(wǎng)頁首屏在2秒之內(nèi)完成打開的,在移動搜索下將獲得提升頁面評價優(yōu)待。 驚雷算法:首次發(fā)布于2017年11月,旨在嚴厲打擊通過刷點擊,提升網(wǎng)站搜索排序的作弊行為;以此保證搜索用戶體驗,促進搜索內(nèi)容生態(tài)良性發(fā)展。 極光算法:首次發(fā)布于2018年5月,給予符合落地頁時間因子(文章的發(fā)布時間)要求且時效性較高的網(wǎng)頁更多的收錄、展現(xiàn)機會。 細雨算法:首次發(fā)布于2018年7月,主要是為了促進供求黃頁類B2B站點生態(tài)健康發(fā)展。 信風算法:首次發(fā)布于2019年5月,主要打擊用戶點擊翻頁鍵時,自動跳轉(zhuǎn)至網(wǎng)站的其他頻道頁(如目錄頁、站外廣告頁等)的行為。 勁風算法:首次發(fā)布于2020年2月,主要針對惡劣聚合頁問題進行規(guī)范和控制。 以信載商,良心建站。遨游始終秉承“一次建站、終身維護”的宗旨,竭誠為客戶提供最優(yōu)質(zhì)的互聯(lián)網(wǎng)服務。遨游建站率先植入seo優(yōu)化理念,讓你的網(wǎng)頁更利于搜索引擎抓取,關(guān)鍵詞排名更靠前。可仿站、可定制。無論是傳統(tǒng)型企業(yè)官網(wǎng)、集團型品牌官網(wǎng),還是營銷型網(wǎng)站、電商型網(wǎng)站、定制型網(wǎng)站、特殊行業(yè)網(wǎng)站(醫(yī)療、教育),全部搞定。 公司:網(wǎng)站建設(shè)_小程序設(shè)計_競價托管代運營公司;郵箱:1013601535@qq.com 手機:17073547034;QQ: 1013601535 在線留言咨詢,24小時內(nèi)回復
我想咨詢 *
企業(yè)名稱
手機號碼 *
您的姓名
所在城市 提交 |
網(wǎng)站建設(shè)問題
熱門標簽
最新發(fā)布 |