URL標準化是什么意思?如何標準化URL 二維碼
1370
URL標準化,英文全稱為URL Canonicalize?,F(xiàn)在互聯(lián)網(wǎng)越來越講究規(guī)范化,網(wǎng)站的URL標準化(URL canonicalization)是近兩年來在各大搜索引擎的搜索結(jié)果中出現(xiàn)的一個很大的問題。它指的是搜索引擎挑選最好的URL網(wǎng)址作為真正網(wǎng)址的過程。 通俗的說,就是將你的頁面URL唯一化。導致頁面URL多樣化的原因有很多,主要包括包含www及不含www,動態(tài)頁面及偽靜態(tài)技術(shù),302的臨時重定向,一些JS或者Meta跳轉(zhuǎn)等等。這些因素最基礎(chǔ)的影響就是讓搜索引擎無所適從,到底哪個URL才是你要使用的?所以,就產(chǎn)生了URL標準化的概念。 URL標準化是什么意思?URL標準化,英文:url canonicalization,來自“matt cutts”的博客文章:SEO advice: url canonicalization,中文翻譯:SEO的建議:URL標準化 “URL標準化”是一個動名詞,不好直接解釋,我把它反過來一下: 什么是一個標準化的URL? 很多情況下,我們認為以下這幾個鏈接都指向同一個頁面(首頁): aoyouwl.com/ aquaponicswiki.com/index.html /index.php/index.php aoyouwl.com/home.asp(ASP即“活動服務器網(wǎng)頁”,是Active Server Page的縮寫,ASP的網(wǎng)頁文件的格式是.asp。ASP主要特性是HTML 、 腳本和 ActiveX ( 網(wǎng)絡化多媒體對象技術(shù)) 組件等整合在一起,創(chuàng)建和運行動態(tài)的 、交互的和高性能的 Web 服務器應用程序。ASP 屬于 ActiveX 技術(shù)中服務器端的技術(shù),這與通常在客戶端實現(xiàn)動態(tài)網(wǎng)頁的技術(shù)如 Java apple t、JavaScript 等有所不同,ASP 的命令和腳本語句是在服務器中解釋執(zhí)行,執(zhí)行后的結(jié)果產(chǎn)生 HTML。) 但是,從URL發(fā)送請求并返回網(wǎng)頁內(nèi)容的過程來看,這些URL都是互不相同的。對于上述URLs,Web服務器完全可以返回完全不同的內(nèi)容。當這些URL所對應的內(nèi)容都一樣時(一般情況下都一樣的),谷歌需要從上述URLs中選一個具有代表性的,而忽略其余的。那么這個被谷歌選擇了的URL,就是一個標準化的URL。谷歌選擇的這個過程稱為“標準化”。 URL標準化的目的在于集中網(wǎng)站權(quán)重,通過技術(shù)手段可以實現(xiàn)。 什么是URL靜態(tài)化? 現(xiàn)在搜索引擎越來越智能化,搜索引擎已經(jīng)能夠識別大部分的動態(tài)化的URL,站在整體角度,動態(tài)化的URL還是在一定程度上還是不如靜態(tài)化的URL收錄好。所以說我們在做好URL標準化的時候,把URL靜態(tài)化也是必須要做好的工作。大家請根據(jù)自己的網(wǎng)站空間具體的情況去做好這一項重要的操作吧,這里如果不懂的請及時咨詢下你的空間商是否支持靜態(tài)化的URL。 在談什么是URL靜態(tài)化之前,了解兩個概念:靜態(tài)網(wǎng)頁和動態(tài)網(wǎng)頁。 (1)靜態(tài)網(wǎng)頁:靜態(tài)網(wǎng)頁一般是以”.html”、”.html”、”.shtml”、”.xml”等后綴的格式結(jié)尾的頁面。 例如:http://aquaponicswiki.com/wmjcsydwxljynx.html 就是一個靜態(tài)頁面的url。 (2)動態(tài)網(wǎng)頁:以.aspx、.asp、.jsp、.php、.perl、.cgi等形式為后綴,并且在動態(tài)頁網(wǎng)址中含有一個或者多個標志性的符號”?”。 例如:http://aquaponicswiki.com/wzjs.html 就是一個動態(tài)頁面的url。 URL靜態(tài)化就是通過技術(shù)手段或者偽靜態(tài)規(guī)則將動態(tài)的網(wǎng)址變?yōu)殪o態(tài)網(wǎng)頁或者是偽靜態(tài)網(wǎng)頁。網(wǎng)頁偽靜態(tài)恰好解決了靜態(tài)網(wǎng)頁難維護,動態(tài)網(wǎng)頁不友好的問題,一方面對于搜索引擎和用戶來說比較友好。但是同樣也存在缺點,就是占用cpu資源相對較大。 怎么實現(xiàn)URL靜態(tài)化? 我們可以看出上邊就是一個動態(tài)地址,就是數(shù)據(jù)基本都是在數(shù)據(jù)庫里面調(diào)用出來的,影響搜索引擎抓取,我們要通過上傳靜態(tài)化文件,將動態(tài)網(wǎng)址偽靜態(tài)。 url在網(wǎng)站優(yōu)化中起到很重要的作用,網(wǎng)站內(nèi)部優(yōu)化不需要做到極致,但需要將能做的進了能做到最大化。 如果網(wǎng)站是使用的模板,最好到程序模板提供商處獲取rewrite規(guī)則。如果是獨立研發(fā)的網(wǎng)站程序,最好找專業(yè)程序員編寫代碼?,F(xiàn)在主流的網(wǎng)站建設系統(tǒng)(遨游建站)都支持偽靜態(tài)。只需要根據(jù)提示操作就可以了。 Apache環(huán)境下的偽靜態(tài)規(guī)則就是: 方法一:在本地創(chuàng)建.htaccess文件后寫入以下代碼,上傳到網(wǎng)站根目錄下,就完成URL偽靜態(tài)設置了。 RewriteEngine On RewriteBase / RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^topic-(.+)\.html$ portal.php?mod=topic&topic=$1&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^article-([0-9]+)-([0-9]+)\.html$ portal.php? mod=view&aid=$1&page=$2&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^forum-(\w+)-([0-9]+)\.html$ forum.php?mod=forumdisplay&fid=$1&page=$2&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^thread-([0-9]+)-([0-9]+)-([0-9]+)\.html$ forum.php?mod=viewthread&tid=$1&extra=page\%3D$3&page=$2&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^group-([0-9]+)-([0-9]+)\.html$ forum.php?mod=group&fid=$1&page=$2&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^space-(username|uid)-(.+)\.html$ home.php?mod=space&$1=$2&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^blog-([0-9]+)-([0-9]+)\.html$ home.php?mod=space&uid=$1&do=blog&id=$2&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^archiver/(fid|tid)-([0-9]+)\.html$ archiver/index.php?action=$1&value=$2&%1 方法二 (1)打開httpd.conf文件,找到#LoadModule rewrite_module modules/mod_rewrite.so 注釋前面# (2)打開httpd-vhosts.conf文件,在VirtualHost添加重寫規(guī)則,RewriteEngine _disibledevent=> 基本上就上面這兩個步驟,,這種Apache中URL地址重寫比較簡單。 方法三 在httpd.conf或.htaccess中使用RewriteRule: RewriteRule “^/dir/ ([^./]*) \.html” “/dir/script.cgi?doc=$1″ [PT][PT]標記告訴Apache執(zhí)行后續(xù)的所有操作。 一般第三種方法用的最多,針對asp.net、asp等還有他們自己的偽靜態(tài)規(guī)則,可以去研究一下。 URL中包含關(guān)鍵詞 通過我們的大量的研究證明,當你在優(yōu)化一個指數(shù)很高關(guān)鍵詞的時候,URL中包含該關(guān)鍵詞的拼音或者直接利用該關(guān)鍵詞作為域名在一定程度上,對我們的關(guān)鍵詞排名會有一定的優(yōu)勢。所以說,當我們的在選擇域名或者給我們的網(wǎng)站建立一級或者二級目錄的時候,我們一定要在我們自定義的URL上去增加該關(guān)鍵詞的拼音或者直接利用該關(guān)鍵詞作為該目錄的網(wǎng)址。 標準URL大小寫 不管是我們在做內(nèi)鏈還是在做外鏈的時候,我們在書寫網(wǎng)站URL的時候,一定要統(tǒng)一該URL的具體寫法,假設我們一直使用的是“小寫”的寫法,那么在以后我們不管是做內(nèi)鏈還是外鏈的時候,我們?nèi)拷y(tǒng)一成小寫,假如是利用“大寫”那么我們就統(tǒng)一成大寫。這樣做到的目的是為了更好讓搜索引擎識別,避免搜索引擎誤認為我們網(wǎng)站的URL重疊,從而對我們的網(wǎng)站降權(quán)。 盡量簡短 上面說過我們的URL中要盡量包含網(wǎng)站的關(guān)鍵詞或者拼音,但是我們的URL一定不能過長,我們的URL一定要盡量簡短,便于用戶記憶為佳,下次用戶訪問的時候,可能就會直接輸入你的URL地址進行訪問了。 為什么URL要靜態(tài)化? Google官方對SEO的建議是不進行URL靜態(tài)化,原因有三點: 1、Google完全有能力抓取動態(tài)網(wǎng)址,多少個問號也不是問題。 2、動態(tài)網(wǎng)址更有助于Google蜘蛛讀懂URL含義,URL里的參數(shù)都有助于Google理解URL及網(wǎng)頁內(nèi)容,并進行鑒別。而將網(wǎng)址靜態(tài)化后,這些參數(shù)的意義通常就變得不明顯了。 3、網(wǎng)址靜態(tài)化很容易弄錯,比如通常動態(tài)網(wǎng)址的參數(shù)調(diào)換順序,所得到的頁面其實是相同。尤其是對已經(jīng)收錄了動態(tài)網(wǎng)址靜態(tài)化,收錄靜態(tài)頁面后的兩個網(wǎng)址Google就不容易判斷是不是同一個頁面,從而可能引起復制內(nèi)容。 雖然說Google建議在SEO過程中不要URL靜態(tài)化,但是在實際過程中,我們歸根據(jù)實際情況對動態(tài)網(wǎng)址URL靜態(tài)化。我們完全相信Google的技術(shù)能夠?qū)讉€參數(shù)的URL收錄,但是并不意味著雅虎,百度,微軟等搜索引擎能夠做到,尤其是針對于中文搜索引擎。并且在SEO實踐過程中發(fā)靜態(tài)的URL明顯排名靠前。動態(tài)網(wǎng)址一般比較長,不利于記憶,也不利于傳播。 Google如何挑選標準化的URL 在沒有做特殊設置的情況下,Google會根據(jù)外鏈的數(shù)量來確定標準化的URL,也就是哪個地址被外鏈引用的次數(shù)最多,哪個地址就是標準化的URL。所以我們在平時做外鏈的時候,就要確保地址的唯一性,不要有的地方用 “aoyouwl.com”,而有的地方又用 “aquaponicswiki.com”。統(tǒng)一你的外鏈地址,讓Googel能夠快速的確認你的標準化URL,以便給予合適的排名。 同樣,我們在走內(nèi)鏈的時候,也要考慮到標準化URL的問題! 谷歌是如何進行URL標準化的 首先我們要確定URL標準化設計的方面,主要是帶www與不帶www的地址,以及偽靜態(tài)造成的重復收錄等問題,我們可以采用不同的方式來解決這個問題。 常見的設置url是將不帶www的網(wǎng)址轉(zhuǎn)跳到帶www,一定做的是301(記住只能做301 !302不可做)。在我們做外鏈的時候一定要將網(wǎng)址寫成301跳轉(zhuǎn)之后的網(wǎng)址。例如:aquaponicswiki.com 轉(zhuǎn)跳到 aoyouwl.com 以后在做外鏈或者錨文本時候,就不要帶www了,還有一些程序生成首頁會出現(xiàn)后邊帶index.html或index.php,我們可以利用技術(shù)手段將其去掉。 1、301重定向 301重定向的意思是告訴搜索引擎我們的網(wǎng)址已經(jīng)永久性的變更了,當我們的網(wǎng)站在進行改版或者更換域名的時候,我們則可以使用這樣的一個301重定向的方式來告訴搜索引擎我們的網(wǎng)址已經(jīng)永久性的變更了,這樣做可以把以前域名的權(quán)重全部集中到新的URL上,當然在這個傳遞權(quán)重的過程中可能會需要一定的時間,這個時候我們則需要慢慢的等待即可。 經(jīng)常會碰到這樣的情況,其他網(wǎng)站鏈接你的站點時,會用下面的鏈接: aquaponicswiki.com aoyouwl.com/ aquaponicswiki.com/index.html aoyouwl.com/index.php 而這樣導致:你站點主域名的pr值分散到其他幾個URLs了。 如果你用301重定向把其他三個URL轉(zhuǎn)到 aquaponicswiki.com PR也就集中在主域名:aquaponicswiki.com 了。 如果,我們決定采用帶www的地址為唯一的地址,那么,我們可以使用301永久重定向代碼,301重定向具體辦法: 設置.htaccess文件(只適用于linux系統(tǒng),并需要虛擬主機支持。) 使訪問aoyouwl.com/的時候就會自動轉(zhuǎn)到aquaponicswiki.com 在.htaccess文件里寫上以下代碼即可。 RewriteEngine on RewriteCond %{http_host} ^aoyouwl.com [NC] RewriteRule ^(.*)$ http://aquaponicswiki.com/ $1 [L,R=301] 將所有不帶www的地址進行重定向! 2、采用Canonical標簽 Canonical標簽經(jīng)常會被用在偽靜態(tài)地址上。您可以查看本站所有頁面的源代碼,在Head部分都有一個“l(fā)ink rel=’canonical’”的標簽,來標明這個頁面的標準化地址,以便讓Google進行確認,防止重復頁面的收錄。百度目前不支持該標簽! 3、采用Robot.txt文件 由于百度不支持Canonical標簽,我們可以結(jié)合使用robot文件來禁止搜索引擎收錄部分格式的頁面,以防止偽靜態(tài)情況下的重復收錄!比如我們用wordpress搭建博客時,采用了偽靜態(tài)技術(shù),另外也不希望一些管理文件被收錄,則常見的wordpress博客Robots.txt文件寫法為: User-agent: * –所有搜索引擎蜘蛛 Disallow: /wp-*/ –不收錄以WP-開頭的文件夾 Disallow: */feed –不收錄feed(包括單頁,整站,評論的feed) Disallow: */trackback –不收錄引用 Disallow: /*?* –不收錄動態(tài)頁 4、如何將無效的URL重定向到其他頁面? 很多時候,我們考慮把無效的URL比如:用戶拼錯的URL、不存在的URL重定向到別的網(wǎng)頁,例如網(wǎng)站的首頁、404頁面等。 在httpd.conf或.htaccess文件中使用ErrorDocument來捕獲404 (找不到文件)錯誤: ErrorDocument 404/index.html DirectoryIndex index.html/path/to/notfound.html 本功能會讓所有的404錯誤——每次當某人請求無效的URL 時,都返回 URL/index.html 提供的網(wǎng)站首頁。 這里需要注意兩點: 4.1、直接指向首頁是否是合適的?或者讓它指向到一個404頁面會更好些?如果在404頁面用javasctrip做一個跳轉(zhuǎn)到首頁,也是SEO允許的做法。 4.2、即使返回有效的文件,仍然會將404 狀態(tài)碼返回給客戶端和搜索引擎。這表示搜索引擎機器人來確認網(wǎng)站上的鏈接時,仍然會得到正確的結(jié)果(404狀態(tài)碼)。 5、改版時,如何保留原鏈接,創(chuàng)建新的URL? 具體操作辦法(僅適用于apache網(wǎng)絡服務器): 文件位置:apache->conf->httpd.conf 請在httpd.conf中使用Alias指令: Alias /newurl/www/htdocs/oldurl 如:用戶訪問新的地址 example.com/newurl/id34.html 服務器將提供的內(nèi)容原地址是 example.com/www/htdocs/oldurl/id34.html。 注意:Alias只會改變本地URL,如 fjseoer.com/newurl/id34.html 的/newurl/id34.html 部分,而無法改變URL的主機名稱部分(如:http://www.fjseoer.com/ 部分)。若要更改URL的主機名稱部分,請使用Redirect或RewriteRule指令。 遨游指南:本功能的Alias指令在 httpd.conf中是這一句: #Alias/webpath/full/filesystem/path 去掉前面的#,并做下相應的修改即可。 SEO過程中一般在這些情況下需要用到該功能: 5.1、當文件移動或文件目錄名稱發(fā)現(xiàn)改變,出于SEO需要,你需要保持舊的URL; 5.2、網(wǎng)站改版了,網(wǎng)站導航和鏈接發(fā)生變化,為了繼續(xù)持有原鏈接帶來的流量,你需要保持舊的URL; 5.3、你希望不同的人用不同URL來鏈接同一個的內(nèi)容。(SEO一般不建議這樣做) 6、如何替換請求URL中的文字 以下解決方案,僅適用于Apache服務器。 在.htaccess文件中添加以下語句: RewriteCond %{REQUEST_URL} “string1” RewriteRule “(.*)”string1(.*)” “$1string2$2” [N,PT] 例如當客戶端發(fā)出請求URL:example.com/string1/abcstring1.html,則轉(zhuǎn)換為目標URL:example.com/string2/abcstring2.html。 其中[N]標記告訴Apache重新執(zhí)行重寫規(guī)則,直到RewriteCond失效為止。只要請求URL中包含需要替換的字符串,它就會一直重復地執(zhí)行。當所有的string1都被替換完畢,則RewriteCond失效。本例子中,RewriteCond執(zhí)行了2次。[PT]告訴mod_rewrite把重寫的URL傳送到Apache來進行接下來的處理工作。 我們都知道,關(guān)鍵字是否在URL中對于網(wǎng)站SEO至關(guān)重要。對于建站初期不注重SEO的站點,特別是大型站點,本功能真是雪中送炭。 注意:使用本功能時,有時會把非目標字符也做了修改,假如例子中的“abcstring1”不是目標字符,但這個功能也會替換了它。 另外,敖游提醒各位: 1、網(wǎng)站所有URL盡量全bai部使用絕du對地址,可以有效的zhi防止網(wǎng)站被人dao家把惡意鏡像。還有一重zhuan要的作用就是,網(wǎng)絡中如shu果有人引用了你的網(wǎng)站內(nèi)容,你會獲得來自外界的導入鏈接。 2、盡量把帶www與不帶www的域名區(qū)別開來,盡量使用一個為常用的URL,然后另外一個做好301重定向。 3、動態(tài)URL和靜態(tài)URL都差不多,正常來說影響不大,擴展名其實無關(guān)緊要。如:.html,.htm,.asp,.php等等,對搜索來說,并沒有什么區(qū)別,關(guān)鍵一點,我們在做錨文本時,盡量選擇一個常用的。 4、外鏈與內(nèi)部鏈接盡量做到一致,意思其實同上,也就是做外鏈時盡量也做與錨文本一樣的URL。 5、URL 盡量用簡單的英文,最好能包括關(guān)鍵字的,一定要記住的我們URL不要大小寫混寫,建議全部用小寫字母。 6、做內(nèi)部錨文本時,一定要注意哪一個關(guān)鍵詞指定的哪一個URL。千萬不要出現(xiàn)同樣的錨文本,而每次指向的URL不一樣。(建議做一個長尾關(guān)鍵詞記錄單,這樣可以一目了然,哪一個關(guān)鍵詞對應哪一個URL) 好了,今天的分享就到這里。很多朋友喜歡找本地的建站優(yōu)化公司,不知道是出于何種考慮?敖游還是要老話重提一下,無論你是找企業(yè)網(wǎng)站優(yōu)化、商城系統(tǒng)搭建,還是企業(yè)小程序設計、百度競價托管代運營服務公司,最主要的還是要看靠不靠譜,如果不靠譜,就算是在你隔壁,一樣讓你不勝其煩!遨游建站是做品牌,不會因為地域差別而影響服務質(zhì)量,價格方面處于中等水平,售后服務,我們始終秉承“一次建站、終身維護”的宗旨,徹底解決你的后顧之憂!所以,與我們合作,無需擔心身處何地——我們始終以質(zhì)量為服務基礎(chǔ)! 以信載商,良心建站。遨游始終秉承“一次建站、終身維護”的宗旨,竭誠為客戶提供最優(yōu)質(zhì)的互聯(lián)網(wǎng)服務。遨游建站率先植入seo優(yōu)化理念,讓你的網(wǎng)頁更利于搜索引擎抓取,關(guān)鍵詞排名更靠前。可仿站、可定制。無論是傳統(tǒng)型企業(yè)官網(wǎng)、集團型品牌官網(wǎng),還是營銷型網(wǎng)站、電商型網(wǎng)站、定制型網(wǎng)站、特殊行業(yè)網(wǎng)站(醫(yī)療、教育),全部搞定。 公司:網(wǎng)站建設_小程序設計_競價托管代運營公司;郵箱:1013601535@qq.com 手機:17073547034;QQ: 1013601535 在線留言咨詢,24小時內(nèi)回復
我想咨詢 *
企業(yè)名稱
手機號碼 *
您的姓名
所在城市 提交 |
網(wǎng)站建設問題
熱門標簽
最新發(fā)布 |