關(guān)于網(wǎng)站的重復內容寶雞世紀網(wǎng)絡(luò )10個(gè)建議 |
作者:孫斌 發(fā)布時(shí)間:2009-05-15 瀏覽:1821次 |
什么是內容重復? 重復的內容一般是指在不同域名間存在大量的相同或相似的內容。很多時(shí)候,它并非故意或至少本無(wú)惡意。譬如說(shuō),有些論壇會(huì )生成一些專(zhuān)為手機屏幕的頁(yè)面;商店物品被顯示在(有時(shí)甚至是鏈接到)多種不同的URL上,等等。但有些時(shí)候,一些網(wǎng)站為了操縱搜索引擎排名,獲得更多流行或長(cháng)尾查詢(xún)的訪(fǎng)問(wèn)量,大量地從其他網(wǎng)站復制內容。(Chris.DL:一般網(wǎng)站的重復內容有3種情況,網(wǎng)站本身的內容重復;網(wǎng)站因為URL的設置問(wèn)題導致的內容重復;網(wǎng)站內容采集) 什么不是重復內容? 雖然谷歌網(wǎng)站有方便易用的翻譯功能,我們的算法不會(huì )把有著(zhù)相同內容的英文版和西班牙文版看作內容復制。同樣,你不用擔心我們把你文章中對其他文章小片段的引用認定為重復內容。(Chris.DL:大片段的引用算不算呢?這篇文章算不算重復內容呢) 為什么谷歌關(guān)心重復內容? 谷歌用戶(hù)使用Google時(shí)通常希望看到多樣化的原創(chuàng )內容。如果他們找到的都是內容相同的一堆搜索結果,可以想見(jiàn)那是多么煩人。另外,網(wǎng)站管理員不愿意看到Google給出象example.com/contentredir?value=shorty-george〈=en一樣復雜的URL。他們往往更喜歡類(lèi)似example.com/en/shorty-george.htm的URL。(Chris.DL:因為URL設置導致的重復內容是非常冤的一件事情) 谷歌做了些什么? Google在抓取網(wǎng)頁(yè)和獲得搜索結果時(shí),總是力圖索引并顯示內容不同的頁(yè)面。這種過(guò)濾意味著(zhù),譬如說(shuō),如果你的網(wǎng)站有文章的正常版和打印版,并且你沒(méi)有在robots.txt里設定noindex標記,谷歌就只會(huì )選擇一個(gè)版本顯示給谷歌用戶(hù)。對于企圖利用復制內容來(lái)操控排名,欺騙谷歌用戶(hù)的少數情況,我們會(huì )在對相關(guān)頁(yè)面的索引和排名作出適當調整。當然,我們更愿意把重點(diǎn)放在過(guò)濾而不是排名調整上… 因此,在絕大多數情況下,最壞的結果就是原創(chuàng )者看到了不愿看到的版本出現在我們的索引里。(重點(diǎn)放在過(guò)濾而不是排名調整上) 網(wǎng)站管理員如何主動(dòng)處理內容復制問(wèn)題? 1、適當阻止搜索引擎訪(fǎng)問(wèn):與其讓我們的算法來(lái)確定一個(gè)文件的”最佳”版本,你也許希望指引谷歌選取你的首選版本。譬如說(shuō),如果你不想我們索引你網(wǎng)站文章的打印版,你可以在你的robots.txt文件中寫(xiě)上目錄名或正則表達式來(lái)禁止谷歌對那些打印版的抓取。 2、使用301重定向:如果你已經(jīng)重構你的網(wǎng)站,請在你的原網(wǎng)站的.htaccess中使用301重定向(永久性重定向)來(lái)重定向你的用戶(hù)、Google爬蟲(chóng)、以及其他搜索引擎蜘蛛等。 3、鏈接要一致:努力使你的內部鏈接保持一致; 千萬(wàn)不要既有/page/,又有/page和/page/index.htm 的內部鏈接.。(Chris.DL:可以將/page/index.htm用301重定向到/page/) 4、使用頂級域名:為了讓我們總是使用最合適的文件版本, 請盡可能使用國家特定的頂級域名。與諸如example.com/de或de.example.com的URL相比,谷歌肯定更清楚地知道example.de是以德文為核心的內容。 5、小心辛迪加式的聯(lián)合供文:如果你為其他網(wǎng)站上也提供你的內容,請在每一個(gè)其他網(wǎng)站的文章中包括連回原文章的鏈接。注意:即使是這樣,對一個(gè)查詢(xún),谷歌總是顯示我們認為是最適合的(沒(méi)被網(wǎng)站禁止的)版本, 它可能是,也有可能不是你所想要的版本。 6、使用谷歌網(wǎng)站管理員工具的首選域功能:如果其他網(wǎng)站鏈接你的URL時(shí)既使用www版本又使用無(wú)www的版本,你可以用谷歌網(wǎng)站管理員工具讓我們知道你想要哪種索引方式。 7、減少模板網(wǎng)頁(yè)上的重復內容:拿版權聲明來(lái)說(shuō),你有兩種選擇,一種是在你的每一個(gè)頁(yè)面底部都有一個(gè)冗長(cháng)的版權聲明。另一種是設立一個(gè)專(zhuān)門(mén)的版權詳細聲明頁(yè),然后在每頁(yè)底部寫(xiě)一個(gè)非常簡(jiǎn)短的總結,并鏈接到版權聲明頁(yè)。 8、避免發(fā)布無(wú)內容頁(yè):用戶(hù)不喜歡看到無(wú)實(shí)際內容的頁(yè)面。要盡量避免空架頁(yè)。以房地產(chǎn)網(wǎng)頁(yè)為例,不要發(fā)布(或至少要阻止)沒(méi)有點(diǎn)評的點(diǎn)評網(wǎng)頁(yè),或者沒(méi)有房地產(chǎn)列表的房地產(chǎn)羅列網(wǎng)站等。只有這樣,網(wǎng)站用戶(hù)(以及Google爬蟲(chóng))才不會(huì )看到無(wú)窮多的寫(xiě)著(zhù)“以下是在【某城市名】中不可錯失的待租房列表…”但其實(shí)根本沒(méi)有什么列表的網(wǎng)頁(yè)。 9、了解你的內容管理系統:確保你熟悉你的網(wǎng)站是怎樣顯示內容的,尤其是當它包括了博客,論壇,或相關(guān)的系統。往往在這些系統中同一內容會(huì )以多種形式出現。 10、不要擔心,保持快樂(lè ):不要過(guò)分受搜刮(挪用和轉載)你內容站點(diǎn)的干擾。雖然很惱人, 它們幾乎不可能對你在谷歌中的存在產(chǎn)生負面影響。如果你實(shí)在忍無(wú)可忍, 歡迎你提出千禧年著(zhù)作權法案申請 來(lái)聲明對你的內容的所有權。我們會(huì )處理那些無(wú)賴(lài)網(wǎng)站。 總之, 如果你對內容復制問(wèn)題有一個(gè)大體的認識,又能花上幾分鐘有見(jiàn)地地預防性維護一下你的網(wǎng)站,這將既幫助你們,也幫助我們寶雞網(wǎng)站建設世紀網(wǎng)絡(luò )為用戶(hù)提供獨特而相關(guān)的內容。 |