寶雞建網(wǎng)站:搜索引擎如何確定你的就是原創(chuàng )內容 |
作者:本站 發(fā)布時(shí)間:2018-05-05 瀏覽:868次 |
很多人在群里聊到一些事情,比如原創(chuàng )是如何被搜索引擎確定的?世紀網(wǎng)絡(luò )今天分享一下自己對搜索引擎確定原創(chuàng )內容的看法。 首先我們明確兩個(gè)概念:原創(chuàng )與偽原創(chuàng ) 原創(chuàng ):簡(jiǎn)單地理解就是第一次在網(wǎng)絡(luò )上發(fā)表的內容。 偽原創(chuàng ):就是對原創(chuàng )進(jìn)行的第二次或者第N次經(jīng)過(guò)修改的轉載發(fā)表。比如修改標題,增加摘要,轉載不完整內容等等。 搜索引擎對于原創(chuàng )的判斷是如何進(jìn)行的呢? 一般來(lái)講有以下幾個(gè)方面的因素決定: 1、快照日期。 2、蜘蛛抓取日期。 3、頁(yè)面外鏈的多少。 4、文章修改的程度。 舉例:如果一篇標題為《搜索引擎如何確定你的就是原創(chuàng )內容》的文章在今天10點(diǎn)第一次發(fā)表在一個(gè)博客或者網(wǎng)站上。會(huì )有什么結果呢? 搜索引擎蜘蛛來(lái)到這個(gè)博客或者網(wǎng)站,發(fā)現這個(gè)頁(yè)面,分析內容,放入數據庫,并且被確定為首次發(fā)現,這肯定就是原創(chuàng )了! 那么這個(gè)收錄與判斷的過(guò)程中間有幾個(gè)細節方面問(wèn)題: 1、必要條件 ——假如這個(gè)網(wǎng)站沒(méi)有被收錄,這篇文章會(huì )認為是原創(chuàng )嗎? ——當然不是!因為它根本不可能出現在搜索數據庫里! ——如何讓它成為原創(chuàng )內容? ——第一個(gè)條件,網(wǎng)站必須有被搜索引擎收錄。 ——假如這個(gè)網(wǎng)站收錄了,但是不經(jīng)常更新呢? ——很簡(jiǎn)單,如果不經(jīng)常更新,發(fā)表的文章到收錄的時(shí)候也會(huì )認為是原創(chuàng )的。 3、轉載與采集 ——如果文章被轉載了呢? ——如果文章被轉載,那么看轉載這篇文章的站更新周期與首次發(fā)表站的更新周期哪個(gè)更快。 ——不太明白更新周期。 ——比如在A(yíng)站發(fā)表,B站轉載,如果蜘蛛先訪(fǎng)問(wèn)了A站,發(fā)現了文章,再來(lái)到B站發(fā)現了文章,很明顯的,原創(chuàng )權重歸A站。 ——采集的情況是否符合這種情況? ——是的,采集的情況一樣。如果B采集A,但B收錄比A早,B就可能變成原創(chuàng )嘍!
4、訪(fǎng)問(wèn)時(shí)間 ——如果蜘蛛先訪(fǎng)問(wèn)了B站呢? ——當然權重給B站,一般的情況下都會(huì )這樣! ——如果B站轉載的文章帶了A站的原文章頁(yè)面鏈接呢? ——這就很明白了,剛收錄的時(shí)候,如果排名,兩條結果一起出現,有可能還是B站的排名好一點(diǎn)。 當然,文章轉載次數多了以后,A站的鏈接越多,對A站的文章越有好處,排名會(huì )慢慢變成A站在前面。 ——如果另外轉載的文章帶的是B站頁(yè)面的鏈接呢? ——這種情況就搞笑了,給搜索引擎開(kāi)了個(gè)玩笑,但它們如果判斷不好,就變成了一個(gè)鏈接流行度的比賽了。 不過(guò),如果都有很多外部鏈接,并且相差不大,那么判斷的規則應該回到原點(diǎn),誰(shuí)先被收錄誰(shuí)就是原創(chuàng )。 5、快照日期 ——快照日期顯示時(shí)間最早的,一般就是原創(chuàng )了吧! ——不一定,這個(gè)說(shuō)法要在一個(gè)更新周期之內,比如說(shuō)文章發(fā)表后一周內,快照時(shí)間越早的地址將越有被認可為原創(chuàng )的可能。 但如果文章都發(fā)表了幾個(gè)月了,說(shuō)不定搜索引擎已經(jīng)重新獲取過(guò)快照了,快照的日期就變了! ——還有其它的可能嗎? ——有,一般比如百度收錄,他可能會(huì )有一個(gè)收錄的數據庫,經(jīng)過(guò)過(guò)濾后,收錄的內容才會(huì )到搜索結果里來(lái)。在這個(gè)期間就有一些問(wèn)題了,比如A站首次發(fā)表,B站轉載。蜘蛛先訪(fǎng)問(wèn)A站再訪(fǎng)問(wèn)B站。而后可能先把B站的結果放出來(lái)了,而A站還在數據庫里。 所以說(shuō)搜索引擎沒(méi)有收錄并不表示搜索引擎蜘蛛沒(méi)有訪(fǎng)問(wèn)過(guò)這些內容,也許在搜索引擎的庫存里已經(jīng)有記錄了,只是你查的時(shí)間沒(méi)有放出來(lái)而已,就像25號才放出來(lái)的內容,但是快照是20號的,這就是搜索引擎的庫存內容,同時(shí)這也是檢驗原創(chuàng )的核心時(shí)間點(diǎn)。 這種情況一般出現在新站與老站之間,A站發(fā)表,B站轉載,但A站在搜索引擎的信任度并不高的時(shí)候。不過(guò)只要是A站先被訪(fǎng)問(wèn)到的,原創(chuàng )權還是A站的,這是最難分出來(lái)的情況,因為我們不知道蜘蛛先訪(fǎng)問(wèn)哪個(gè)站,除非你知道兩個(gè)站的網(wǎng)站空間日志內容,能看到搜索引擎對兩個(gè)頁(yè)面的訪(fǎng)問(wèn)時(shí)間。 6、偽原創(chuàng ) ——偽原創(chuàng )也會(huì )被認為是原創(chuàng )? ——大多時(shí)候是這樣的,搜索引擎蜘蛛智力相當于三歲小孩子一樣,不能明確分別這些東西,因為它的思維太程式化了。如果你的標題改過(guò),文章的段落改過(guò),那么蜘蛛將很難確定這篇文章是否有過(guò)收錄,也許它可以確定有部分內容是重復的,但它也不能因為這些而將這篇文章確認為是轉載!當然,隨著(zhù)搜索引擎程式設計的提高,應該會(huì )有一個(gè)相似度的東西出來(lái),比如文字內容相似度超過(guò)百分之幾就會(huì )被認為是轉載。 這樣分析下來(lái),相信大家應該了解了吧。只是核桃自己的看法,希望大家吸收自己想要的東西,不認同的了也來(lái)提下自己的意見(jiàn)! 另外提幾個(gè)建議: 1、如果你的站是新站,權重不高,如何讓蜘蛛首頁(yè)找到你的頁(yè)面并放入數據庫?其實(shí)很簡(jiǎn)單:用網(wǎng)摘、百度收藏這些工具讓蜘蛛更快的找到你的頁(yè)面! 2、大家都有過(guò)建議,就是加上自己的版權及內容頁(yè)面的地址,別人采集的時(shí)候你就爽了,收錄雖然不會(huì )快,但最后鏈接多了,你依然是原創(chuàng )內容。 3、發(fā)表文章等到自己收錄以后再去其它的站點(diǎn)進(jìn)行發(fā)表,同時(shí)加上自己的原文地址,這種辦法很有保障!大站被采的機率很大! |