網(wǎng)站運營的過程中,我們經(jīng)常會遇到一個頭疼的事情,就是頁面相似度過高,不知道該怎么處理。這樣會很影響網(wǎng)站的效果,那么如何解決這個問題呢,下面小編就來詳細的介紹下。
通常網(wǎng)頁的相似度主要指的是兩個網(wǎng)頁的內(nèi)容有很多部分相同。當搜索引擎對比兩個網(wǎng)頁時,會通過兩種方法進行對比分析。第一是根據(jù)網(wǎng)頁內(nèi)容上的摘要模塊進行分析,如果兩個網(wǎng)頁上MD5值數(shù)據(jù)一樣,那么這兩個網(wǎng)頁的相似性就非常高。第二,就是根據(jù)網(wǎng)頁上的關(guān)鍵詞頻度和排序進行分析。在一個網(wǎng)頁上獲得詞頻較高的關(guān)鍵詞,然后進行MD5賦值,如果兩個網(wǎng)頁的關(guān)鍵詞MD5值一樣,那么說明具有較高的相似度。
目前搜索引擎能夠認可的網(wǎng)頁相似度不能夠超過60%,如果超過60%,那么就會被相應(yīng)的搜索引擎懲罰,導(dǎo)致被降權(quán)或者屏蔽。那么造成網(wǎng)頁相似度的因素有哪些呢?具體來看主要有兩個方面的原因:第一,同一個網(wǎng)站里,經(jīng)常將過去舊的內(nèi)容進行簡單的翻新,在翻新的過程中,描述、關(guān)鍵詞和標題以及內(nèi)容等改動極少,或者就是簡單的偽原創(chuàng),這樣就容易造成網(wǎng)頁相似度高。第二,將其他網(wǎng)站已經(jīng)收錄的內(nèi)容拿過來,進行簡單的調(diào)整,比如改變一下標題,將段落重新打散,然后發(fā)布到自己網(wǎng)站上,這樣的內(nèi)容雖然和自己網(wǎng)站中的內(nèi)容對比不會存在相似性,但是從互聯(lián)網(wǎng)的角度上對比,那么這種重復(fù)性就會變得十分明顯了。
當出現(xiàn)網(wǎng)頁相似度明顯的時候,就需要立刻改變之前的內(nèi)容建設(shè)戰(zhàn)略,否則一旦超過60%這個警戒線,就很容易網(wǎng)站被判定為垃圾網(wǎng)站,從而很難獲得成功。對此可以從下面兩個方面來降低網(wǎng)站內(nèi)容相似度。
第一,盡可能的進行原創(chuàng),因為原創(chuàng)的內(nèi)容不會存在相似度的問題,而且就算是別的網(wǎng)站被轉(zhuǎn)載,甚至收錄時間超過你,但是經(jīng)過一段時間之后,百度的智能化算法同樣會判定你作為第一原創(chuàng)者,從而給予更高的權(quán)重。
第二,偽原創(chuàng)要進行升級,畢竟一個網(wǎng)站豐富的內(nèi)容,通過站長個人或者一個小團隊往往很難搞的非常豐富,適當?shù)膫卧瓌?chuàng)無可厚非,可是偽原創(chuàng)卻需要進行升級,不能夠進行簡單的更換標題,打亂段落的方式,這種方式隨著百度智能化的升級,已經(jīng)很難適應(yīng),最佳的方法就是通過人工改寫的方式,而且盡可能達到70%以上的原創(chuàng)度,才能夠降低網(wǎng)頁的相似度。
第三,采用iFrame框架技術(shù)對于一些重要內(nèi)容進行多次展示,因為一個網(wǎng)站上的內(nèi)容可能會在多個頻道上展示,比如首頁上具有一些推薦的內(nèi)容,而相應(yīng)的欄目頁上也存在著這些一模一樣的內(nèi)容,那么此時就需要采用iFrame框架技術(shù),對于重復(fù)的內(nèi)容根百度說不,讓百度不要抓取這些內(nèi)容,這樣就能夠規(guī)避網(wǎng)頁相似度的風(fēng)險。
總而言之,網(wǎng)頁相似度不能夠太高,但是一點沒有也不夠現(xiàn)實,關(guān)鍵是掌握一個度,如果站長時間充分,那么盡可能的做好原創(chuàng),再加上對代碼進行合理的優(yōu)化,這不僅能夠降低網(wǎng)頁相似度,同時還能夠優(yōu)化對用戶的體驗,起到一箭雙雕的作用。