google的排名演算法
A. 對pagerank演算法的整理
1、首先先大致介紹下pagerank,pagerank是Google排名演算法法則的一部分,是用來標記網頁的等級的一種方法,也是用來衡量一個網頁好壞的唯一標准。pagerank他採用PR值來劃分網頁的受歡迎度,PR值越高,則表名受歡迎度越高,PR最高為10,最低為0,一般PR達到4,則表名網站已經不錯了。PR為4的網站比PR為3的網站不是單純的好一點來形容,他是一種里氏震級的形式來形容的,就好比地震的等級,是指數刻度增長的,因此可以想像PR為10的網站是一種什麼程度。因為這個演算法是Google提出的,因此Google將自己的網站PR值設置為10,所以想要自己的網站PR達到10,是非常難的,如果你的網站可以達到Google的水平。
2、介紹完了pagerank是一個什麼東西後,我們就來介紹一下pagerank如何計算的。
2.1、用個例子來說明下PageRank演算法
在網頁A中有B、C、D三個鏈接,在網頁B中有A、C兩個個鏈接,在網頁C中有D鏈接,網頁D中有A、B兩個鏈接。(可以看出這個圖是強鏈接的,任何一個節點都可以到達另一個節點)。
我們假設每一個鏈接訪問的概率是相同的,為了計算方便我們將每一個網頁的PageRank設置為1。
先給出計算公式
PR(pj) 表示網頁 pj 的 PageRank 得分,L(pj) 表示網頁 pj 的出鏈接數量,1/L(pj) 就表示從網頁 pj 跳轉到 pi 的概率。
所以我們來計算第一次迭代後的PR值:
PR(A)=PR(B)/2+PR(D)/2
PR(B)=PR(A)/3+PR(D)/2
PR(C)=PR(A)/3+PR(B)/2
PR(D)=PR(A)/3+PR(C)/1
PR(A)+PR(B)+PR(C)+PR(D)=1
PR(A)=0.265, PR(B)=0.235, PR(C)=0.206, PR(D)=0.294
通過上面的公式在不斷的進行迭代,可以得到一個收斂值,大概是在(0.265,0.235,2.206,0.294)附近。
2.2看完公式之後,我們來考慮倆種特殊的情況
2.2.1終止問題
上面過程要滿足收斂性,需要具備一個條件:圖是強連通的,即從任意網頁可以到達其他任意網頁。
互聯網中存在網頁不滿足強連通的特性,因為有一些網頁不指向任何網頁,按照上面公式迭代計算下去,導致前面累計得到的轉移概率被清零,最終得到的概率分布向量所有元素幾乎都為0。
假設把上面圖中C到D的鏈接丟掉,C變成了一個終止點,得到下面這個圖:
轉移矩陣M為:
不斷迭代,最終得到所有元素都為0。
2.2.2 、陷阱問題
陷阱問題:是指有些網頁不存在指向其他網頁的鏈接,但存在指向自己的鏈接。比如下面這個圖:
這種情況下,PageRank演算法不斷迭代會導致概率分布值全部轉移到c網頁上,這使得其他網頁的概率分布值為0,從而整個網頁排名就失去了意義。如果按照上面圖則對應的轉移矩陣M為:
不斷迭代,最終得倒如下結果:
為了解決終止點問題和陷阱問題 ,下面需要對演算法進行改進。假設選取下一個跳轉頁面時,既不選 當前頁面 ,也不選 當前網頁上的其他鏈接 ,而是以一定概率跳轉到其他不相關網頁,那麼上面兩個問題就能得到很好的解決,這就是 完整 PageRank 演算法思想 。
N表示的時網頁鏈接的個數,α表示不進行隨機跳轉的概率。
利用上面公式繼續迭代下去,直到收斂,得到最終rank值。
PageRank 的計算是采樣迭代法實現的:一開始所有網頁結點的初始 PageRank 值都可以設置為某個相同的數,例如 1,然後我們通過上面這個公式,得到每個結點新的 PageRank 值。每當一張網頁的 PageRank 發生了改變,它也會影響它的出鏈接所指向的網頁,因此我們可以再次使用這個公式,循環地修正每個網頁結點的值。由於這是一個馬爾科夫過程,所以我們能從理論上證明,所有網頁的 PageRank 最終會達到一個穩定的數值。整個證明過程很復雜,這里我們只需要知道這個迭代計算的過程就行了。
3、基於本文主題叫做數學建模之美,也是一篇讀後感,所以我們還是寫一下感受吧。
這個演算法的優美之處,就在於巧妙地將網頁內容的好壞,根據鏈接數的形式,用PR值進行了排名,它不僅激發網頁越做越好,也促進了各個網頁之間的聯系。
同時在結構方面,他將一個復雜的問題,進行了簡單的類比,用圖結構的形式代替鏈接的形式,用戶訪問的順序,也就是節點的走向。所以數學之美就在於他是非常的簡單,用簡單的原理,向我們展示了一個復雜的問題。
B. Google,Yahoo,百度等主流搜索引擎的排名機制是什麼
Google、Bai和Yahoo等搜索引擎的排名機制?
排名機制,只是搜索引擎比較重要的排名因素,以及搜索引擎對各個元素的重視程度。
標題,關鍵字,描述的比重,以及關鍵詞密度,站內鏈接,站外鏈接的比重分配!
網路注重站內,雅虎GG注重站外
GOOGLE:針對網頁的排名。比較注重反向連接的數量和質量,搜索結果非常真實,能體現出網站的質量.
網路:是真對網站的,所以整站內容的關聯性很重要,在就是網頁的數量和大小.
GOOGLE和網路不同的地方就是GOOGLE是真對網頁的排名,BAIDU是針對整站的排名. 如果你做一個小網站內容針對性特別強的話,你這個站的關鍵詞一定排得非常好,如果做門戶站內容比較繁雜建議開二級域名來做分類的內容。
YAHOO:如果在GOOGLE里沒有較好的收錄恐怕在YAHOO里也是不會有排名了. GOOGEL有很密切的聯系,使用同一個目錄資料庫。
MSN:目前在國內占的搜索分額非常少,但是他也有自己的特別,MSN在網站上沒明確的寫到他們願意收錄HTML等靜態頁面,如果頁面是靜態並標題關鍵詞明顯清晰就很容易獲得好的排名。
至於QQ,SOGOU,新浪,114等等搜索引擎進入搜索業務比較晚,技術不夠成熟,基本上以上幾個搜索做了其他的也會排上去的。
網路將自己的目標定位於打造中國人自己的中文搜索引擎,並願為此目標不懈的努力奮斗。
Google的使命是整合全球信息,使人人皆可訪問並從中受益。
google、網路和yahoo三大搜索引擎蜘蛛的爬行特點又有不同:
GOOGLE蜘蛛相對穩定,爬行頻率比較平均,也就造成了我們平時說的GOOGLE對站點收錄速度比較慢;BAIDU蜘蛛爬行頻率最高,對頻繁更新的站會給予高度關注,收錄更新比較快,但有時候會對伺服器造成一定負擔。
YAHOO蜘蛛數量巨大,平均工作效率不高,而且收錄結果中關鍵字對應不好。
C. PR值是指什麼
PR值全稱為PageRank(網頁級別),用來表現網頁等級的一個標准,級別分別是0到10,是Google用於評測一個網頁「重要性」的一種方法。
PR值,即PageRank,網頁的級別技術。取自Google的創始人Larry
Page,它是Google排名運演算法則(排名公式)的一部分,用來標識網頁的等級/重要性。級別從0到10級,10級為滿分。PR值越高說明該網頁越受歡迎(越重要)。例如:一個PR值為1的網站表明這個網站不太具有流行度,而PR值為7到10則表明這個網站非常受歡迎(或者說極其重要)。
D. wish上賣什麼好google的排名演算法
只能回答你第一個問題:
1. wish和facebook分手了,沒有了臉書,wish流量和訂單大跌,我朋友開的店鋪比去年的差很多;反正wish上賣小東西比較合適
2. google排名用的是演算法是pagerank,以前的CEO拉里佩奇(Larry page)開發的演算法,具體的只有谷歌知道
E. 了解google用來對網頁進行排序的pagerank演算法,明確哪些因素會影響網頁的pager
一、網頁排名和谷歌演算法的誕生
在谷歌誕生之前那段時間,流行的網頁排名演算法都很類似,它們都使用了一個非常簡單的思想:越是重要的網頁,訪問量就會越大,許多大公司就通過統計網頁的訪問量來進行網頁排名。但是這種排名演算法有兩個很顯著的問題:
1、因為只能夠抽樣統計,所以統計數據不一定準確,而且訪問量的波動會比較大,想要得到准確的統計需要大量的時間和人力,還只能維持很短的有效時間。
2、訪問量並不一定能體現網頁的「重要程度」,可能一些比較早接觸互聯網的網民還記得,那時有很多人推出了專門「刷訪問量」的服務。
那有沒有更好的方法,不統計訪問量就能夠為網頁的重要度排序呢?
就是在這種情況下,1996年初,谷歌公司的創始人,當時還是美國斯坦福大學研究生的佩奇和布林開始了對網頁排序問題的研究。
在1999年,一篇以佩奇為第一作者的論文發表了,論文中介紹了一種叫做PageRank的演算法(具體演算法可查看馬海祥博客《pr值是什麼》的相關介紹),這種演算法的主要思想是:越「重要」的網頁,頁面上的鏈接質量也越高,同時越容易被其它「重要」的網頁鏈接。
於是,演算法完全利用網頁之間互相鏈接的關系來計算網頁的重要程度,將網頁排序徹底變成一個數學問題,終於擺脫了訪問量統計的框框。
二、模擬PageRank演算法的運行過程
在詳細講述這個演算法之前,不妨讓我們用一個游戲,先來簡單模擬一下PageRank演算法的運行過程,以便讀者更好地理解。
三兄弟分30顆豌豆,起初每人10顆,他們每次都要把手裡的豌豆全部平均分給自己喜歡的人,下圖表示了三兄弟各自擁有的初始豌豆數量,以及相互喜歡的關系(箭頭方向表示喜歡,例如老二喜歡老大,老大喜歡老二和老三)。
第一次分配後,我們會得到結果如下:
就這樣,讓游戲一直進行下去,直到他們手中的豌豆數不再變化為止。
那麼這個游戲到底是否可以結束呢,如果可以,最終的結果又是什麼樣的?
在此我們用電腦模擬了這個過程,得出的結果是:老大和老二的盤子里各有12顆豌豆,而老三的盤子里有6顆豌豆,這時候無論游戲怎麼進行下去,盤子里的豌豆數量都不會再變化。
看到這里,讀者可能會問:這個游戲和網頁排序有什麼關系?
實際上,PageRank會給每個網頁一個數值,這個數值越高,就說明這個網頁越「重要」。
而剛剛的游戲中,如果把豌豆的數量看作這個數值(可以不是整數),把孩子們看作網頁,那麼游戲的過程就是PageRank的演算法,而游戲結束時豌豆的分配,就是網頁的PageRank值。
三、PageRank演算法的數學模型
不同於之前的訪問量統計,PageRank求解了這樣一個問題:一個人在網路上瀏覽網頁,每看過一個網頁之後就會隨機點擊網頁上的鏈接訪問新的網頁。
如果當前這個人瀏覽的網頁x已經確定,那麼網頁x上每個鏈接被點擊的概率也是確定的,可以用向量Nx表示。
在這種條件下,這個人點擊了無限多次鏈接後,恰好停留在每個網頁上的概率分別是多少?
在這個模型中,我們用向量Ri來表示點擊了i次鏈接之後可能停留在每個網頁上的概率(則為一開始就打開了每個網頁的概率,後面我們將證明的取值對最終結果沒有影響)。很顯然R i的L1範式為1 ,這也是PageRank演算法本身的要求。
仍以上面的游戲為例,整個瀏覽過程的一開始,我們有:
其中,A表示每一次點擊鏈接概率的矩陣,A的第i列第j行的含義是如果當前訪問的網頁是網頁i,那麼下一次點擊鏈接跳轉到網頁j的概率為 。
這樣設計矩陣A的好處是,通過矩陣A和向量相乘,即可得出點擊一次鏈接後每個網頁可能的停留概率向量。例如,令,可以得到點擊一次鏈接後停留在每個網頁的概率:
之後一直迭代下去,有:
對於上面的例子,迭代結果如下圖:
由上圖我們可以看到,每個網頁停留的概率在振盪之後趨於穩定。
在這種穩定狀態下,我們可以知道,無論如何迭代,都有,這樣我們就獲得了一個方程:
而整個迭代的過程,就是在尋求方程R = AR的解,而無論是多少,迭代無限多次之後,一定會取得令R = AR成立的R值,整個求解R的過程,就如同一個人在一張地圖上的不同位置之間隨機地行走一樣,所以被稱為「隨機行走模型」。
隨機行走模型有一個顯著的特點,那就是每一次迭代的結果只與前一次有關,與更早的結果完全無關,這種過程又被稱為馬爾可夫過程(Markov Process)或馬爾可夫鏈(Markov Chain)。
馬爾可夫過程的數學定義是:如果對於一個隨機變數序列, 其中X n表示時間n的狀態及轉移概率P,有:
即只受的影響,則此過程成為馬爾可夫過程。其中稱作「一步轉移概率」,而兩步、三步轉移概率則可以通過一步轉移概率的積分求得。
當狀態空間有限時,轉移概率可以用用一個矩陣A來表示,稱作轉移矩陣(transition matrix),此時轉移概率的積分即為矩陣的冪,k步轉移概率可以用表示,這也是隨機行走模型中的情況,而對於一個正的(每個元素都為正的)轉移矩陣A ,可以證明一定有:
這就完整解釋了為什麼的取值對最終結果沒有影響。
四、修正「懸掛網頁」帶來的不良影響
但是這里有一個問題:即便的取值對最終結果沒有影響,用R作為網頁排序的依據是否真的合理?
在馬海祥看來,這個其實並不合理,因為當一個網頁只有鏈入鏈接沒有鏈出鏈接的時候,這個網頁就會像一個「黑洞」一樣,將同一個連通子圖中其它網頁流向它的PageRank慢慢「吞掉」(因為演算法中虛擬的用戶一旦進入那樣的網頁,就會由於沒有對外鏈接而永遠停留在那裡),這種網頁我們稱之為「懸掛網頁」(Dangling Link)。
這種「黑洞」效應是如此顯著,以至於在一個連通性良好的互聯網上,哪怕只有一個「懸掛網頁」,也足以使整個互聯網的網頁排序失效,可謂是「一粒老鼠屎壞了一鍋粥」。
為了解決這個問題,佩奇和布林進行了修正,他們意識到,當用戶訪問到「懸掛網頁」時,都不可能也不應該就停留在了這個頁面,而是會自行訪問其它網頁。
雖然對每個用戶來說,自行訪問的網頁與各人的興趣有關,但馬海祥覺得從平均意義上來講,佩奇和布林假定用戶將會在整個互聯網上隨機選取一個網頁進行訪問。
所以他們給PageRank演算法加入了一個新的向量E,它的作用是,按照其中所描述的比例來向全部網頁分配懸掛網頁每一次「吞掉」的PageRank。
這樣,相當於為懸掛網頁添加了鏈向網路上全部網頁的鏈接,避免了懸掛鏈接的出現。
以上就是谷歌背後最重要的PageRank演算法奧秘,與以往那種憑借關鍵詞出現次數所作的排序不同,這種由所有網頁的相互鏈接所確定的排序是不那麼容易做假的,因為做假者再是把自己的網頁吹得天花亂墜,如果沒有真正吸引人的內容,別人不鏈接它,一切就還是枉然。
而且「佩奇排序」還有一個重要特點,那就是它只與互聯網的結構有關,而與用戶具體搜索的東西無關,這意味著排序計算可以單獨進行,而無需在用戶鍵入搜索指令後才臨時進行,谷歌搜索的速度之所以快捷,在很大程度上得益於此。
馬海祥博客點評:
最後,我要強調的一點是,雖然PageRank是Google搜索結果排序的重要依據,並以此發家,不過它並不是全部依據,實際上,Google發展到現在,已同時用了數百種不同的演算法來確定最終顯示給用戶的搜索結果順序。
F. 深圳SEO歷史上谷歌Google推出了哪些演算法
馬加比更新(Maccabees Update)
上線時間:2017年12月12號
受影響網站:刻意為各種關鍵片語合建立大量著陸頁,比如「地名A+服務a「、」地名A+服務b」、「地名B+服務a」等等,為了覆蓋這些關鍵詞,製造大量頁面,質量通常不會高。
馬加比這個名字是 SERoundtable.com的Barry Schwartz起的,不是Google官方給的名字,因為Google貌似不會再公布演算法更新了,更不要說起名字了。Barry Schwartz起這個名字是因為這次更新發生在猶太人的光明節期間,光明節是紀念馬加比家族的。Google在某種程度上確認了這次更新,不過只是說,在這段時間上線了幾個小更新,是提高相關性日常工作的一部分。
移動優先索引(Mobile First Index)
上線時間:2017年10月中旬
受影響網站:移動優先索引指的是Google優先索引網站移動版本,並作為排名依據。以前都是索引PC版本並計算排名的。移動優先索引Google在2016年底就開始宣傳了,但一直沒有推出,估計影響面比較大。2017年10月中旬左右,Google透露一小部分網站已經開始轉為移動優先索引。
貓頭鷹更新(Project Owl)
公布時間:2017年4月25號
受影響網站:虛假新聞內容,如編造的假新聞,極度偏見、煽動仇恨,謠言等。參見以前寫的關於貓頭鷹演算法的帖子。
弗雷德更新(Fred Update)
上線時間:2017年3月8號
受影響網站:廣告過多的低質量內容站,這類網站之所以存在,就是為了放 Adsense之類的廣告,並沒有提供給用戶更多價值。
為什麼叫Fred更新呢?因為SEO們問Google員工Gary Illyes這次更新叫啥名字時,Gary Illyes隨便給了個名字,貌似是他養的魚的名字,為什麼想起這條魚的名字呢?因為Gary Illyes剛給這條魚拍了張照片,就是右邊這張。Gary Illyes說,以後除非另行說明,不然所有更新都叫Fred了。就這么任性,就這么草率。
移動頁面干擾插頁懲罰演算法(Intrusive Interstitial Penalty)
上線時間:2017年1月10號
受影響網站:這個懲罰演算法針對移動頁面:擋住主題內容的彈窗,干擾用戶訪問的大幅插頁式廣告,用戶需要關掉插頁才能看到頁面實際內容,有時候需要等5-10秒才能關掉。不過據統計,被懲罰的網站並不多。
企鵝更新4.0(Penguin 4.0)
上線時間:2016年9月23號,10月12號左右完成
受影響網站:和以前的企鵝更新一樣,受影響的是有低質量外鏈的網站。Penguin 4.0是最後一次企鵝系列演算法更新了,因為企鵝演算法以後成為核心排名演算法的一部分,實時更新。
另外,以前的企鵝更新是懲罰網站,4.0是不計算低質量外鏈,降低負面SEO的可能性。
移動友好演算法2(Mobile Friendly Algorithm 2)
上線時間:2016年4月21號
受影響網站:2015年4月21號第一次Google移動友好演算法的一次更新,使更多移動友好頁面能被用戶看到。
APP安裝插頁廣告懲罰(APP Install Interstitial Penalty)
上線時間:2015年11月2號
受影響網站:頁面會彈出大幅、遮擋主體內容的插頁,要求用戶下載APP,這種頁面被認為不移動友好,在移動搜索中會被降低排名。頁面可以建議用戶下載APP,但廣告不要大幅甚至全屏,做成頂部banner之類的是沒問題的。
RankBrain
上線時間:消息公布時間是2015年10月26號,通過 Bloomberg的一篇文章。演算法上線時間應該是數月前,2015年上半年。
RankBrain嚴格說來不算是排名演算法,而是以人工智慧為基礎的深入理解用戶查詢詞的系統,尤其是長尾的、不常出現的查詢。2015年剛上線時,15%查詢詞經過RankBrain處理,可能是效果很好,2016年開始所有查詢詞都經過RankBrain處理。RankBrain的例子參考以前的帖子。
被黑網站刪除演算法(Hacked Spam)
上線時間:2015年10月
受影響網站:被黑的網站,包括病毒、引導流量到色情、侵權產品、非法葯物網站等。這些頁面會從搜索結果這直接刪除,所以有時候搜索結果頁面可能只有8、9個結果。以前通常是在搜索結果中標注這個頁面可能被黑了,現在直接刪除了。5%左右的查詢受到影響。檢查自己網站是否被黑還是挺重要的。
熊貓演算法4.2(Panda Update 4.2)
上線時間:2015年7月18號
自2011年推出以來,熊貓演算法經歷了近30次更新,Panda 4.2是最後一次,幾個月才完成。這之後,熊貓演算法成為Google核心演算法的一部分,雖然還會有更新,但不再單獨給名字了。
質量更新(Quality Update)
上線時間:2015年5月1號左右
受影響網站:內容質量低的頁面,但不是熊貓演算法。Google雖然確認了這次更新,但表示,這只是Google經常做的演算法更新之一,調整了評估內容質量的方法,沒什麼特殊的。
移動友好演算法(Mobile Friendly Algorithm)
上線時間:2015年4月21號
受影響網站:在移動搜索中給予移動友好的網站排名提升。也被稱為Mobilegeddon – 天劫演算法。
所謂移動友好,其實沒那麼復雜,用戶能正常在手機訪問頁面就行了,所以字體不要太小,字距行距不要太小,用戶不需要左右拉屏幕,手指頭點擊鏈接時不會點錯地方,速度夠快等等。自己用手機看看自己網站就知道是否移動友好了。也可以參考一下本博客移動SEO的帖子。
移動友好演算法是針對頁面級別的,需要頁面重新抓取、索引後才能判斷是否移動友好。所以演算法本身4月底上線,但受影響的頁面可能不是馬上見到效果。
Google曾經預報說移動友好演算法比熊貓和企鵝更新的影響還要大,但由於Google很早就提醒SEO們移動友好的重要性,很多網站已經做了移動優化,所以這次更新沒有預計的那麼有震撼性。
HTTPS更新(HTTPS Update)
上線時間:2014年8月7號
受影響網站:使用了https的頁面排名會稍微提升一點。Google聲明這只是個很小的排名因素,但事實上對網站採用https起到了很大推動作用。
鴿子更新(Pigeon Update)
上線時間:2014年7月24號
受影響網站:鴿子更新是本地搜索演算法的一次更新,改進了距離和定位排名演算法參數。這個名字不是Google起的,是SearchEngineLand給起的。之所以取「鴿子」這個名字是因為,鴿子會回家,有本地意識。
蜂鳥更新(Hummingbird Algorithm)
上線時間:2013年8月
受影響網站:蜂鳥更新是一次排名演算法的重寫,改進對查詢詞真實意圖的理解,更重要的是未來的擴展性。雖然代碼是完全重寫的,但排名因素及參數大概變化不多,所以上線後基本上SEO行業沒有人注意到。
發薪日貸款演算法(Payday Loan Algorithm)
上線時間:2013年6月13號
受影響網站:針對垃圾和黑帽手法盛行的一些行業的查詢詞重點打擊,如payday loan(發薪日貸款,一種小額、短期、利息高的貸款,一般下個發薪日就還上)、色情等。這些行業常用的作弊手法也經常是非法的。
2014年5月16號,發薪日貸款演算法2.0上線,2014年6月12號,演算法3.0上線。
完全匹配域名懲罰(EMD Update)
上線時間:2012年9月29號
受影響網站:低質量的完全匹配域名(exact match domain)網站,也就是域名與目標關鍵詞完全一樣。URL中包含關鍵詞對排名有一些幫助,所以不少SEO用目標關鍵詞注冊域名。這種域名確實有過好處,但現在內容不行的話可能被懲罰。
DMCA懲罰演算法(DMCA Takedown Penalty)
上線時間:2012年8月13號
受影響網站:DMCA,Digital Millennium Copyright Act,數字千年版權法案,根據這個法案,版權作品被侵權,版權所有人可以向服務商要求刪除侵權內容,服務商可以是主機商,域名注冊商,ISP,以及搜索引擎。DMCA演算法就是對收到很多侵權投訴刪除要求的網站,Google給予排名懲罰。
DMCA Takedown Penalty又被稱為pirate update,海盜演算法。
2014年10月21號,DMCA懲罰演算法上線2.0版本,很多BT種子網站、視頻網站被大幅懲罰。
企鵝更新(Penguin Update)
上線時間:2012年4月24號
受影響網站:Google的官方帖子聲明打擊的是違反Google質量指南的垃圾網站,後續排名變化的分析表明主要受懲罰的是為獲得排名製造大量垃圾外鏈、低質量外鏈的網站。企鵝演算法1.0影響了3.1%英文查詢,3%左右的中文、德文等查詢。
企鵝演算法和熊貓演算法是兩個最著名的Google懲罰性演算法,受到影響的網站范圍大,據調查,60%的SEO反映自己網站被Penguin演算法懲罰了。
企鵝對今天的SEO方法,尤其是外鏈建設方法,產生了很大影響。不僅製造外鏈要非常小心,大部分以前常用的方法現在都被Google明確警告可能會被懲罰,現在SEO們更頭疼的是怎樣刪除低質量外鏈和以前發的垃圾外鏈,這比製造外鏈還困難。
頁面布局懲罰演算法(Page Layout Algorithm)
上線時間:2012年1月
受影響網站:第一屏顯示過多廣告的頁面被降低排名。因此也常被稱為Ads Above The Fold(第一屏廣告)演算法。
1%的查詢詞受影響。被懲罰的網站修改頁面布局後,Google重新抓取、索引,如果頁面用戶體驗已經改善,就會自動恢復。
2012年10月9號,Page Layout 2.0,2014年2月6號,Page Layout 3.0分別上線。
新鮮度更新(Freshness Update)
上線時間:2011年11月3號
受影響網站:Google官方帖子明確表示:更新鮮的內容會被更多展示在搜索結果中,尤其是最近的事件或熱門話題、定期舉辦或發生的事件(如奧運會之類)、經常會更新的信息(如最新產品)。影響了35%的查詢。
當然,這只適用於更需要新鮮信息的查詢,有的查詢並沒有太大實效性,如菜譜,就不必太擔心。
熊貓更新(Panda Update)
上線時間:2011年2月24號
受影響網站:內容低質量的頁面排名被降低,如轉載、抄襲的內容,大量用戶發的垃圾留言、主體內容太少、關鍵詞堆積等等。
熊貓更新打擊面大,影響大致12的查詢結果,對現今SEO方法產生了重要影響。Panda演算法最初是後台計算,集中上線,從2011年上線到2015年融入到核心演算法中,經歷了近30次更新。
熊貓演算法更新最初被SearchEngineLand命名為Farmers Update,內容農場更新,後來Google自己公布了演算法代碼是Panda,和咱們的熊貓沒關系,是Google內部開發此演算法的主要工程師之一的名字叫Panda。
採集懲罰演算法(Scraper Algorithm)
上線時間:2011年1月28號
受影響網站:Matt Cutts的博客帖子公布的這個演算法,採集、抄襲的內容頁面被懲罰,獎勵原出處。2%查詢受影響。
負面評價處理(Negative Review)
上線時間:2010年12月1號
受影響網站:這個演算法是由於 Google的人讀到紐約時報的一篇報道,一位顧客在某商家的體驗很差,所以上網寫了負面評論,但負面評論卻給商家帶來更多鏈接,鏈接又導致商家網站排名上升,帶來更多生意。Google很快採取措施,檢測這類負面評論,降低相應商家排名。
咖啡因更新(Caffeine)
上線時間:2010年6月1號
受影響網站:咖啡因更新是一次索引系統代碼的重寫,新系統比舊系統50%的內容更新,索引數量也更大,更有擴展性,速度更快。原來的索引系統是分層的,有的內容(重要內容)抓取索引更快,有的內容就得等比較長時間。咖啡因系統把網路分成小區塊,持續更新索引庫,發現新頁面,或老頁面上的新內容,直接進入索引庫。
Mayday Update
上線時間:2010年4月28號-5月3號
受影響網站:根據Matt Cutts的視頻說明,Mayday更新主要針對長尾查詢詞,演算法會尋找哪些網站的頁面質量更符合要求。當然這種說明說了也是和沒說差不多。SEO們的觀察是,受影響的主要是大型網站上離首頁點擊距離比較遠、沒什麼外鏈、內容沒有什麼附加價值的頁面 — 很多電商網站的產品頁面就是這樣的,內容是供應商給的,也不大可能有外鏈。
Mayday指的是發生在5月份,不是求救的那個Mayday。
頁面速度因素(Page Speed Ranking Factor)
上線時間:2010年4月
受影響網站:顧名思義,打開速度快的頁面排名會給予提升,雖然幅度不大。速度的測量包括蜘蛛抓取時頁面的反應速度和工具條記錄的用戶打開頁面時間。
2013年6月,Matt Cutts暗示,速度特別慢的頁面可能會被懲罰,不過也不用特別擔心,除非頁面速度慢到一定程度。
Vince/品牌更新(Vince/Brand Update)
上線時間:2009年2月1號
受影響網站:大品牌網站頁面在很多查詢結果中(都是非長尾的大詞)排名顯著提高,所以最初被稱為品牌更新。以前帖子寫過Vince/品牌更新。
Matt Cutts後來解釋,這次更新其實其實只是很小的變化,負責的Google工程師名字叫Vince,所以Google內部代碼名稱是Vince。這個變化並不是刻意針對大品牌,而是提升信任度在排名中的作用,而信任度、質量、鏈接這些方面,大品牌更有優勢,所以表現出來的效果好像是大品牌頁面被提升。
Dewey Update
上線時間:2008年3月
受影響網站:不明,SEO行業觀察到排名劇烈變動,但沒有找到明顯規律。Dewey這個名字的來源是因為Matt Cutts在 webmasterworld論壇里徵求這次演算法更新的反饋意見,站長需要在反饋中標明Dewey這個詞,可能是Google內部的識別代碼。
大爸爸(Big Daddy)
上線時間:2005年12月-2006年3月
大爸爸是一次Google演算法基礎架構的重寫,解決了網址規范化、301/302轉向等技術問題。大爸爸是一個數據中心一個數據中心更新的,不是同時上線的。
大爸爸這名字怎麼來的?據Matt Cutts帖子說,2005年12月的Pubcon會議上,Matt Cutts徵求大家對這次更新的反饋,Matt Cutts知道更新已經在一個數據中心上線了,所以問大家有什麼好名字來指這個數據中心,一位站長說,叫BigDaddy吧,他孩子就這么叫他的,Matt Cutts覺得挺好,就叫這個名字了。
我當年開始寫SEO每天一貼就是大爸爸完成更新那段時間,第3篇帖子就是介紹大爸爸更新情況。Robin同志給我的第一個留言就在那篇帖子上,沙發,後來才有了點石,和很多中國SEO行業的故事。
Jagger Update
上線時間:2005年9-11月
受影響網站:Jagger分3個階段上線,所以有Jagger1, Jagger2, Jagger3的名字。Jagger更新主要打擊低質量鏈接,如交換鏈接、鏈接農場、買賣鏈接等。
早期的Google演算法更新基本上都是webmasterworld命名的,Jagger也是webmasterworld創始人Brett Tabke起的名字,下面提到的更新名稱大多是他們命名的。但貌似Jagger是最後一個,後來的名字大多是Google自己公布的了。
Bourbon Update
上線時間:2005年5月
受影響網站:早期Google更新往往沒有官方信息,所以針對的是哪些網站經常不明,只是監測到排名有比較大變化。Bourbon一般認為與網址規范化有關。
Bourbon這個名字也是webmasterworld起的,原因是webmasterworld即將在新奧爾良舉行一個行業會議,Bourbon是新奧爾良的一條著名老街道。
Allegra Update
上線時間:2005年2月
受影響網站:不明確,或者說范圍廣泛,包括低質量外鏈、關鍵詞堆積、過度優化等。
公布支持nofollow
上線時間:2005年1月
現在SEO對nofollow肯定都很熟悉了,包括網路,所有主流搜索引擎都支持nofollow。還不知道的請參考以前關於nofollow的帖子。
Brandy Update
上線時間:2004年2月
受影響網站:鏈接錨文字作用提高,鏈接需要來自好鄰居的概念第一次被提出來。索引庫增長,抓取索引了很多新的鏈接,一些網站獲得了更高權威度。
弗羅里達更新(Florida Update)
上線時間:2003年11月
受影響網站:弗羅里達更新是早期最著名的Google演算法更新,影響面大,受影響的以商業意圖明顯的詞為主,一些靠搜索流量的小公司倒閉,有的SEO公司因此陷入困境,因為客戶網站排名下降,不續費了。弗羅里達更新的後果大到,Google曾經承諾,以後不在年底上線這么大的更新了,以免劇烈影響很多商家的聖誕季銷售業績。
Florida Update打擊了一系列不自然的優化方法,包括隱藏文字、關鍵詞堆積、鏈接農場、大量交換鏈接、過度優化。Florida徹底改變了SEO,可以說是現在SEO方法的起點。
Florida也是webmasterworld命名的,因為他們的命名方法該排到字母F打頭了(為什麼到了F打頭,見下面Boston更新說明),而第二年2月他們要在弗羅里達的奧蘭多舉行Pubcon大會,所以就用了Florida。
Update Fritz
上線時間:2003年7月
Fritz更新是Google轉為每天持續小幅更新索引的開始,這種更新方法又被稱為everflux。
Update Fritz這個名字是Matt Cutts在他2006年的博客帖子里提到的Google內部名稱,不是webmasterworld命名系列裡的。
Esmeralda Update
上線時間:2003年6月1號
這是早期每個月發生一次的Google Dance的最後一次。這次更新之後,Google演算法更新改為小幅、持續性的,當然這是相對Google Dance每個月一次、持續數天、排名劇烈波動而言。准確地說,Google Dance是索引更新,不是演算法更新。Esmeralda更新之後,Google就不再Dance了。
Dominic Update
上線時間:2003年5月1號
早期Google Dance的一次。Dominic也是webmasterworld命名,名稱來源於參加Boston Pubcon大會時大家常去的一家披薩飯館。
Cassandra Update
上線時間:2003年4月1號
Brett Tabke和webmasterworld第一次特意給Google更新起名字。既然第一個名字是Boston,是個男名,這次應該是C打頭的女名,大家投票,Cassandra勝出,沒有其它特別意義。
Boston Update
上線時間:2003年2月1號
2003年波士頓舉行的SES大會上,Google員工公布了這次更新,為了和其它Google Dance以示區別,取名Boston。
webmasterworld的創始人Brett Tabke就想,給更新取名字是個挺好的主意,所以就效仿台風的命名方法給Google更新取名,按字母排序,男名女名間隔,也得到了Google的首肯。所以早期的Google演算法更新大多是webmasterworld命名的。
Google Dance
早期Google索引庫每個月更新一次,是線下計算,然後集中上線。由於數據量大,需要一個數據中心一個數據中心地上線,不是同時上線的。在更新期間,用戶這分鍾訪問的是一個數據中心,下一分鍾可能訪問的是另一個數據中心,看到的搜索結果可能有很大差別,因此被稱為Google Dance。
從2000年7月開始,webmasterworld每個月開一個新帖,討論每一次Google Dance情況,一直到2003年2月的Boston更新第一次有了名稱,以前的Google Dance都是沒有名字的。這里是當年Google Dance更新討論的大列表。
G. 什麼是PageRank技術
它是Google排名運演算法則(排名公式)的一部分,是Google用於用來標識網頁的等級/重要性的一種方法,是Google用來衡量一個網站的好壞的唯一標准。在揉合了諸如Title標識和Keywords標識等所有其它因素之後,Google通過PageRank來調整結果,使那些更具「等級/重要性」的網頁在搜索結果中另網站排名獲得提升,從而提高搜索結果的相關性和質量。 PageRank(網頁級別),2001年9月被授予美國專利,專利人是Google創始人之一拉里·佩奇 PageRank專利人——拉里·佩奇 (Larry Page)。因此,PageRank里的page不是指網頁,而是指佩奇,即這個等級方法是以佩奇來命名的。它是Google排名運演算法則(排名公式)的一部分,是Google用於用來標識網頁的等級/重要性的一種方法,是Google用來衡量一個網站的好壞的唯一標准。在揉合了諸如Title標識和Keywords標識等所有其它因素之後,Google通過PageRank來調整結果,使那些更具「等級/重要性」的網頁在搜索結果中另網站排名獲得提升,從而提高搜索結果的相關性和質量。其級別從1到10級,10級為滿分。PR值越高說明該網頁越受歡迎(越重要)。例如:一個PR值為1的網站表明這個網站不太具有流行度,而PR值為7到10則表明這個網站非常受歡迎(或者說極其重要)。一般PR值達到4,就算是一個不錯的網站了。Google把自己的網站的PR值定到10,這說明Google這個網站是非常受歡迎的,也可以說這個網站非常重要。 Google的PageRank根據網站的外部鏈接和內部鏈接的數量和質量倆衡量網站的價值。PageRank背後的概念是,每個到頁面的鏈接都是對該頁面的一次投票,被鏈接的越多,就意味著被其他網站投票越多。這個就是所謂的「鏈接流行度」——衡量多少人願意將他們的網站和你的網站掛鉤。PageRank這個概念引自學術中一篇論文的被引述的頻度——即被別人引述的次數越多,一般判斷這篇論文的權威性就越高。 Google有一套自動化方法來計算這些投票。Google的PageRank分值從0到10;PageRank為10表示最佳,但非常少見,類似里氏震級(Richter scale),PageRank級別也不是線性的,而是按照一種指數刻度。這是一種奇特的數學術語,意思是PageRank4不是比PageRank3好一級——而可能會好6到7倍。因此,一個PageRank5的網頁和PageRank8的網頁之間的差距會比你可能認為的要大的多。 PageRank較高的頁面的排名往往要比PageRank較低的頁面高,而這導致了人們對鏈接的著魔。在整個SEO社區,人們忙於爭奪、交換甚至銷售鏈接,它是過去幾年來人們關注的焦點,以至於Google修改了他的系統,並開始放棄某些類型的鏈接。比如,被人們廣泛接受的一條規定,來自缺乏內容的「link farm」(鏈接工廠)網站的鏈接將不會提供頁面的PageRank,從PageRank較高的頁面得到鏈接但是內容不相關(比如說某個流行的漫畫書網站鏈接到一個叉車規范頁面),也不會提供頁面的PageRank。Google選擇降低了對PageRank的更新頻率,以便不鼓勵人們不斷的對其進行監測。 Google PageRank一般一年更新四次,所以剛上線的新網站不可能獲得PR值。你的網站很可能在相當長的時間裡面看不到PR值的變化,特別是一些新的網站。PR值暫時沒有,這不是什麼不好的事情,耐心等待就好了。 為您的網站獲取外部鏈接是一件好事,但是無視其他SEO領域的工作而進行急迫的鏈接建設就是浪費時間,要時刻保持一個整體思路並記住以下幾點: ·Google的排名演算法並不是完全基於外部鏈接的 ·高PageRank並不能保證Google高排名 ·PageRank值更新的比較慢,今天看到的PageRank值可能是三個月前的值 因此我們不鼓勵刻意的去追求PageRank,因為決定排名的因素可以有上百種。盡管如此,PageRank還是一個用來了解Google對您的網站頁面如何評價的相當好的指示,建議網站設計者要充分認識PageRank在Google判斷網站質量中的重要作用,從設計前的考慮到後期網站更新都要給予PageRank足夠的分析,很好的利用。我們要將PageRank看作是一種業余愛好而不是一種信仰。 pagerank原理 通過對由超過 50,000 萬個變數和 20 億個詞彙組成的方程進行計算,PageRank 能夠對網頁的重要性做出客觀的評價。PageRank 並不計算直接鏈接的數量,而是將從網頁 A 指向網頁 B 的鏈接解釋為由網頁 A 對網頁 B 所投的一票。這樣,PageRank 會根據網頁 B 所收到的投票數量來評估該頁的重要性。 此外,PageRank 還會評估每個投票網頁的重要性,因為某些網頁的投票被認為具有較高的價值,這樣,它所鏈接的網頁就能獲得較高的價值。重要網頁獲得的 PageRank(網頁排名)較高,從而顯示在搜索結果的頂部。Google 技術使用網上反饋的綜合信息來確定某個網頁的重要性。搜索結果沒有人工干預或操縱,這也是為什麼 Google 會成為一個廣受用戶信賴、不受付費排名影響且公正客觀的信息來源。 其實簡單說就是民主表決。打個比方,假如我們要找李開復博士,有一百個人舉手說自己是李開復。那麼誰是真的呢?也許有好幾個真的,但即使如此誰又是大家真正想找的呢?:-) 如果大家都說剛從 Google 離職的那個是真的,那麼他就是真的。 在互聯網上,如果一個網頁被很多其它網頁所鏈接,說明它受到普遍的承認和信賴,那麼它的排名就高。這就是 Page Rank 的核心思想。 當然 Google 的 Page Rank 演算法實際上要復雜得多。比如說,對來自不同網頁的鏈接對待不同,本身網頁排名高的鏈接更可靠,於是給這些鏈接予較大的權重。Page Rank 考慮了這個因素,可是現在問題又來了,計算搜索結果的網頁排名過程中需要用到網頁本身的排名,這不成了先有雞還是先有蛋的問題了嗎? Google 的兩個創始人拉里·佩奇 (Larry Page )和謝爾蓋·布林 (Sergey Brin) 把這個問題變成了一個二維矩陣相乘的問題,並且用迭代的方法解決了這個問題。他們先假定所有網頁的排名是相同的,並且根據這個初始值,算出各個網頁的第一次迭代排名,然後再根據第一次迭代排名算出第二次的排名。他們兩人從理論上證明了不論初始值如何選取,這種演算法都保證了網頁排名的估計值能收斂到他們的真實值。值得一提的事,這種演算法是完全沒有任何人工干預的。 理論問題解決了,又遇到實際問題。因為互聯網上網頁的數量是巨大的,上面提到的二維矩陣從理論上講有網頁數目平方之多個元素。如果我們假定有十億個網頁,那麼這個矩陣 就有一百億億個元素。這樣大的矩陣相乘,計算量是非常大的。拉里和謝爾蓋兩人利用稀疏矩陣計算的技巧,大大的簡化了計算量,並實現了這個網頁排名演算法。今天 Google 的工程師把這個演算法移植到並行的計算機中,進一步縮短了計算時間,使網頁更新的周期比以前短了許多。 網頁排名的高明之處在於它把整個互聯網當作了一個整體對待。它無意識中符合了系統論的觀點。相比之下,以前的信息檢索大多把每一個網頁當作獨立的個體對待,很多人當初只注意了網頁內容和查詢語句的相關性,忽略了網頁之間的關系。 今天,Google 搜索引擎比最初復雜、完善了許多。但是網頁排名在 Google 所有演算法中依然是至關重要的。在學術界, 這個演算法被公認為是文獻檢索中最大的貢獻之一,並且被很多大學引入了信息檢索課程 (Information Retrieval) 的教程。 一般人簡稱 RP值
H. google的排名規則是怎麼樣的,在google做推廣應該選怎樣的方式
google排名並不是簡單的按某項指標來排名的,它的排名關繫到網站的內部結構,關鍵詞的推廣,網站的流量,外鏈量等關鍵因素結合起來就算的。而且google是全球最大的搜索引擎,它的技術可想而知,如果一個小小的代理商可以決定它的排名的話那便使胡扯!而且google和網路不同,網路的競價內幕你可以看看前段時間的新聞。google的搜索引擎排名是廣告少,這個你可以進去看看,而且非常遵循規則。所以相對來說是比較公平的。
還有,大陸的google是退出了,所以你上google的什麼域名後面會自動加多個。hk,也就算跳轉到香港的伺服器去了。如果說你要做付費推廣,那麼它的付費排名也不是說你想要什麼名次都有的,不同的域名獲得的排名名次也不同。
如果是長期的銷售網站,建議還是自己做seo。
希望可以幫到您!