SEM營銷 / SE0營銷 / SMM營銷技術
善實戰SEO高端人才的智慧結晶
2023-09-10 作者:Zac 來源:SEO每天一貼
最早了解李彥宏超鏈分析專利是在洪波的博客中看到一篇文章:超鏈分析和PageRank的專利問題,才第一次知道百度總裁李彥宏曾經申請并獲得對于超鏈接分析的專利,這份專利申請文件在美國專利局網站看到。李彥宏這個專利申請是在Google申請他們自己的PageRank專利之前的。
由于這兩份專利都是研究網頁鏈接的,而且這兩個專利的發明人是現在兩大搜索引擎的創始人,所以很多人對這兩個技術專利分不大清楚。甚至有的人直覺這兩個專利是相似的或有抄襲嫌疑,這牽扯到兩家公司的核心利益了。這兩份專利我都認真讀了原文,談一下我的看法。
我的理解是,這兩個專利是有相當大的區別的,要解決的問題和實施方法都不一樣,但研究對象是一樣的,都是頁面鏈接。
超鏈分析要解決的是文件與搜索關鍵詞的相關性。李彥宏提出的方法是,除了文件本身肯定要使用關鍵詞外,還需要考慮反向鏈接中的關鍵詞因素。
具體來說,一個文件被索引進數據庫的時候,會連同指向這個文件的超鏈接,以及每個超鏈接使用的錨文字(鏈接文字),一同記錄在案。而關鍵詞也會建立一個數據庫,每個詞連同含有這個詞的超鏈接,以及這些超鏈接所指向的文件一同被記錄在案。
當一個關鍵詞被搜索的時候,含有以關鍵詞為鏈接文字的反向鏈接數目最多的那個文件或網頁,將被作為最相關的結果排在前面。也就是今天SEO們的常識:鏈接錨文字會提高頁面與關鍵詞的相關性。
這是基本思路,當然還有其他變量考慮進去。比如說搜索字符串含有幾個詞的時候,每一個詞都是搜索矢量的一個維度。
這篇專利申請中已經提到了詞干技術,而且提到了不同語言文件的相關性。
在搜索算法中考慮鏈接,主要是鏈接錨文字,是李彥宏的首創,有可能Google創始人提出PR值理論時受到過李彥宏專利的啟發,他們聽過李彥宏的演講,還向李彥宏請教過問題。
Google的PR專利是專注在已經應用了超鏈分析之后還不能解決的問題。在Google的專利申請中,明確提到即使在考慮了指向文件的鏈接及鏈接錨文字之后,搜索引擎還有重要問題需要解決,那就是來自不同文件的鏈接有不同的權重值。
你不能指望來自白宮網站的鏈接和非洲某小鎮上一個學生的個人網站上的一個鏈接,投票值相同。而Google PageRank就是衡量網頁重要性的一個方法。指向一個網頁的鏈接越多,而這些鏈接本身的權重越高,那么這個被指向的網頁的重要性及PageRank就越高。
Google的專利申請當中給出了具體怎樣計算這個被稱為PageRank的重要性指標,簡稱PR值。PR的計算需要進行多個循環的替代計算,才能收斂到一個穩定值,通常PR值收斂到一定精度就可以了,沒必要計算出最終值。
Google PR是與搜索詞無關的,或者說與文件相關性無關的。它只描述某一個文件的重要性或地位。
就目前所有搜索引擎的表現來看,可以肯定這兩個技術都已經被應用在排名算法中了,雖然可能名字不一樣。當然,現在的搜索算法比當初的要復雜多了,超鏈分析和PR值算法現在肯定也經過了很多修改。
公司地址:北京朝陽區團結湖嘉盛中心10層
微信:qq652807263
服務手機:13693193565
E-mail:888@edo2008.com