背景
今年十一長假過后,國內網站在Alexa上的排名突然經歷了一次大規模集體滑坡,各種謠言開始在網民中流傳,一種比較流行的說法是,Alexa終于開始調整算法來反擊越來越多的中國作弊網站,人們把這看做是Alexa的“正當防衛”,畢竟,一個以排行榜為最大賣點的網站賴以生存的就是它的排名的公正性。
各種傳言都無法解決看客們對Alexa可信度的疑惑,因為國內主流媒體從未針對Alexa的技術進行過深入的分析和報道,而在下面的介紹中,讀者可以看到,或許韓國網站排名過高另有原因,而所謂的Alexa作弊手段也不只是此前一些媒體報道的多次刷新那么簡單,而且,Alexa也有自己非常高明的防作弊手段。不過,本文中所提及的作弊手段與網上隨處可見的“作弊寶典”有本質的不同,所以,Alexa在多大程度上能抵御這種不常見的作弊方式也就很難說了。 Alexa工具條的DNA 要想徹底搞清楚Alexa排名是否可信,必須從技術上對Alexa的全球網站流量監測進行全面的解剖,當然,Alexa從來沒有公布自己的技術細節.
分析情況
現在最新版本的Alexa工具條的運作機理與以往沒有太大的改變,每當用戶以裝有Alexa工具條的IE瀏覽器打開新頁面時,Alexa的一臺服務器(data.alexa.com)都會收到加密的數據包,這個數據包中的核心信息就是十幾個參數,這些參數包括當前網頁地址、頁面打開時間、用戶端顯示分辨率、Alexa工具條版本號、該用戶是否為“亞馬遜”的用戶等,其中有一個重要的隱含參數,經小林分析,認為是Alexa為每個已安裝的工具條自動生成的ID號碼,這個號碼應該是全球惟一的。Alexa可以通過這個ID對每個反饋數據包的發出者進行惟一標識,這是解決PV重復計算問題和防止同一用戶多次刷新作弊的一個重要手段。
這種以編程方式模擬多用戶訪問的作弊方式的實現,最重要的環節就在于對那個Alexa用來惟一標識用戶身份的ID號的生成算法的破解,這需要對足夠多的Alexa工具條進行嗅探,抓取其數據包進行定量的算法分析。估計,國內能做這些事情的人不在少數,只是互聯網這個圈子里的高手們很少去做罷了。
結論
無論出于什么樣的目的,人們出賣Alexa總是希望能從中得到利益,對Alexa的研究越深入,對Alexa的價值理解得越深刻,就越能從中獲益。
*