本文介紹Google和百度兩大搜索引擎的網頁收錄習慣、網頁排名習慣等,幫助站長合理優化自己的網頁,達到Google百度兩面笑的目的。
Google搜索引擎習慣
Google作為全球最大的多語言搜索引擎在發展歷史過程中形成了自己的網頁收錄習慣,也建立起自己的一套標準。研究Goolge收錄網頁的習慣有利于更好迎合Google搜索引擎的口味,達到提高網頁收錄量和收錄排名的目的。
我們暫且不研究Google對其他語言的收錄,就漢語而言,Google收錄有以下特點:
1、敏感度較高,反應較快
Google對新建的網站具有較高的查知性,當然,新建的網站必須要有外部鏈接或者向Google遞交過網站登錄信息。否則,即使Google的搜索技術再厲害,一個只有站長一個人看得見的網站是很難被Google發現的。Google收錄新建網站的兩個途徑是:第一,通過網站的外部鏈接;第二,通過向Google提交網站登錄數據。一般而言,后者的收錄速度相對較快,而前者則要視Google對新建網站的外部鏈接網站的收錄頻率而定。如果Google對外部鏈接網站的評價高、收錄頻率高那么其發現新站的速度也相應地高,新建網站被收錄的日期就會被提前。
2、并重相關性和重要性
Google
使用 PageRank
技術檢查整個網絡鏈接結構,并確定哪些網頁重要性最高。然后進行超文本匹配分析,以確定哪些網頁與正在執行的特定搜索相關。在綜合考慮整體重要性以及與特定查詢的相關性之后,Google
才將最相關最可靠的搜索結果放在首位。這也是Google收錄網頁的特點之一。
3、變化較快、機動性較高
Google 漫游器會定期抓取
Web,將大量網頁列入索引。稍后完成的下一次抓取會注意到新網站、對現有網站的更改以及失效的鏈接,并對內容的變化在搜索結果中加以調整。
4、較重視鏈接的文字描述
Google會將鏈接的文字描述作為關鍵詞加以索引,所以我們在作友情鏈接時千萬要仔細設計鏈接的文字描述,使之既符合網站的定位又不失相關性,以此博得Google的信任。
5、較重視網頁標記的描述
大多數時候Google顯示搜索結果時會把網頁的Deion顯示出來,并占有較重的篇幅。
Google使用的技術:
PageRank 技術:PageRank 能夠對網頁的重要性做出客觀的評價。PageRank 并不計算直接鏈接的數量,而是將從網頁 A 指向網頁 B
的鏈接解釋為由網頁 A 對網頁 B 所投的一票。這樣,PageRank 會根據網頁 B
所收到的投票數量來評估該頁的重要性。
超文本匹配分析:Google 的搜索引擎同時也分析網頁內容。然而,Google
的技術并不采用單純掃描基于網頁的文本(網站發布商可以通過元標記控制這類文本)的方式,而是分析網頁的全部內容以及字體、分區及每個文字精確位置等因素。Google
同時還會分析相鄰網頁的內容,以確保返回與用戶查詢最相關的結果。
百度搜索引擎收錄習慣
百度是全球最大的中文搜索引擎,對中文網頁的搜索技術在某種程度上領先于Google,百度在某些方面與Google有相同或相似之處外它還有以下特點:
1、較重視第一次收錄印象
網站給百度的第一印象比較重要,相對Google而言,百度搜索引擎的人為參與度較高,也就是說在某些層面上可能由人來決定是否收錄網頁而不是由機器來決定。所以,網站在登錄百度搜索引擎之前最好把內容做得豐富點、原創內容多一點、網頁關鍵詞與內容的相關度高一點,這樣才能給百度較好的初次印象。
2、對網頁的更新較敏感
百度對網頁的更新相對Google而言更加敏感,可能這與百度的本土性格有關。百度搜索引擎每周更新,網頁視重要性有不同的更新率,頻率在幾天至一月之間。所以在百度的搜索結果中基本上都標明了收錄時間。
3、較重視首頁
百度對首頁的重視程度要比Google高得多,這與上面提到的“較重視第一次收錄印象”一脈相承。百度在顯示搜索結果時也常常把網站首頁顯示出來,而不具體到某個內容頁(當其認為不夠重要時)。相對而言,其用戶體驗打了折扣,而增加了其“百度快照”的用戶量。
4、較重視絕對地址的鏈接
百度在收錄網頁時比較重視絕對地址的收錄,百度提供的網頁快照功能也沒有解析相對地址的絕對路徑,不知這是百度技術的疏忽還是其偏好的一大體現。
5、較重視收錄日期
百度對網頁的收錄日期非常看重,也是其搜索結果排名的參考點,被收錄得越早排名會較高,有時甚至不考慮相關性地把它認為比較重要的內容放在首位,而點擊進入之后才發現是早已過時的信息或者垃圾信息。這是百度需要改進的技術。
百度使用的技術:
百度使用以下技術:“一種互聯網上鏡像和準鏡像網站的識別方法”,這個方法解決了搜索引擎對雷同信息的重復獲取,節省網絡資源和本地資源,提高系統服務的質量和效率;“一種基于詞匯的計算機索引和檢索方法”,該方法對一段連續的文字信息,經過詞匯分析處理后,通過添加隱形詞匯的手段,實現對基于詞匯索引和檢索系統的檢索質量提升,使用戶獲得更加準確的檢索結果;“一種使用快照的方式實現對網上信息進行記錄和分析的方法”,
北京代開發票該方法是通過對互聯網上一個特定信息,多次進行快照的方式,將信息當時的狀態進行保留。并通過對一系列快照信息的分析,得到有效數據,方便地得到網上信息的變動情況。,