2016年10月2日 星期日

當代搜尋引擎 Google專利清單

  • 站點的年齡
  • 自該網域註冊後過多久
  • 內容的年齡
  • 新內容增加的規律性
  • 連結的年齡,連接站點的名譽和其相關程度
  • 一般站內因素
  • 負面站內因素 (例如,太多關鍵字匯標(meta tag),很顯然被優化過,會對站點造成傷害)
  • 內容的獨特性
  • 使用於內容的相關術語 (搜尋引擎關聯到的術語的方式視同如何關聯到網頁的主要內容)
  • Google網頁級別 (只被使用在Google 的演算法)
  • 外在連結、外部連結的連結文字、在那些和在站點/網頁包含的那些連結
  • 引證和研究來源(表明內容是研究性質)
  • 在搜尋引擎資料庫裡列舉的詞根與其相關的術語(如 finance/financing)
  • 導入的逆向連結,以及該連結的文字
  • 一些導入連結的負面計分 (或許那些來自低價值頁、被交換的逆向連結等)
  • 逆向連結取得速率:太多太快意味著「不自然」的連結購買活動
  • 圍繞在導出連結、導入的逆向連結周圍的文字。例如一個連結如果被 "Sponsored Links" (贊助商連結)包圍,該連結可能會被忽略。
  • 用 "rel=nofollow" 建議搜尋引擎忽略該連結
  • 在站點該檔案的結構深度
  • 從其他資源收集的網格表,譬如監視當搜尋結果導參照戶到某頁後,用戶有多頻繁按瀏覽器的返回
  • 從來源像:Google AdWords/AdSenseGoogle 工具條等程式收集的網格表
  • 從第三方資料分享協議收集的網格資料 (譬如監測站點流量的統計程式提供商)
  • 刪除導入連結的速率
  • 使用子網域、在子網使用關鍵字和內容品質等等,以及從這些活動來的負面計分
  • 和主檔案語意上的連結
  • 檔案增加或改動的速率
  • 主機服務商 IP 和該 IP 旗下其它站點的數量/品質
  • 其他連結站會員 (link farm / link affiliation) 與被連結的站 (他們分享IP嗎? 有一個共同的郵遞位址在"聯絡我們 (Contact Us)" 頁嗎?)
  • 技術細節像利用301重新導向被移除的網頁、對不存在網頁顯示404伺服器標頭而非200伺服器標頭、適當的利用 robots.txt
  • 主機服務商正常運行時間
  • 是否站點對不同類的用戶顯示不同的內容(稱為「掩飾」(cloaking))
  • 未及時矯正、無效的導出的連結
  • 不安全或非法內容
  • HTML代碼品質,以及錯誤出現數
  • 由搜尋引擎自他們搜尋結果觀察到的實際點擊通過率評等
  • 由最常存取搜尋結果的人手動評等

PS:以上內容採自 Google專利清單:https://zh.wikipedia.org/wiki/%E6%90%9C%E5%B0%8B%E5%BC%95%E6%93%8E%E6%9C%80%E4%BD%B3%E5%8C%96

沒有留言:

張貼留言