早在Google推出免費(fèi)日志統(tǒng)計(jì)服務(wù)Google Analytics之初,便有觀察者推測其背后存在更深層的數(shù)據(jù)收集意圖。Google為何不遺余力推廣工具欄?甚至不惜重金與戴爾達(dá)成合作,在其預(yù)裝電腦中嵌入工具欄——這一巨額投入背后,是對用戶行為數(shù)據(jù)的戰(zhàn)略渴求。安裝工具欄的用戶在瀏覽網(wǎng)頁時(shí),其瀏覽軌跡、點(diǎn)擊偏好等信息會(huì)被實(shí)時(shí)采集;即便未使用工具欄,用戶通過Google搜索時(shí),其設(shè)備中的Cookie(有效期一年)也會(huì)完整記錄搜索歷史與點(diǎn)擊行為。依托Google Adsense的廣泛部署,其JavaScript代碼可精準(zhǔn)追蹤用戶在合作網(wǎng)站上的停留時(shí)間、訪問序列及頁面偏好。
尤為值得注意的是,Google將原需付費(fèi)的日志分析工具Google Analytics收購后免費(fèi)向站長開放,這一舉措被普遍解讀為構(gòu)建用戶行為數(shù)據(jù)池的關(guān)鍵一步。站長通過分析用戶行為數(shù)據(jù)時(shí),Google同步完成了對全網(wǎng)用戶行為模式的深度采集。這些數(shù)據(jù)如何轉(zhuǎn)化為排名信號(hào)?例如,用戶搜索某關(guān)鍵詞后,若點(diǎn)擊首個(gè)結(jié)果后迅速返回搜索頁,30分鐘后點(diǎn)擊第三個(gè)結(jié)果并長時(shí)間停留,Google可能推斷后者內(nèi)容更具價(jià)值;若此類模式反復(fù)出現(xiàn),兩網(wǎng)站排名或因此調(diào)整。再如,借助工具欄,Google能清晰追蹤用戶在特定網(wǎng)站的訪問深度、頁面停留時(shí)長及瀏覽路徑,從而判斷用戶對網(wǎng)站的真實(shí)滿意度。
理論上,網(wǎng)站排名需綜合三重維度:頁面內(nèi)優(yōu)化(內(nèi)容質(zhì)量、關(guān)鍵詞布局等)、外部鏈接權(quán)重(權(quán)威性與相關(guān)性),以及用戶行為反饋。此前,搜索引擎對用戶行為的采集能力有限,但Google通過工具欄、Cookie、Analytics、Google Talk等多渠道的布局,正逐步構(gòu)建起用戶行為數(shù)據(jù)的完整拼圖。例如,Google Talk中用戶點(diǎn)擊好友分享鏈接的行為,同樣被納入追蹤體系——這些細(xì)節(jié)均指向Google強(qiáng)化用戶行為數(shù)據(jù)在算法中權(quán)重的戰(zhàn)略方向。
然而,用戶行為數(shù)據(jù)的引入也伴隨潛在風(fēng)險(xiǎn)。類似Alexa排名的作弊現(xiàn)象可能重演,部分網(wǎng)站通過自動(dòng)化程序模擬真實(shí)用戶點(diǎn)擊、制造虛假停留數(shù)據(jù),人為操縱行為指標(biāo)。尤其在中文網(wǎng)站領(lǐng)域,此類問題更為突出,許多流量與排名嚴(yán)重不符的案例,折射出行為數(shù)據(jù)易被濫用的漏洞。對此,Google需通過多維度交叉驗(yàn)證(如結(jié)合設(shè)備指紋、訪問時(shí)段、行為序列合理性等)識(shí)別異常數(shù)據(jù),與現(xiàn)有排名因子形成動(dòng)態(tài)平衡,避免算法被系統(tǒng)性操控。
綜合來看,Google排名算法的演變標(biāo)志著搜索引擎從“鏈接導(dǎo)向”向“用戶體驗(yàn)導(dǎo)向”的深度轉(zhuǎn)型,這一轉(zhuǎn)型既反映了信息質(zhì)量評(píng)估的精細(xì)化趨勢,也對其數(shù)據(jù)采集能力與算法公平性提出了更高要求。