域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
談?wù)動(dòng)脩糇R(shí)別的幾種方法。
用戶分析是網(wǎng)站分析中一個(gè)重要的組成部分,在分析用戶之前我們必須首先能夠識(shí)別每個(gè)用戶,分辨哪些是”New Customer”,哪些是”Repeat Customer”。這樣不但能夠更加清晰地了解到底有多少用戶訪問(wèn)了你的網(wǎng)站,分辨他們是誰(shuí)(用戶ID、郵箱、性別年齡等);同時(shí)也能夠幫助你更好地跟蹤你的用戶,發(fā)現(xiàn)它們的行為特征、興趣愛(ài)好及個(gè)性化的設(shè)置等,以便于更好地把握用戶需求,提升用戶體驗(yàn)。
通常當(dāng)你的網(wǎng)站提供了注冊(cè)服務(wù),而用戶注冊(cè)并登陸過(guò)你的網(wǎng)站,那么用戶可以更容易地被識(shí)別,因?yàn)榫W(wǎng)站一般都會(huì)保存注冊(cè)用戶的詳細(xì)信息;但是你的網(wǎng)站并不需要注冊(cè),而用戶的行為以瀏覽為主,這是用戶識(shí)別就會(huì)顯得較為困難,下面提供了幾種常用的用戶識(shí)別的方法:
識(shí)別用戶的幾種方法
當(dāng)用戶并未注冊(cè)登錄的情況下,識(shí)別用戶的唯一途徑就只剩下用戶瀏覽行為的點(diǎn)擊流數(shù)據(jù),通常情況下它們會(huì)保存在WEB日志里面,關(guān)于WEB日志的詳細(xì)說(shuō)明可以參考我之前的文章——WEB日志格式。而WEB日志本身存在的缺陷可能導(dǎo)致用戶識(shí)別的不準(zhǔn)確性,關(guān)于WEB日志的缺陷可以參考之前的文章——WEB日志的作用和缺陷,所以我們?cè)谶x擇用戶識(shí)別方法的過(guò)程中,在條件允許的情況下盡量選擇更為準(zhǔn)確的方法:
1、基于IP的用戶識(shí)別
IP地址是最容易獲取的信息,任何的WEB日志中均會(huì)包含,但其局限性也較為明顯:偽IP、代理、動(dòng)態(tài)IP、局域網(wǎng)共享同一公網(wǎng)IP出口……這些情況都會(huì)影響基于IP來(lái)識(shí)別用戶的準(zhǔn)確性,所以IP識(shí)別用戶的準(zhǔn)確性比較低,目前一般不會(huì)直接采用IP來(lái)識(shí)別用戶。
2、基于IP+Agent的用戶識(shí)別
同樣基于最簡(jiǎn)單形式的WEB日志,我們可以增加一項(xiàng)——Agent,來(lái)提高單一IP方式識(shí)別用戶的準(zhǔn)確性。Agent也是WEB日志中一般都會(huì)包含的信息,通過(guò)IP+Agent的方式可以適當(dāng)提高IP代理、公用IP這類情況下用戶的分辨度,同時(shí)通過(guò)Agent還可以識(shí)別網(wǎng)絡(luò)爬蟲(chóng)等特殊“用戶”,但同樣準(zhǔn)確度也欠高。
3、基于cookie的用戶識(shí)別
當(dāng)你通過(guò)自定義Apache日志格式或者JavaScript的方法獲得用戶cookie的時(shí)候,其實(shí)你已經(jīng)找到了一個(gè)更有效的用戶識(shí)別的手段。cookie在未被清除的其前提下可以認(rèn)為是跟某個(gè)訪問(wèn)客戶端電腦綁定的(一個(gè)客戶端有可能包含多個(gè)cookie),所以用cookie來(lái)標(biāo)識(shí)用戶其實(shí)指的是用戶使用的客戶端電腦,而并非用戶本身。
用cookie識(shí)別用戶的方法當(dāng)然也存在缺陷:最常見(jiàn)的就是cookie被清除而導(dǎo)致用戶無(wú)法與原先記錄實(shí)現(xiàn)對(duì)應(yīng);同時(shí)由于客戶端電腦會(huì)被共用,或者用戶會(huì)在不同的電腦*問(wèn)你的網(wǎng)站,這個(gè)時(shí)候cookie就無(wú)法直接對(duì)應(yīng)到該用戶了。
4、基于用戶ID的用戶識(shí)別
基于用戶ID的用戶識(shí)別是最為準(zhǔn)確,因?yàn)橐话闱闆r下用戶不同共享他的用戶ID,所以我們可以認(rèn)為數(shù)據(jù)中的userid唯一地指向該用戶,幾乎不存在偏差。當(dāng)然要使用用戶ID來(lái)識(shí)別用戶是需要一定的前提條件的:網(wǎng)站必須是提供用戶注冊(cè)登錄服務(wù)的,并且可以通過(guò)一些手段在點(diǎn)擊流數(shù)據(jù)中記錄userid。
所以對(duì)于一個(gè)需要用戶ID注冊(cè)登錄的網(wǎng)站來(lái)說(shuō),用戶唯一標(biāo)識(shí)符的選擇可以遵從以下順序:當(dāng)用戶注冊(cè)登錄時(shí)以u(píng)serid為準(zhǔn),當(dāng)用戶在未登錄狀態(tài)瀏覽時(shí)以用戶的cookie為準(zhǔn),當(dāng)用戶未登錄且cookie無(wú)法獲取的情況下以IP+Agent為準(zhǔn);這樣就能從最大程度上識(shí)別唯一用戶。
這里推薦一個(gè)網(wǎng)站日志中cookie項(xiàng)的自定義設(shè)置方法,以便更好地識(shí)別用戶。cookie是從用戶端存放的cookie文件記錄中獲取的,這個(gè)文件里面一般在包含一個(gè)cookieid的同時(shí)也會(huì)記下用戶在該網(wǎng)站的userid(如果你的網(wǎng)站需要注冊(cè)登陸并且該用戶曾經(jīng)登錄過(guò)你的網(wǎng)站且cookie未被刪除),所以在記錄日志文件中cookie項(xiàng)的時(shí)候可以優(yōu)先去查詢cookie中是否含有用戶ID類的信息,如果存在則將用戶ID寫到日志的cookie項(xiàng),如果不存在則查找是否有cookieid,如果有則記錄,沒(méi)有則記為”-”,這樣日志中的cookie就可以直接作為最有效的用戶唯一標(biāo)識(shí)符被用作統(tǒng)計(jì)。當(dāng)然這里需要注意該方法只有網(wǎng)站本身才能夠?qū)崿F(xiàn),因?yàn)橛脩鬒D作為用戶隱私信息只有該網(wǎng)站才知道其在cookie的設(shè)置及存放位置,第三方統(tǒng)計(jì)工具一般很難獲取。
獲取用戶信息的途徑
通過(guò)以上的方法實(shí)現(xiàn)用戶身份的唯一標(biāo)識(shí)后,我們可以通過(guò)一些途徑來(lái)采集用戶的基礎(chǔ)信息、特征信息及行為信息,然后為每位用戶建立起詳細(xì)的Profile:
1)用戶注冊(cè)時(shí)填寫的用戶注冊(cè)信息及基本資料;
2)從網(wǎng)站日志中得到的用戶瀏覽行為數(shù)據(jù);
3)從數(shù)據(jù)庫(kù)中獲取的用戶網(wǎng)站業(yè)務(wù)應(yīng)用數(shù)據(jù);
4)基于用戶歷史數(shù)據(jù)的推導(dǎo)和預(yù)測(cè);
5)通過(guò)直接聯(lián)系用戶或者用戶調(diào)研的途徑獲得的用戶數(shù)據(jù);
6)有第三方服務(wù)機(jī)構(gòu)提供的用戶數(shù)據(jù)。
識(shí)別并獲取用戶信息的價(jià)值
通過(guò)用戶身份識(shí)別及用戶基本信息的采集,我們可以通過(guò)網(wǎng)站分析的各種方法在網(wǎng)站是實(shí)現(xiàn)一些有價(jià)值的應(yīng)用:
基于用戶特征信息的用戶細(xì)分;
基于用戶的個(gè)性化頁(yè)面設(shè)置;
基于用戶行為數(shù)據(jù)的關(guān)聯(lián)推薦;
基于用戶興趣的定向營(yíng)銷;
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!