網站分析基礎系列(2)——UV
日期:2014-06-11點擊:2571
UV,在網絡分析里面是非常重要的一個Metric(Metric的意思是度量衡,例如一米兩米的米就是一個Metric),也是一個重要的KPI。(什么是KPI?KPI是Key Performance Indicator的縮寫,意思就是最重要的參數)。UV是Unique Visitor的簡稱,意思是唯一的訪問者。想要搞清楚這個KPI的意義。首先可以了解一下什么是Visitor。Visitor的漢語意思是訪問者,就是訪問網站的人。為什么不用“用戶”(User)這個名詞呢?User對應的是某個Application(應用),或者是某種Service(服務),但是訪問網頁的人,還是用Visitor更準確,而且也是約定熟成的咯。


訪問網站的人很容易理解,但是前面加了一個Unique就有點兒費解了。——難道每個訪問的人不是獨一無二的嗎?難道還有其他跟我一模一樣的冒名頂替者?
不,不!不是這個意思,我們(人類)分辨一個一個的個體當然很容易,每個人都是獨一無二的,沒有兩個Sidney Song,也沒有兩個你??墒牵覀冊谶M行網絡分析的時候,都是要通過某種軟件工具完成的,這些工具怎么能知道一段時間內訪問網站的人,到底有多少呢?
舉個例子:網絡軟件工具記錄了訪問互聯網分析沙龍的來訪紀錄一天有10次,那么,它可以簡單的告訴你,有10個人訪問了你的網站。
顯然,這是不符合真實情況的,因為,很可能,你,我親愛的讀者,登上了網頁,然后看了半個小時,又關閉了瀏覽器,干別的去了,過了1個小時再回來,又重新打開收藏夾,點出我的頁面,又看了一會兒。
對于記錄訪問網站的軟件工具而言,你相隔1個小時的兩次訪問被毫無疑義的記錄為兩次訪問,但是如果同時也記錄下了有兩個訪問者分別訪問就不正確了。因為你雖然訪問了兩次,但兩次都是你,而不是換了一個人訪問了我的網站。換句話說,你是這些不同訪問記錄的唯一的訪問者。
也就是說,軟件工具應該記錄:Visit = 2; Visitor =1,而不是Visit = 2; Visitor = 2。由于你是這些訪問記錄的唯一訪問者,因此我們可以讓軟件工具這樣記錄:Visit = 2; Unique Visitor = 1,或者更簡單:Visit = 2; UV = 1。
因此,我們前面假設的10次訪問,很有可能不是來自于10個不同的訪問者,而是來自于少于10個訪問者,因為很有可能,某些訪問者同您一樣,一段時間內多次訪問了我的網站。如果這10次訪問是來自于9個訪問者,那么我們可以確定一定有一個人訪問了2次,而對這2次訪問而言,這個人就是它們(2個Visits)的獨一無二的訪問者(UV)。當然,完全有可能出現1個人在一段時間內包辦這所有10次訪問的情況,那么這個人就是這10個Visits的UV。
繞口的說了這么多,我想你一定明白了,Unique Visitor,或稱UV,是相對于訪問(Visit)而言的,一個訪問者可以產生多個Visits,這些Visits對應的只是這個獨一無二的人,而沒有其他人,因此就有了UV的概念。
同Visit有另外一個說法叫“Session”一樣,Unique Visitor也有另外一個說法,叫“Reach”,不過后者因為意思不是很清晰,所以也用的很少。
現在的問題是,軟件工具怎么知道哪些Visits是來自于某一個Visitor的呢?
網站分析基礎系列(1)——Visit
有兩種方法。但在講這兩種方法之前,必須要清楚一個概念,那就是服務器和瀏覽器(B/S)的概念,如果你已經清楚的了解這個概念。沒關系,直接跳過下面字號較小的內容吧!
我們都知道我們在瀏覽網頁的時候,網頁是要通過瀏覽器(Browser,簡寫為B)來顯示的。但是網頁真正的存放地址肯定不是在你自己的電腦上(廢話,如果這樣還要網線干什么,每月也不用給電信局交錢了),而是在某一個遙遠的地方(就如同電視節目不在你自己家的電視機里,而是在遙遠的電視臺一樣)。這個遙遠的地方有一個很高級的電腦,里面存放了很多的網頁內容,這個電腦叫做服務器(Server,簡寫為S),或者更確切說叫網站服務器(Web Server),而你自己的電腦叫做客戶端。當打開一個網頁的時候,需要首先打開客戶端的瀏覽器,然后在瀏覽器的地址欄輸入你想上的網站的地址,此后你的瀏覽器就會通過我們偉大的互聯網(Internet)立即給相應地址的網站服務器的發一個請求(Quest),然后那個網站服務器接到這個請求后就會把它保存的相應的網頁(Page)的代碼(Code,主要是HTML Code)發到你的瀏覽器上。而瀏覽器有一個神奇的功能,那就是把這些Code變成可以供你閱讀的文字(Text),鏈接(Link),圖片(Graphic),音樂(Music)或者是視頻(Video)。這就是為什么你能訪問互聯網,也能夠看到我的這個博客的原因。當然,其中的過程比我這一段文字要復雜的多,而且我的解釋并不是100%的實際過程的再現。不過你能理解這樣一個過程就足夠了。
那么,網絡分析軟件有哪兩種方法分辨出Unique Vistor呢?
有兩種方法。但在講這兩種方法之前,必須要清楚一個概念,那就是服務器和瀏覽器(B/S)的概念:
我們都知道我們在瀏覽網頁的時候,網頁是要通過瀏覽器(Browser,簡寫為B)來顯示的。但是網頁真正的存放地址肯定不是在你自己的電腦上(廢話,如果這樣還要網線干什么,每月也不用給電信局交錢了),而是在某一個遙遠的地方(就如同電視節目不在你自己家的電視機里,而是在遙遠的電視臺一樣)。這個遙遠的地方有一個很高級的電腦,里面存放了很多的網頁內容,這個電腦叫做服務器(Server,簡寫為S),或者更確切說叫網站服務器(Web Server),而你自己的電腦叫做客戶端。當打開一個網頁的時候,需要首先打開客戶端的瀏覽器,然后在瀏覽器的地址欄輸入你想上的網站的地址,此后你的瀏覽器就會通過我們偉大的互聯網(Internet)立即給相應地址的網站服務器的發一個請求(Quest),然后那個網站服務器接到這個請求后就會把它保存的相應的網頁(Page)的代碼(Code,主要是HTML Code)發到你的瀏覽器上。而瀏覽器有一個神奇的功能,那就是把這些Code變成可以供你閱讀的文字(Text),鏈接(Link),圖片(Graphic),音樂(Music)或者是視頻(Video)。這就是為什么你能訪問互聯網,也能夠看到我的這個博客的原因。當然,其中的過程比我這一段文字要復雜的多,而且我的解釋并不是100%的實際過程的再現。不過你能理解這樣一個過程就足夠了。
那么,網絡分析軟件有哪兩種方法分辨出Unique Vistor呢?
方法一:讓網站服務器分辨
道理很簡單,網站服務器每時每刻都會接到很多的頁面請求,每一個請求信息內都包含了你的(實際上是你的電腦的)一些信息。這些信息包括很多內容,比如你的IP地址(呵呵,IP地址就不用我解釋了吧,不知道就當它是你的計算機在互聯網上的一個門牌號碼吧?。⒛惆l出請求的時間、你的瀏覽器的版本、你的操作系統的版本,以及其他一些古古怪怪的信息(實際上都是有作用的哦,只是我們現在沒必要弄清楚它們)。
網站服務器可以分析這些Request,如果這些Request滿足一些共同的特征,比如來自同一個IP地址,且瀏覽器版本相同,或者再加上發出請求的時間接近等,它就認為這一串的Request對應的一系列Visits是來自于同一個Visitor的,這個Visitor就成為這些Visits的UV了。
當然,如何定義這些共同的特征是由網站服務器的設置決定的。一般而言,用IP地址+其他特征共同限定來定義的情況比較多,但是IP地址實際上并不準確,尤其在局域網內有共用IP地址的多臺計算機的情況發生的時候。不過,聊勝于無了!
方法二:用Cookie分辨
另外一個方法使用Cookie的方法分辨。什么?什么是Cookie?不了解Cookie就查一下Google或者Baidu吧!我就不解釋了,說起來話挺長的。
怎么分辨呢?當客戶端第一次訪問某個網站服務器的時候,網站服務器會給這個客戶端的電腦發一個Cookie,放到這個電腦的某個區域,一般是C盤里。這個Cookie會分配給你一個獨一無二的編號,還會記錄一些你訪問服務器的信息,例如訪問時間,訪問了什么網頁,以及與你這次訪問有關的其他一些信息。當你下一次再訪問這個服務器的時候,服務器就可以直接從你的電腦上找到上一次它放進去的這個Cookie,并且會對它進行一定的更新,但那個獨一無二的編號不會改變。如果一段時間內,服務器發現兩個Visits的對應的Cookie實際上是一個編號,那么,服務器就知道,盡管在這段時間內有不少次Visits,但都來自于一個客戶端,那么一定就是一個Visitor了!
這個方法比上一個要更精確些。但是存在的問題是,有些客戶端為了保證更高級別的安全,關閉了Cookie的功能,或者你經常刪除Cookie,這個方法就不能奏效了。
因此,這樣看來,兩個方法都只能得到UV的近似值,但是不能得到精確值。什么?想要百分之百精確?那……除非進行一次100%準確的普查(這實際上也是不可能的),或者只有神知道了。
網站分析基礎系列(2)——UV
網站分析基礎系列(3)——PV(PageView)
網站分析基礎系列(4)——跳出率(Bounce Rate)
網站分析基礎系列(5)——Home Page和Landing Page
網站分析基礎系列(6)——Impression,Click和CTR
網站分析基礎系列(7)——Engagement