[微博客用戶行為特征實證分析] 用戶行為特征

        發(fā)布時間:2020-03-10 來源: 日記大全 點擊:

          [摘要]微博客已發(fā)展成為一種重要的信息傳播和交流工具,理解微博客用戶行為特征,對于優(yōu)化微博客平臺、探索微博客在網(wǎng)絡營銷、教育及危機公共事件通報等方面的應用具有重要意義,也為研究新媒體傳播理論提供數(shù)據(jù)基礎。以新浪微博客為研究對象,抽取微博客平臺提供的各項字段,從用戶性別、地域、影響力等多個角度揭示當前微博客用戶的行為特征及存在的問題。
          [關鍵詞]微博客 用戶行為 互聯(lián)網(wǎng)利用
          [分類號]G206 TP393
          
          1 引言
          
          近年來國內(nèi)微博客發(fā)展迅速,除新浪、搜狐和網(wǎng)易三大門戶網(wǎng)站先后創(chuàng)建各自的微博客平臺外,多家互聯(lián)網(wǎng)公司、電子商務網(wǎng)站甚至傳媒網(wǎng)站也紛紛在各自的網(wǎng)站上開辦了微博客。與其他互聯(lián)網(wǎng)交流工具不同的是,微博客的意義并不僅僅是一個單純的信息傳播和交流的工具,它驚人的信息擴散能力在許多領域都蘊含著潛在的應用前景。在美國,政府已將Twitter作為國家重大事件緊急通報系統(tǒng),多家企業(yè)成立了專門的Twitter營銷部門,一些教育機構已開始將微博客作為教育的輔助平臺;在我國,企業(yè)正積極開始嘗試利用微博客營銷。盡管人們已經(jīng)意識到微博客可能存在著巨大的應用潛力,但對于如何有效地利用它達到預期目標仍感到很迷茫,在Emarketer的一項調(diào)查中,多家企、表示不知道如何利用這一工具進行網(wǎng)絡營銷。微博客的應用前景涉及多個領域,無論是政府、媒體、教育機構還是企業(yè),他們都需要從自身需求去考量微博客的不同價值及利用方法,而對微博客在各自領域應用潛力的挖掘以及具體實現(xiàn)途徑,則取決于對微博客用戶的理解和把握。因此,選擇主流的微博客平臺,基于大樣本數(shù)據(jù),多角度分析當前微博客用戶在利用微博客過程中反映的各種行為特征具有較為重要的現(xiàn)實意義。
          
          2 數(shù)據(jù)采集
          
          用戶行為特征研究通常是抽取一定樣本量的用戶屬性數(shù)據(jù)和行為數(shù)據(jù),利用數(shù)理統(tǒng)計等方法對數(shù)據(jù)進行歸納、統(tǒng)計和分析。本文選取國內(nèi)影響最大、用戶人數(shù)最多的新浪微蹲客作為研究平臺,設計程序采集相關數(shù)據(jù)從多個角度考察用戶特征。采集時間從2010年3月1日0時0分到3月8日9時40分。理論上認為樣本量越大越好,但實踐中發(fā)現(xiàn),樣本量過大不僅造成數(shù)據(jù)采集和存貯困難,而且在分析時運算速度也變得很慢。在權衡樣本數(shù)量及操作可行性后,本研究采用了取兩個樣本的方法,一個樣本量較大(以下統(tǒng)稱該樣本為大樣本),但采集的字段相對少一些;另一個樣本量較小(以下統(tǒng)稱該樣本為小樣本),采集的字段更為豐富,幾乎包括了新浪微博客平臺提供的各項字段。這樣做的優(yōu)勢在于,大樣本由于字段較少,可以在有限的存貯空間,盡可能獲得較多的用戶數(shù)據(jù),使某些研究基于較大的數(shù)據(jù)集基礎;小樣本用戶量較小,可以取更多的字段,如可以抽取每個用戶的博客內(nèi)容,這樣有利于對用戶做更為深入、全面的研究。具體采集的方法是:隨機選取一微博客用戶“生活月刊”作為用戶數(shù)據(jù)采集的起點,分別采集其“粉絲”和“關注”,再采集“粉絲”的“粉絲”及“關注”的“關注”,層層遞進,到3月8日9點40分時采集到649006個用戶后,人工中止采集程序,將其作為本研究的大樣本集,大樣本集中每個用戶共有以下信息:用戶名ID,個性域名,昵稱,是否認證,性別,地域,粉絲數(shù),粉絲ID。在前面的采集過程中,通過程序截取前12003名用戶作為小樣本集,對小樣本集進一步采集更多的字段:自我簡介、關注數(shù)、新浪用戶ID、微博數(shù),微博內(nèi)容、發(fā)博方式或來源、轉(zhuǎn)發(fā)數(shù)、評論數(shù)、每篇微博客發(fā)表時間、原創(chuàng)還是轉(zhuǎn)發(fā)、原創(chuàng)人的ID、轉(zhuǎn)發(fā)數(shù)、評論數(shù)。顯然大樣本擁有更多的用戶數(shù)量,而小樣本集擁有用戶更多的信息。
          
          3 微博客用戶行為特征
          
          3.1 認證用戶
          新浪微博客用戶分為認證用戶和非認證用戶,新浪邀請明星、名人、重要新聞當事人、知名企業(yè)、知名機構、知名媒體及其知名高管進行實名認證,認證后的用戶的用戶名后會顯示字母“V”,以示與普通用戶的區(qū)別。在本實驗的大樣本集中,認證用戶共有7919,未認證的有641087,即認證用戶占全部樣本用戶的比例僅為0.12%。從這個數(shù)據(jù)上看,認證用戶所占的比例極小。據(jù)測試,普通人(非名人)提供有效證件并滿足新浪的基本條件后,即可以成為被認證用戶,也就是說,新浪微博客名人認證的門檻并不高。為了考察機構認證的情況,在大樣本中,檢索以“醫(yī)院、頻道、網(wǎng)、雜志、學院、網(wǎng)站、政府、新聞、中國、周末、論壇、公司、圖書館、書會、導報、基金、畫報、媒體、廣播、文體臺、中心、大會、事務所、俱樂部、協(xié)會、代表團、藝術團、出版社、宣傳部、研究院、刊”為結(jié)尾的機構,共有2 184個,其中認證的只有350個,即高達84%的機構沒有認證。為了進一步考察公司認證的情況,在大樣本集中檢索以“公司”為結(jié)尾的機構,共有197家,其中只有10家是認證的,即認證的公司僅占5%。機構(包括公司)注冊微博客,對于展示機構形象、客戶關系管理等有重要的意義,機構進行認證后,在不需要任何成本的情況下提升了機構的信度,但如此眾多的機構竟然沒有認證,說明很多機構(特別是企業(yè))沒有認識到認證的重要性或?qū)@一功能不太了解,這一現(xiàn)象也間接地說明我國絕大多數(shù)注冊微博客的機構與一般個人用戶一樣,僅僅是使用微博客的基本功能,還沒有開始將微博客用于本機構的業(yè)務活動中。
          
          3.2 用戶性別
          新浪微博客的性別是用戶在注冊時自己選擇添加的,因此在普通用戶中,存在少量有意反填性別的情況,但由于男女都有類似的行為,統(tǒng)計男性用戶總量和女性用戶總量時,數(shù)據(jù)誤差不大,這與一般的網(wǎng)站用戶注冊情況類似。但是,新浪微博客的認證用戶在填寫性別時,如果認證用戶是個人用戶,由于認證用戶要上傳身份證,因此微博的性別與真實性別將一致;但是對于機構用戶來說,由于新浪微博客的性別是必填項目,機構在注冊時不得不選擇一個性別,這些機構用戶在性別上是選擇男性還是女性呢?調(diào)查大樣本數(shù)據(jù),發(fā)現(xiàn)存在以下現(xiàn)象:認證用戶中男女用戶數(shù)分別是5130(占總用戶數(shù)的64.7%)和2789(占總用戶數(shù)的35.2%),非認證用戶中男女用戶數(shù)分別是371776(占總用戶數(shù)的57.9%)和269311(占總用戶數(shù)的42.0%)。也就是說,非認證用戶中,男性數(shù)量多于女性數(shù)量,認證用戶中,男性數(shù)量遠遠多于女性數(shù)量,這主要是大多數(shù)機構用戶還是選擇了男性作為機構的性別,選擇女性性別的機構多是與女性有某種特殊關聯(lián)或出于某種特殊考慮,如華東師范大學的微博客性別是“女”,可能與該校女生較多的緣故有關,服務于女性的機構(如生產(chǎn)化妝品的企業(yè))多選擇女性性別。
          
          
          3.3 用戶ID、個性域名及昵稱
          新浪微博客提供了三種用戶標識:用戶ID、個性域名和呢稱。呢稱是用戶注冊時自己起的名稱。注冊后,新浪為注冊用戶生成了唯一的用數(shù)字表示的ID 號,用戶的微博地址就是:t.省略/ID,由于ID號難以記憶,為了讓其他訪問者記住注冊用戶的名字,新浪給用戶提供了生成個性域名的功能,用戶注冊后,可以輸入4到20位的英文或數(shù)字(必須包含英文字符),生成個性化域名,如上海形象大使“火炬手金品”的個性化域名是huojushoujinjing,訪問者可以通過訪問t.省略/huojushoujinjing訪問金品的微博客主頁。用戶ID及呢稱是每個用戶必填的,但個性化域名是任選項。在大樣本集中,設置個性域名的用戶數(shù)為159855,占總用戶比例的24.63%,其中認汪用戶設置個性域名的為6 344人,占認證用戶的80.11%,個性域名對于擴大用戶知名度、提高用戶訪問量等方面具有重要的作用,從數(shù)據(jù)可以看出,認證用戶對個性化域名的認知程度要遠遠高于普通用戶。
          
          3.4 用戶地理分布與交互
          微博客的用戶數(shù)存在地域上的差異性,排除3870個用戶未設置所在地區(qū)外,北京、廣東和上海等發(fā)達城市的用戶數(shù)量遠遠高于邊遠地區(qū),北京、廣東、上海、江蘇、浙江五個地區(qū)的累積用戶高達332001,超過總用戶數(shù)的一半,其中位居第一的北京用戶數(shù)幾乎是第三名上海用戶數(shù)的2倍。北京是全國的政治文化中心,上海是全國的經(jīng)濟中心,這從一個側(cè)面說明我國微博客用戶更多地是利用微博客進行思想和文化交流。此外,各省市微博客的用戶數(shù)與當?shù)氐腉DP呈正相關,相關系數(shù)為0.6265。從總體上看,經(jīng)濟發(fā)達地區(qū)使用微博客人數(shù)遠遠多于經(jīng)濟欠發(fā)達地區(qū),政治文化中心使用微博客的人數(shù)要多于經(jīng)濟中心。如表1所示:
          
          
          3.5 用戶關注數(shù)與粉絲數(shù)
          微博客是通過用戶添加“關注”,獲得被關注人的微博信息,當A“關注”B,B就被加入A的微博客頁面,當B的微博內(nèi)容更新時,最新內(nèi)容顯示在A的微博頁面。對于B來說,A就是他的粉絲。一個人的粉絲數(shù)量大,從一個側(cè)面說明他受關注程度高或影響力較大,一個人關注的人多,說明他具有更高的開放性。為了考察線下影響力是否影響線上影響力,同時考察受關注程度是否與性別有關,本文對大樣本數(shù)據(jù)進行了分析(見表2),發(fā)現(xiàn)認證用戶的粉絲均值遠遠高于普通用戶,人均認證用戶的粉絲數(shù)高達6500.95個,1.22%的認證用戶吸引了73.82%的粉絲,其中,女性認證用戶的粉絲均值又明顯高于男性認證用戶的粉絲均值。
          
          文獻認為twitter的用戶粉絲數(shù)與關注數(shù)有正向相關性,但是本實驗中,使用大樣本數(shù)據(jù)觀察,無論是樣本總體用戶、認證用戶還是非認證用戶,其粉絲數(shù)與關注數(shù)均沒有相關性,我們認為,粉絲數(shù)量的多寡與用戶本身的影響力及所貢獻的信息內(nèi)容有關,但其關注數(shù)量的多寡則取決于該用戶的行為,有很大的主觀性,肯德基與麥當勞兩家公司在新浪微博客的兩項指標也顯示兩者無任何關聯(lián),前者有大量的粉絲卻很少關注他人,而后者粉絲數(shù)遠低于前者,但關注數(shù)卻高于前者,如表3所示:
          
          
          3.6 微博客發(fā)送方式
          微博客實現(xiàn)信息快速傳播的一個重要原因就是在于其靈活多樣的發(fā)送微博內(nèi)容的方式,以大樣本數(shù)據(jù)統(tǒng)計了新浪微博的各種發(fā)博方式并記錄每種方式所發(fā)的做博客條數(shù)(見表4)。雖然微博客提供了多種發(fā)博的途徑,但是從統(tǒng)計數(shù)據(jù)看,我國的微博客用戶使用的方式并不多,直接在新浪微博上發(fā)微博占72.93%,使用手機和短信共占到12.52%,使用關聯(lián)博客的為7.07%,這三種方式占到發(fā)博方式總量的92.52%。當微博客大規(guī)模地應用于企業(yè)營銷時,使用手機和短信發(fā)送微博的比例一般會增加(特別是需要發(fā)送即時信息的企業(yè)),目前手機和短信所占的比例并不高,這也間接地說明我國的企業(yè)用戶利用微博客進行網(wǎng)絡營銷的程度還不夠,多數(shù)企業(yè)僅將微博作為一個展示企業(yè)領導人、企業(yè)、產(chǎn)品信息的窗口,并沒有將它當作為其業(yè)務服務的工具。此外,我國用戶數(shù)量最多的即時通訊QQ還沒有與新浪微博客綁定,使新浪微博客少了一個重要的發(fā)微博的途徑。
          
          3.7 微博發(fā)布的時間
          統(tǒng)計顯示,一天中的上午11點和晚上23點是發(fā)微博的高峰期,午夜0點到上午8點這個時間段是一天中發(fā)布微博數(shù)量最少的時間段;19點前,普通男用戶發(fā)文數(shù)略高于普通女用戶數(shù),19點后,普通女用戶發(fā)文量高于普通男用戶,但在0點時非認證男用戶又多于非認證女用戶。也就是說,女性更傾向于晚上發(fā)表微博;認證男用戶發(fā)文量始終高于認汪女用戶,并且,發(fā)文量明顯高于認證女用戶,這與認證用戶中男用戶總數(shù)遠遠多于女用戶總數(shù)有關系。認證用戶在晚上發(fā)微博的數(shù)量并沒有明顯低于白天發(fā)微博的數(shù)量,如果企業(yè)使用微博用于營銷等業(yè)務,通常會表現(xiàn)為白天發(fā)送微博的數(shù)量遠高于晚上發(fā)送微博的數(shù)量,這可能意味著在整個新浪微博客中企業(yè)利用微博客的份額并不大,這與從微博客發(fā)送方式數(shù)據(jù)中得到結(jié)論是一致的。如圖1所示:
          
          
          3.8 原創(chuàng)、轉(zhuǎn)發(fā)、回復與評論
          微博客用戶交流方式主要有發(fā)布原創(chuàng)內(nèi)容、轉(zhuǎn)發(fā)其他貼子、對轉(zhuǎn)發(fā)內(nèi)容回復以及對原創(chuàng)內(nèi)容進行評論四種形式。本文中的原創(chuàng)內(nèi)容是相對轉(zhuǎn)發(fā)、回復與評論而言的,是指微博客平臺上某轉(zhuǎn)發(fā)鏈(或回復、評論)發(fā)起者的微博,如一個微博用戶寫了自己的旅行感受,是原創(chuàng),一個微博用戶將酷六上的一段視頻發(fā)到自己的微博中,被他人轉(zhuǎn)發(fā)、評論或回復,在這個過程中,對于該微博內(nèi)容(視頻),本文也稱為原創(chuàng),這樣界定的目的是為了強調(diào)它是微博客平臺上信息傳播的起始點。原創(chuàng)內(nèi)容是信息交流的基礎,只有具有一定數(shù)量的原創(chuàng)內(nèi)容,才能給用戶帶來吸引力,才能引發(fā)評論等交流活動,并由此產(chǎn)生新的信息內(nèi)容。一般來說,原創(chuàng)信息的多寡反映平臺信息內(nèi)容的豐富程度,而轉(zhuǎn)發(fā)、回復及評論量的多寡反映用戶信息交流的活躍程度。為了考察新浪微博用戶原創(chuàng)、轉(zhuǎn)發(fā)、回復和評論的情況,對小樣本數(shù)據(jù)進行了統(tǒng)計分析(見表5),從總體情況看,新浪微博中,非原創(chuàng)內(nèi)容是原創(chuàng)內(nèi)容的8.5倍,轉(zhuǎn)發(fā)數(shù)與評論數(shù)基本相差不大,用戶通常在轉(zhuǎn)發(fā)的同時也給予評論。比較認證用戶和非認證用戶,認證用戶所寫微博的數(shù)量僅略高于非認證用戶,但是認證用戶人均發(fā)表的原創(chuàng)微博卻是非認證用戶的2.7倍,而認證用戶人均轉(zhuǎn)發(fā)數(shù)和人均評論數(shù)更是非認證用戶的7.2倍和7.6倍。認證用戶的單位原創(chuàng)貼被轉(zhuǎn)發(fā)次數(shù)和單位原創(chuàng)貼被評論次數(shù)反映了認證用戶發(fā)表的每條原創(chuàng)微博平均被引用的程度,也是非認證用戶的近3倍。即認證用戶的原創(chuàng)能力特別是所產(chǎn)生的影響力遠遠高于一般的非認證用戶。
          
          
          
          3.9 微博內(nèi)容
          由于受限于140個字,微博客用戶表達的往往不是某一具體事件的完整敘述,而是對事件、生活狀態(tài)、意見的簡短概括。但微博客用戶所關注的話題及表達的主題,尚無進一步的統(tǒng)計或調(diào)查,而這對于了解用戶使用微博客的動機是有意義的。本文采用改進的分詞詞頻統(tǒng)計方法對微博客進行內(nèi)容分析,考察微博客用 戶的興趣所在。
          首先對小樣本用戶的微博客內(nèi)容進行分詞,獲取198760個關鍵詞,共出現(xiàn)33231856次。按詞頻排序,取前1000個高頻詞;再分析這些高頻詞左側(cè)或右側(cè)的關鍵詞進行統(tǒng)計,獲得高頻詞對表(見表6),這個表中每對詞在語義上比前面的單純的高頻詞更豐富。從表6中可以看到,新浪微博客用戶關心的主要是政治、經(jīng)濟、娛樂和日常生活等話題。
          
          3.省略被引次數(shù)最高,占CN被引量的77.省略.省略、org.省略、net.省略,將新浪微博客引用互聯(lián)網(wǎng)資源與文獻的結(jié)論對比,文獻利用中國社會科學引文數(shù)據(jù)庫統(tǒng)計了10年中國社會科學文獻引用瓦聯(lián)網(wǎng)資源情況,得到的頂級域名CN下巴述各域被引用的情況分別是10153、5425、2387、3278、1244,很明顯,微博客的引用互聯(lián)網(wǎng)的行為與人文社會科學信息用戶引用互聯(lián)網(wǎng)的行為有很大的不同,微博客用戶主要是引用關聯(lián)博客的資源,占總引用數(shù)的38.省略資源的利用遠遠弱于人文社會科學信息用戶。
          
          4 結(jié)語
          
          本文以新浪微博的649006個用戶為研究樣本,從用戶的性別屬性、認證屬性、地域分布、個性化域名認知度、發(fā)送微博方式、影響力、發(fā)表微博的時間、關注的內(nèi)容、交流及引用行為十個方面系統(tǒng)展現(xiàn)了新浪微博客用戶利用微博客的行為特征,由于新浪微博客與我國其他微博客平臺架構基本一致,并且研究所選的樣本量較大,因此,本研究結(jié)論基本上能反映我國微博客用戶利用做博客的現(xiàn)狀。結(jié)果顯示,做博客平臺是依靠少數(shù)認證用戶提供原創(chuàng)信息并帶動著群體信息交流;認證用戶多來自新聞傳播、娛樂領域的媒體類企業(yè)或名人,從而也使整個微博客用戶關注的內(nèi)容更為大眾化和娛樂化;原創(chuàng)內(nèi)容多來源于認證用戶的博客,導致整體信息來源較為單一和封閉,國外信息資源極少被引用,使得信息質(zhì)量總體欠弱,以消息、狀態(tài)與感想為信息主體;用戶對如何利用微博客提供的認證及個性化域名的認知程度不高,特別是很多企業(yè)用戶對如何利用微博客平臺提升自己的影響力以及將微博客作為工具開展業(yè)務尚不了解,不少企業(yè)其粉絲數(shù)甚至不足10人,相比較,傳媒娛樂界對于使用微博客平臺提升影響力的認知程度高于其他行業(yè);發(fā)達地區(qū)與落后地區(qū)的用戶數(shù)量具有很大的差異,普通用戶的原創(chuàng)能力弱,其行為以轉(zhuǎn)發(fā)及評論為主。微博客平臺的設計堪稱精巧,但在用戶服務、引導及深層應用方面仍有很大的潛力需要挖掘。

        相關熱詞搜索:實證 特征 分析 微博客用戶行為特征實證分析 行為金融學實證分析 行為金融學的理論基礎

        版權所有 蒲公英文摘 www.zuancaijixie.com
        91啦在线播放,特级一级全黄毛片免费,国产中文一区,亚洲国产一成人久久精品