大數(shù)據(jù)時(shí)代的小反思
2012-07-06   作者:俞京平  來(lái)源:中國(guó)經(jīng)濟(jì)時(shí)報(bào)
 
【字號(hào)
  近來(lái),無(wú)數(shù)專家和媒體頻繁提到“大數(shù)據(jù)”時(shí)代已經(jīng)來(lái)臨,那么到底什么是大數(shù)據(jù),僅從字面來(lái)理解,大數(shù)據(jù)的主要特點(diǎn)就是“大”:除了以往傳統(tǒng)方法獲取的數(shù)據(jù)外,新的數(shù)據(jù)來(lái)源層出不窮源源不斷,形成一個(gè)隨時(shí)間變化的巨大數(shù)據(jù)流。這股數(shù)據(jù)流摧毀了當(dāng)前的數(shù)據(jù)監(jiān)測(cè)和研究行業(yè),也徹底顛覆了人們的理解和想象。
  大數(shù)據(jù)何以如此之“大”?其“大”到底從何而來(lái)?要回答這個(gè)問(wèn)題,首先需要了解數(shù)據(jù)的來(lái)源,這里所提到的數(shù)據(jù),出于企業(yè)營(yíng)銷的角度,我們暫且狹義地理解為消費(fèi)者的行為數(shù)據(jù)。以往此類數(shù)據(jù)的獲取大致有以下幾種途徑:一是根據(jù)產(chǎn)品的銷量及其分布特征來(lái)了解;二是采用問(wèn)卷調(diào)查的方法去獲取消費(fèi)者的行為及態(tài)度意見(jiàn)等;三是通過(guò)觀察或訪談去獲取消費(fèi)者行為數(shù)據(jù)?偠灾,在以往獲取數(shù)據(jù)的方法中,研究者占據(jù)主動(dòng)位置,消費(fèi)者比較被動(dòng)。
  然而在大數(shù)據(jù)時(shí)代,消費(fèi)者已經(jīng)主動(dòng)或者不自覺(jué)地把自己的行為信息以數(shù)據(jù)方式留在某處,新媒體技術(shù)無(wú)時(shí)無(wú)刻不在悄悄記錄我們的行為信息,這些信息所形成的數(shù)據(jù)只等待有心人來(lái)收集、分析和研判。所以在一定程度上,大數(shù)據(jù)時(shí)代最主要的數(shù)據(jù)獲取方法是通過(guò)新技術(shù)手段進(jìn)行的悄無(wú)聲息的觀察和記錄,而通過(guò)這種方式獲取的信息總量,要遠(yuǎn)大于傳統(tǒng)方法收集的消費(fèi)者數(shù)據(jù)。同時(shí)在此過(guò)程中,消費(fèi)者更加主動(dòng)(雖然自己可能并未察覺(jué)),而研究者則被動(dòng)接收。
  大數(shù)據(jù)時(shí)代得以形成,有賴于新媒體的飛速發(fā)展,比如微博每天產(chǎn)生的數(shù)據(jù)內(nèi)容,就遠(yuǎn)遠(yuǎn)大于以往研究產(chǎn)生的數(shù)據(jù)。我們可以通過(guò)某個(gè)人的微博內(nèi)容分析,去嘗試了解這個(gè)人的基本人口特征,以及其價(jià)值觀、消費(fèi)觀等,甚至可以在其個(gè)人微博中發(fā)現(xiàn)此人關(guān)注的各類品牌信息,以及對(duì)各品牌所持有的態(tài)度,所以大數(shù)據(jù)的價(jià)值是顯而易見(jiàn)的。
  上述內(nèi)容還僅僅是橫向數(shù)據(jù)總量的不斷豐富和擴(kuò)大,除此之外,數(shù)據(jù)的縱向拓展也成就了大數(shù)據(jù)時(shí)代。我們可以把以往的調(diào)查或觀察數(shù)據(jù)看作是一個(gè)橫截面的研究,每個(gè)消費(fèi)者對(duì)應(yīng)一系列數(shù)據(jù)點(diǎn),這樣兩個(gè)坐標(biāo)軸共同構(gòu)筑了一幅二維平面圖。但是在新媒體時(shí)代,消費(fèi)者每時(shí)每刻的行為信息均加上了一個(gè)新的時(shí)間坐標(biāo)軸,把原來(lái)的二維平面變成了一個(gè)三維空間,這個(gè)三維空間的數(shù)據(jù)總量肯定遠(yuǎn)遠(yuǎn)大于原來(lái)的二維空間,這也是新媒體導(dǎo)致大數(shù)據(jù)時(shí)代到來(lái)的證明。
  中國(guó)古時(shí)以“羊大”為美,今天以數(shù)據(jù)量“大”就是“好”嗎?恐怕事實(shí)并非如此。這就好比大海撈針,如果你知道針掉下去的位置以及海水的流動(dòng)方向,那么在這個(gè)范圍內(nèi)經(jīng)過(guò)測(cè)算再去撈針顯然更靠譜,它遠(yuǎn)比從整個(gè)大海中一點(diǎn)點(diǎn)搜索要更高效。大數(shù)據(jù)時(shí)代也是如此,我們真正需要的其實(shí)并不是大數(shù)據(jù)本身,而是這個(gè)大數(shù)據(jù)背后隱藏的我們想要獲取的情報(bào)性信息,而這樣的信息可能只占總體的萬(wàn)分之一,我們需要的只是這萬(wàn)分之一,其他大量信息對(duì)我們而言都是垃圾。從這個(gè)角度出發(fā),數(shù)據(jù)量越大,其中垃圾信息也就越多,這些令人眼花繚亂的垃圾信息,把我們真正想要的信息給深深地埋在數(shù)據(jù)洪流之中。
  這就是今天輿情監(jiān)測(cè)行業(yè)面臨的困境,筆者見(jiàn)過(guò)無(wú)數(shù)的輿情監(jiān)測(cè)服務(wù)商,得意洋洋地夸口自己可以監(jiān)測(cè)海量的信息來(lái)源,以及每天或每分鐘可以抓取無(wú)比龐大的信息內(nèi)容,更有一些輿情監(jiān)測(cè)機(jī)構(gòu)開(kāi)始競(jìng)爭(zhēng)誰(shuí)的監(jiān)測(cè)覆蓋面更廣等。而這恰恰是輿情監(jiān)測(cè)的誤區(qū)之一,在對(duì)以往輿情信息來(lái)源毫無(wú)了解的情況下,未經(jīng)前期調(diào)研規(guī)劃的輿情監(jiān)測(cè),獲取的信息量越大,得到的垃圾信息就越多。
  所以輿情監(jiān)測(cè)并不是想當(dāng)然的那么簡(jiǎn)單,它需要經(jīng)歷監(jiān)測(cè)源的調(diào)研規(guī)劃、監(jiān)測(cè)源的管理及權(quán)重賦值、監(jiān)測(cè)信息及其屬性的抓取、輿情數(shù)據(jù)的分析挖掘和研判、輿情應(yīng)對(duì)策略建議及應(yīng)對(duì)效果評(píng)估這樣一個(gè)系列的流程環(huán)節(jié),而不僅僅是要求抓取的信息量越大越好。在這樣的流程體系中,輿情監(jiān)測(cè)源的前期調(diào)研規(guī)劃作為第一環(huán)節(jié)顯得尤其重要,它直接決定著數(shù)據(jù)獲取的速率以及抓取信息的有效性、可用性。所以不同的輿情監(jiān)測(cè)項(xiàng)目,其監(jiān)測(cè)范圍應(yīng)該有所不同。
    大數(shù)據(jù)時(shí)代的到來(lái)帶給我們的另一個(gè)啟示是,輿情監(jiān)測(cè)業(yè)務(wù)之間的合作應(yīng)該大于競(jìng)爭(zhēng)。假設(shè)企業(yè)A在做輿情監(jiān)測(cè),企業(yè)B也在做輿情監(jiān)測(cè),如果兩家監(jiān)測(cè)能夠按上述所言做好前期調(diào)研規(guī)劃,那么兩者所獲取的監(jiān)測(cè)內(nèi)容重合度應(yīng)該比較低,所以兩者之間并不存在激烈的競(jìng)爭(zhēng)關(guān)系。相反,如果企業(yè)A、企業(yè)B、企業(yè)C……多家企業(yè)把監(jiān)測(cè)獲取的信息內(nèi)容數(shù)據(jù)庫(kù)聯(lián)合起來(lái),則形成了一個(gè)比較完整的行業(yè)數(shù)據(jù)庫(kù)。換一種思路來(lái)理解,也就是說(shuō)如果多家企業(yè)可以聯(lián)合建立一個(gè)共享的輿情監(jiān)測(cè)內(nèi)容數(shù)據(jù)庫(kù),每家企業(yè)從中篩選過(guò)濾出自己所需內(nèi)容即可,這樣既降低了成本,又提高了精確性,其多方共贏的優(yōu)勢(shì)就能顯現(xiàn)出來(lái)。
  大數(shù)據(jù)時(shí)代顯然給我們帶來(lái)不少便利之處,但是在盲目的歡呼和一時(shí)的激動(dòng)之后,我們更需要認(rèn)真反思如何正確挖掘出大數(shù)據(jù)的最大效用,以便我們?cè)诖髷?shù)據(jù)的海洋里游刃有余,而不是被大數(shù)據(jù)洪流沖擊得迷失了方向。    近來(lái),無(wú)數(shù)專家和媒體頻繁提到“大數(shù)據(jù)”時(shí)代已經(jīng)來(lái)臨,那么到底什么是大數(shù)據(jù),僅從字面來(lái)理解,大數(shù)據(jù)的主要特點(diǎn)就是“大”:除了以往傳統(tǒng)方法獲取的數(shù)據(jù)外,新的數(shù)據(jù)來(lái)源層出不窮源源不斷,形成一個(gè)隨時(shí)間變化的巨大數(shù)據(jù)流。這股數(shù)據(jù)流摧毀了當(dāng)前的數(shù)據(jù)監(jiān)測(cè)和研究行業(yè),也徹底顛覆了人們的理解和想象。
    大數(shù)據(jù)何以如此之“大”?其“大”到底從何而來(lái)?要回答這個(gè)問(wèn)題,首先需要了解數(shù)據(jù)的來(lái)源,這里所提到的數(shù)據(jù),出于企業(yè)營(yíng)銷的角度,我們暫且狹義地理解為消費(fèi)者的行為數(shù)據(jù)。以往此類數(shù)據(jù)的獲取大致有以下幾種途徑:一是根據(jù)產(chǎn)品的銷量及其分布特征來(lái)了解;二是采用問(wèn)卷調(diào)查的方法去獲取消費(fèi)者的行為及態(tài)度意見(jiàn)等;三是通過(guò)觀察或訪談去獲取消費(fèi)者行為數(shù)據(jù)?偠灾,在以往獲取數(shù)據(jù)的方法中,研究者占據(jù)主動(dòng)位置,消費(fèi)者比較被動(dòng)。
    然而在大數(shù)據(jù)時(shí)代,消費(fèi)者已經(jīng)主動(dòng)或者不自覺(jué)地把自己的行為信息以數(shù)據(jù)方式留在某處,新媒體技術(shù)無(wú)時(shí)無(wú)刻不在悄悄記錄我們的行為信息,這些信息所形成的數(shù)據(jù)只等待有心人來(lái)收集、分析和研判。所以在一定程度上,大數(shù)據(jù)時(shí)代最主要的數(shù)據(jù)獲取方法是通過(guò)新技術(shù)手段進(jìn)行的悄無(wú)聲息的觀察和記錄,而通過(guò)這種方式獲取的信息總量,要遠(yuǎn)大于傳統(tǒng)方法收集的消費(fèi)者數(shù)據(jù)。同時(shí)在此過(guò)程中,消費(fèi)者更加主動(dòng)(雖然自己可能并未察覺(jué)),而研究者則被動(dòng)接收。
    大數(shù)據(jù)時(shí)代得以形成,有賴于新媒體的飛速發(fā)展,比如微博每天產(chǎn)生的數(shù)據(jù)內(nèi)容,就遠(yuǎn)遠(yuǎn)大于以往研究產(chǎn)生的數(shù)據(jù)。我們可以通過(guò)某個(gè)人的微博內(nèi)容分析,去嘗試了解這個(gè)人的基本人口特征,以及其價(jià)值觀、消費(fèi)觀等,甚至可以在其個(gè)人微博中發(fā)現(xiàn)此人關(guān)注的各類品牌信息,以及對(duì)各品牌所持有的態(tài)度,所以大數(shù)據(jù)的價(jià)值是顯而易見(jiàn)的。
    上述內(nèi)容還僅僅是橫向數(shù)據(jù)總量的不斷豐富和擴(kuò)大,除此之外,數(shù)據(jù)的縱向拓展也成就了大數(shù)據(jù)時(shí)代。我們可以把以往的調(diào)查或觀察數(shù)據(jù)看作是一個(gè)橫截面的研究,每個(gè)消費(fèi)者對(duì)應(yīng)一系列數(shù)據(jù)點(diǎn),這樣兩個(gè)坐標(biāo)軸共同構(gòu)筑了一幅二維平面圖。但是在新媒體時(shí)代,消費(fèi)者每時(shí)每刻的行為信息均加上了一個(gè)新的時(shí)間坐標(biāo)軸,把原來(lái)的二維平面變成了一個(gè)三維空間,這個(gè)三維空間的數(shù)據(jù)總量肯定遠(yuǎn)遠(yuǎn)大于原來(lái)的二維空間,這也是新媒體導(dǎo)致大數(shù)據(jù)時(shí)代到來(lái)的證明。
    中國(guó)古時(shí)以“羊大”為美,今天以數(shù)據(jù)量“大”就是“好”嗎?恐怕事實(shí)并非如此。這就好比大海撈針,如果你知道針掉下去的位置以及海水的流動(dòng)方向,那么在這個(gè)范圍內(nèi)經(jīng)過(guò)測(cè)算再去撈針顯然更靠譜,它遠(yuǎn)比從整個(gè)大海中一點(diǎn)點(diǎn)搜索要更高效。大數(shù)據(jù)時(shí)代也是如此,我們真正需要的其實(shí)并不是大數(shù)據(jù)本身,而是這個(gè)大數(shù)據(jù)背后隱藏的我們想要獲取的情報(bào)性信息,而這樣的信息可能只占總體的萬(wàn)分之一,我們需要的只是這萬(wàn)分之一,其他大量信息對(duì)我們而言都是垃圾。從這個(gè)角度出發(fā),數(shù)據(jù)量越大,其中垃圾信息也就越多,這些令人眼花繚亂的垃圾信息,把我們真正想要的信息給深深地埋在數(shù)據(jù)洪流之中。
    這就是今天輿情監(jiān)測(cè)行業(yè)面臨的困境,筆者見(jiàn)過(guò)無(wú)數(shù)的輿情監(jiān)測(cè)服務(wù)商,得意洋洋地夸口自己可以監(jiān)測(cè)海量的信息來(lái)源,以及每天或每分鐘可以抓取無(wú)比龐大的信息內(nèi)容,更有一些輿情監(jiān)測(cè)機(jī)構(gòu)開(kāi)始競(jìng)爭(zhēng)誰(shuí)的監(jiān)測(cè)覆蓋面更廣等。而這恰恰是輿情監(jiān)測(cè)的誤區(qū)之一,在對(duì)以往輿情信息來(lái)源毫無(wú)了解的情況下,未經(jīng)前期調(diào)研規(guī)劃的輿情監(jiān)測(cè),獲取的信息量越大,得到的垃圾信息就越多。
    所以輿情監(jiān)測(cè)并不是想當(dāng)然的那么簡(jiǎn)單,它需要經(jīng)歷監(jiān)測(cè)源的調(diào)研規(guī)劃、監(jiān)測(cè)源的管理及權(quán)重賦值、監(jiān)測(cè)信息及其屬性的抓取、輿情數(shù)據(jù)的分析挖掘和研判、輿情應(yīng)對(duì)策略建議及應(yīng)對(duì)效果評(píng)估這樣一個(gè)系列的流程環(huán)節(jié),而不僅僅是要求抓取的信息量越大越好。在這樣的流程體系中,輿情監(jiān)測(cè)源的前期調(diào)研規(guī)劃作為第一環(huán)節(jié)顯得尤其重要,它直接決定著數(shù)據(jù)獲取的速率以及抓取信息的有效性、可用性。所以不同的輿情監(jiān)測(cè)項(xiàng)目,其監(jiān)測(cè)范圍應(yīng)該有所不同。
    大數(shù)據(jù)時(shí)代的到來(lái)帶給我們的另一個(gè)啟示是,輿情監(jiān)測(cè)業(yè)務(wù)之間的合作應(yīng)該大于競(jìng)爭(zhēng)。假設(shè)企業(yè)A在做輿情監(jiān)測(cè),企業(yè)B也在做輿情監(jiān)測(cè),如果兩家監(jiān)測(cè)能夠按上述所言做好前期調(diào)研規(guī)劃,那么兩者所獲取的監(jiān)測(cè)內(nèi)容重合度應(yīng)該比較低,所以兩者之間并不存在激烈的競(jìng)爭(zhēng)關(guān)系。相反,如果企業(yè)A、企業(yè)B、企業(yè)C……多家企業(yè)把監(jiān)測(cè)獲取的信息內(nèi)容數(shù)據(jù)庫(kù)聯(lián)合起來(lái),則形成了一個(gè)比較完整的行業(yè)數(shù)據(jù)庫(kù)。換一種思路來(lái)理解,也就是說(shuō)如果多家企業(yè)可以聯(lián)合建立一個(gè)共享的輿情監(jiān)測(cè)內(nèi)容數(shù)據(jù)庫(kù),每家企業(yè)從中篩選過(guò)濾出自己所需內(nèi)容即可,這樣既降低了成本,又提高了精確性,其多方共贏的優(yōu)勢(shì)就能顯現(xiàn)出來(lái)。
    大數(shù)據(jù)時(shí)代顯然給我們帶來(lái)不少便利之處,但是在盲目的歡呼和一時(shí)的激動(dòng)之后,我們更需要認(rèn)真反思如何正確挖掘出大數(shù)據(jù)的最大效用,以便我們?cè)诖髷?shù)據(jù)的海洋里游刃有余,而不是被大數(shù)據(jù)洪流沖擊得迷失了方向。
  凡標(biāo)注來(lái)源為“經(jīng)濟(jì)參考報(bào)”或“經(jīng)濟(jì)參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數(shù)字媒體產(chǎn)品,版權(quán)均屬經(jīng)濟(jì)參考報(bào)社,未經(jīng)經(jīng)濟(jì)參考報(bào)社書(shū)面授權(quán),不得以任何形式刊載、播放。
 
相關(guān)新聞:
· 大數(shù)據(jù)時(shí)代的結(jié)構(gòu)和解構(gòu) 2012-06-27
· “大數(shù)據(jù)”蘊(yùn)藏“大財(cái)富” 2012-06-15
· 樂(lè)視網(wǎng)三大數(shù)據(jù)遭質(zhì)疑 釋疑乏力股價(jià)跌停 2012-04-28
· 大數(shù)據(jù)時(shí)代微博商業(yè)模式變革 2012-04-23
· 五大數(shù)據(jù)看走勢(shì) 解讀政府工作報(bào)告關(guān)鍵數(shù)據(jù) 2011-03-06
 
頻道精選:
·[財(cái)智]誠(chéng)信缺失 家樂(lè)福超市多種違法手段遭曝光·[財(cái)智]歸真堂創(chuàng)業(yè)板上市 “活熊取膽”引各界爭(zhēng)議
·[思想]夏斌:人民幣匯率不能一浮了之·[思想]劉宇:轉(zhuǎn)型,還須變革戶籍制度
·[讀書(shū)]《歷史大變局下的中國(guó)戰(zhàn)略定位》·[讀書(shū)]秦厲:從迷思到真相
 
關(guān)于我們 | 版權(quán)聲明 | 聯(lián)系我們 | 媒體刊例 | 友情鏈接
經(jīng)濟(jì)參考報(bào)社版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)經(jīng)濟(jì)參考報(bào)協(xié)議授權(quán),禁止轉(zhuǎn)載使用
新聞線索提供熱線:010-63074375 63072334 報(bào)社地址:北京市宣武門西大街57號(hào)
Copyright 2000-2010 XINHUANET.com All Rights Reserved.京ICP證010042號(hào)