數(shù)據(jù)是有價(jià)值的,但大數(shù)據(jù)最核心的價(jià)值到底是什么?能夠用大數(shù)據(jù)來(lái)作什么呢?
我總結(jié)了一下,大數(shù)據(jù)最核心的作用和價(jià)值有四個(gè)方面:
1) 查看數(shù)據(jù)規(guī)律,來(lái)探索事物的運(yùn)行規(guī)律和特征
2) 發(fā)現(xiàn)數(shù)據(jù)變化,來(lái)探索業(yè)務(wù)的變化和業(yè)務(wù)問(wèn)題
3) 理清數(shù)據(jù)關(guān)系,來(lái)尋找影響業(yè)務(wù)運(yùn)行的關(guān)鍵因素
4) 擬合數(shù)據(jù)模型,來(lái)預(yù)判業(yè)務(wù)在未來(lái)的發(fā)展趨勢(shì)
下面我將為大家舉一些案例,看如何利用大數(shù)據(jù)來(lái)實(shí)現(xiàn)這些價(jià)值。
3.1 探索規(guī)律
利用大數(shù)據(jù)來(lái)探索業(yè)務(wù)運(yùn)行的規(guī)律和特征。
拿產(chǎn)品的銷量分析來(lái)說(shuō),我們收集產(chǎn)品的銷量數(shù)據(jù),作趨勢(shì)分析,得到下圖所示的按照時(shí)間維度(星期)的折線圖。
從數(shù)據(jù)的特征可以看出,產(chǎn)品的銷量基本上是隨著時(shí)間在逐步上升的,周末的產(chǎn)品銷量比較高,即非工作日比工作日的產(chǎn)品銷量要高,這是絕大多數(shù)零售店的銷售規(guī)律,即“周末是交易高峰時(shí)間”。
而銷量高,也就意味著在產(chǎn)品銷售上的規(guī)律,即客流量比較大,看來(lái)周末上街購(gòu)物的人數(shù)比較多。所以,從業(yè)務(wù)角度看,也就發(fā)現(xiàn)了客流量在時(shí)間上的分布規(guī)律。
基于客流量的分布規(guī)律,就可以提出如下的業(yè)務(wù)建議或策略:在人力安排上,周末需要更多的銷售員工上班;在庫(kù)存管理上,在周四或周五就要安排人員檢查庫(kù)存,確保庫(kù)存中有足夠的產(chǎn)品在周末售賣(mài);在營(yíng)銷活動(dòng)的時(shí)間安排上,要想達(dá)到更好的品牌宣傳效果或者銷售業(yè)績(jī),就得選擇在客流量多的周末時(shí)間進(jìn)行宣傳和促銷,等等。
所以,大數(shù)據(jù)能夠幫助我們做決策,是怎樣做到的呢?
背后的思維其實(shí)很簡(jiǎn)單,就是,先利用數(shù)據(jù)來(lái)探索業(yè)務(wù)的發(fā)展規(guī)律和特征,再利用業(yè)務(wù)規(guī)律,按規(guī)律來(lái)決策,就能夠做到事半功倍的效果。
哲學(xué)告訴我們,任何事物都是發(fā)展的,發(fā)展必定是有規(guī)律的,即萬(wàn)物皆有規(guī)律。
任何客觀事物,大到天體運(yùn)行,中到社會(huì)發(fā)展,小到原子分子的運(yùn)行,都是有規(guī)律的。而大數(shù)據(jù),則是探索事物規(guī)律的有效的工具!
3.2 發(fā)現(xiàn)變化
利用大數(shù)據(jù)來(lái)發(fā)現(xiàn)業(yè)務(wù)運(yùn)行的變化和問(wèn)題。
谷歌公司的流感趨勢(shì)預(yù)測(cè)產(chǎn)品(Google Flu Trends, GFT)是2008年推出的一款預(yù)測(cè)流感的產(chǎn)品,可以說(shuō)是比較早的一個(gè)大數(shù)據(jù)產(chǎn)品了。
正常情況下,傳統(tǒng)的疫情報(bào)告是由各地醫(yī)院、診所和醫(yī)務(wù)人員向*CDC(疾病控制和預(yù)防中心)上報(bào)的,但這種方法往往會(huì)有10~14天的時(shí)間延遲,而在這兩周內(nèi),疫情有可能早已經(jīng)迅速擴(kuò)散。而谷歌的這款產(chǎn)品,卻可以利用了各個(gè)地區(qū)用戶搜索關(guān)鍵詞的數(shù)據(jù)量來(lái)判斷流感的傳播情況,來(lái)實(shí)時(shí)呈現(xiàn)或預(yù)測(cè)流感蔓延到哪個(gè)地區(qū)了,這對(duì)于CDC及時(shí)控制疫情具有更大的指導(dǎo)意義。
谷歌工程師每天都會(huì)對(duì)搜索感冒相關(guān)詞的搜索量做分析,在正常情況下,某地區(qū)每日的搜索量都會(huì)在一個(gè)正常的范圍內(nèi)波動(dòng)。但如果有一天(比如12號(hào)開(kāi)始),某地區(qū)的搜索量開(kāi)始持續(xù)上升,這上升的背后,其實(shí)體現(xiàn)的是患感冒人數(shù)的增加。這就是GFT產(chǎn)品背后的數(shù)據(jù)思維,基于搜索詞的熱度來(lái)預(yù)測(cè)流感的爆發(fā)。這個(gè)產(chǎn)品,甚至可以在流感爆發(fā)前的7-14天就能夠做出預(yù)判。因此,國(guó)家或企業(yè)都可以基于此預(yù)測(cè)進(jìn)行相應(yīng)的準(zhǔn)備活動(dòng)。
所以,可以基于數(shù)據(jù)的變化,而探知業(yè)務(wù)的變化,從而可以進(jìn)一步思考給出相應(yīng)的業(yè)務(wù)判斷和業(yè)務(wù)建議。即,數(shù)據(jù)的變化就意味著業(yè)務(wù)的變化。
這也是我們做決策的另一個(gè)底層邏輯,找到業(yè)務(wù)短板和變化,給出應(yīng)對(duì)策略。最典型的就是運(yùn)營(yíng)分析,通過(guò)大量的KPI指標(biāo)來(lái)呈現(xiàn)業(yè)務(wù)運(yùn)營(yíng)的各個(gè)環(huán)節(jié)的發(fā)展情況,以找到需要改進(jìn)的環(huán)節(jié),并做出優(yōu)化建議。
世界是物質(zhì)的,而物質(zhì)是運(yùn)動(dòng)的,變化是事物的本質(zhì)。
一切事物都在運(yùn)動(dòng)變化,這些運(yùn)動(dòng)變化是可以被探知的。大數(shù)據(jù),則是及時(shí)發(fā)現(xiàn)事物變化的一個(gè)工具。
3.3 理清關(guān)系
*印第安納大學(xué)的教授約翰·博倫(Johan Bollen),曾發(fā)表了一篇文章《Twitter情緒預(yù)測(cè)股票市場(chǎng)》。這些教授們一直想弄清楚到底是什么因素在影響股票的漲和跌,以及能否預(yù)測(cè)股市的漲或跌。于是,他們收集了2008~2010年期間在Twitter上發(fā)表的上億條條文,然后做了一個(gè)對(duì)用戶情緒的量化模型,就是根據(jù)發(fā)表?xiàng)l文的字詞來(lái)估算用戶的情緒,并將其量化為一個(gè)情緒數(shù)值。一個(gè)用戶就有一個(gè)情緒指標(biāo),然后,他們把當(dāng)天發(fā)表?xiàng)l文的所有用戶的情緒指標(biāo)綜合起來(lái),最后形成了一個(gè)客戶群的綜合情緒指數(shù)。最后,他們把這個(gè)客戶群的綜合情緒指數(shù)按照時(shí)間的維度連接起來(lái)就形成了一條情緒曲線,然后,再把這條情緒曲線和道瓊斯指數(shù)曲線進(jìn)行比對(duì)。經(jīng)過(guò)不斷的優(yōu)化他們量化情緒的模型,他們很驚奇地發(fā)現(xiàn),這條情緒曲線的波動(dòng)居然和股票曲線的漲跌有著驚人一致(如下圖所求)。
仔細(xì)觀察一下,下圖的情緒曲線與股票曲線并不是完全重疊的,而是,情緒曲線在股票曲線波動(dòng)的之前。也就是說(shuō),當(dāng)情緒曲線往后挪3~4天以后,情緒的波動(dòng)和股票的漲跌就基本上吻合了,這也就說(shuō)明,可以利用情緒來(lái)初步判斷股票的漲跌,這開(kāi)啟了大數(shù)據(jù)炒股的新時(shí)代。
用大數(shù)據(jù)的技術(shù)語(yǔ)言來(lái)說(shuō),就是,情緒指數(shù)與股票指數(shù)的具有相關(guān)性。
相關(guān)性分析,是大數(shù)據(jù)時(shí)代用得最多的一類分析方法之一,可用來(lái)探索事物之間的相互影響和相互制約的關(guān)系。
比如,企業(yè)的采購(gòu)、生廠、設(shè)計(jì)、市場(chǎng)、售后等等,都是相互影響和相系制約的。
唯物辯證法認(rèn)為,世界上的一切事物都處在普遍聯(lián)系中,沒(méi)有任何一個(gè)事物是孤立地存在的。聯(lián)系是指事物之間以及事物內(nèi)部諸要素之間相互連結(jié)、相互依賴、相互影響、相互作用、相互轉(zhuǎn)化等相互關(guān)系。
一句話,萬(wàn)物皆有聯(lián)系!而大數(shù)據(jù),成為探索事物間相互聯(lián)系的一種有效的手段。
3.4 預(yù)測(cè)未來(lái)
大數(shù)據(jù)的核心是預(yù)測(cè)。
在2008年,當(dāng)大多數(shù)企業(yè)在經(jīng)濟(jì)危機(jī)中掙扎時(shí),阿里巴巴卻相對(duì)輕松地地度過(guò)了此次危機(jī),因?yàn)榘⒗锇桶吞崆熬皖A(yù)測(cè)到經(jīng)濟(jì)危機(jī)要來(lái)了。
他們是如何預(yù)測(cè)到經(jīng)濟(jì)危機(jī)要來(lái)的呢?其實(shí)馬云在很多次場(chǎng)合都說(shuō)過(guò),他說(shuō)阿里巴巴有兩大類重要的數(shù)據(jù),一類是交易數(shù)據(jù),另一類是詢盤(pán)數(shù)據(jù)。詢盤(pán)數(shù)據(jù),指的就是在網(wǎng)站的瀏覽數(shù)據(jù)、搜索數(shù)據(jù)、點(diǎn)出數(shù)據(jù)等等。
很顯然,詢盤(pán)數(shù)據(jù)和交易數(shù)據(jù)是有關(guān)系的。首先,詢盤(pán)量和交易量存在正相關(guān)的關(guān)系;其次,詢盤(pán)數(shù)據(jù)肯定發(fā)生在交易數(shù)據(jù)的前面。阿里巴巴每個(gè)月都會(huì)對(duì)這兩大類數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,找到他們的關(guān)系和規(guī)律。在2008年的年初,他們發(fā)現(xiàn)詢盤(pán)數(shù)據(jù)已經(jīng)持續(xù)幾個(gè)月都在下降了,盡管此時(shí)交易數(shù)據(jù)并沒(méi)有明顯的下降趨勢(shì),但基于上面的關(guān)系,可預(yù)見(jiàn),在未來(lái)的交易數(shù)據(jù)也肯定會(huì)下降。因此,阿里巴巴才作出了“經(jīng)濟(jì)危機(jī)”的初步判斷,然后,再收集更多的數(shù)據(jù)來(lái)驗(yàn)證這個(gè)判斷的正確性,并進(jìn)而作了大量的準(zhǔn)備,從而安然度過(guò)這次經(jīng)濟(jì)危機(jī)。
大家都知道,大數(shù)據(jù)分析的是已經(jīng)發(fā)生過(guò)的數(shù)據(jù),那么過(guò)去的數(shù)據(jù)已經(jīng)發(fā)生了還有什么用呢?其實(shí),大數(shù)據(jù)只是借分析過(guò)去的數(shù)據(jù),來(lái)探索事物的規(guī)律和特征,其目的是為了預(yù)判事物在未來(lái)的發(fā)展變化或發(fā)展趨勢(shì),
因此,大數(shù)據(jù)的目的是預(yù)測(cè),基于對(duì)事物的預(yù)測(cè)結(jié)果,用來(lái)作出相應(yīng)的策略調(diào)整。如果預(yù)測(cè)的結(jié)果不是我們想要的,則需要調(diào)整相應(yīng)的策略,施加影響因素,使得事物朝著我們想要的方向去發(fā)展。
所以,大數(shù)據(jù)描述的是過(guò)去,表達(dá)的卻是未來(lái)!只有預(yù)見(jiàn)未來(lái),才能把握未來(lái)!
可見(jiàn),大數(shù)據(jù)之所以能夠用來(lái)進(jìn)行業(yè)務(wù)決策,不外乎就是通過(guò)對(duì)數(shù)據(jù)的分析,來(lái)實(shí)現(xiàn)對(duì)業(yè)務(wù)特征、業(yè)務(wù)規(guī)律、業(yè)務(wù)變化的把握,以及影響業(yè)務(wù)變化的關(guān)鍵因素進(jìn)行分析,來(lái)達(dá)到了解業(yè)務(wù),預(yù)測(cè)業(yè)務(wù)未來(lái)發(fā)展的目的。
所以,大數(shù)據(jù)分析的核心價(jià)值,就是去發(fā)現(xiàn)數(shù)據(jù)的特征、變化和關(guān)系。
因?yàn)閿?shù)據(jù)的特征就是業(yè)務(wù)的特征,數(shù)據(jù)的變化就是業(yè)務(wù)的變化,數(shù)據(jù)間的關(guān)系就是業(yè)務(wù)因素間的關(guān)系。
轉(zhuǎn)載:http://szsxbj.com/zixun_detail/111710.html