數據(ju)是(shi)有價值(zhi)的,但大數據(ju)最核(he)心的價值(zhi)到(dao)底(di)是(shi)什么(me)?能夠用大數據(ju)來作什么(me)呢(ni)?
我(wo)總結了一(yi)下,大(da)數據最核(he)心的作(zuo)用和價值有四個方面:
1) 查看數據規律,來探(tan)索事物的運行規律和特征
2) 發現數據(ju)變化,來探索業務的(de)變化和業務問題
3) 理(li)清數據關(guan)系(xi),來尋找影(ying)響(xiang)業務運行的關(guan)鍵(jian)因素
4) 擬合數(shu)據模型,來(lai)預判業務在未來(lai)的發(fa)展趨(qu)勢
下面我將為(wei)大家舉一(yi)些(xie)案例,看如何(he)利用大數據來實現這些(xie)價值。
3.1 探索規律
利用(yong)大(da)數據(ju)來探索業(ye)務運行的規律和特征。
拿產品的銷(xiao)量(liang)分析來說(shuo),我們收集產品的銷(xiao)量(liang)數(shu)據,作趨勢分析,得到下圖(tu)所示的按照時間維度(星期)的折線圖(tu)。
從數(shu)據的(de)特征可以看出,產品(pin)的(de)銷量(liang)基本上是(shi)(shi)隨著時(shi)間在(zai)逐(zhu)步上升的(de),周(zhou)末(mo)的(de)產品(pin)銷量(liang)比較高(gao),即非(fei)工作日(ri)(ri)比工作日(ri)(ri)的(de)產品(pin)銷量(liang)要高(gao),這是(shi)(shi)絕大多數(shu)零售店的(de)銷售規律,即“周(zhou)末(mo)是(shi)(shi)交(jiao)易高(gao)峰時(shi)間”。
而(er)銷量(liang)高,也就(jiu)意味著在(zai)產品銷售上的規(gui)律,即客流量(liang)比較大,看(kan)來周末上街購物的人數比較多。所以,從業務角(jiao)度看(kan),也就(jiu)發(fa)現了客流量(liang)在(zai)時間上的分布(bu)規(gui)律。
基(ji)于客(ke)流(liu)量的(de)(de)(de)分布規律,就(jiu)可以(yi)提出如(ru)下(xia)的(de)(de)(de)業務建(jian)議或策略:在(zai)(zai)人力安排(pai)上,周末(mo)需要(yao)更(geng)多(duo)的(de)(de)(de)銷售(shou)(shou)員工(gong)上班(ban);在(zai)(zai)庫(ku)(ku)存(cun)管理(li)上,在(zai)(zai)周四或周五就(jiu)要(yao)安排(pai)人員檢查庫(ku)(ku)存(cun),確保(bao)庫(ku)(ku)存(cun)中有足夠(gou)的(de)(de)(de)產品在(zai)(zai)周末(mo)售(shou)(shou)賣(mai);在(zai)(zai)營(ying)銷活動(dong)的(de)(de)(de)時(shi)間安排(pai)上,要(yao)想達到更(geng)好的(de)(de)(de)品牌(pai)宣(xuan)傳(chuan)效(xiao)果或者銷售(shou)(shou)業績,就(jiu)得選(xuan)擇(ze)在(zai)(zai)客(ke)流(liu)量多(duo)的(de)(de)(de)周末(mo)時(shi)間進行宣(xuan)傳(chuan)和促銷,等等。
所以,大(da)數(shu)據能夠幫助我們做決策,是怎樣做到的呢(ni)?
背后的(de)思維其(qi)實很(hen)簡(jian)單,就是,先利(li)用(yong)數(shu)據(ju)來(lai)探索業務的(de)發展規(gui)律和特(te)征(zheng),再利(li)用(yong)業務規(gui)律,按規(gui)律來(lai)決策,就能夠做到事半功倍的(de)效果。
哲學告訴我們,任何事物都是發展的,發展必(bi)定是有規律(lv)的,即萬物皆有規律(lv)。
任(ren)何客觀事物(wu),大到天體運行,中(zhong)到社會發展,小到原子分子的運行,都(dou)是(shi)有(you)規(gui)(gui)律的。而大數(shu)據,則是(shi)探索事物(wu)規(gui)(gui)律的有(you)效的工(gong)具!
3.2 發(fa)現變化
利用(yong)大數據來發(fa)現業務運行的變化和問題。
谷歌公司的(de)流感趨勢預測產品(Google Flu Trends, GFT)是2008年推(tui)出的(de)一(yi)款預測流感的(de)產品,可以說是比較早的(de)一(yi)個(ge)大(da)數據(ju)產品了。
正常(chang)情(qing)況下,傳統(tong)的(de)(de)(de)(de)疫(yi)情(qing)報告是由各地(di)(di)醫院(yuan)、診所(suo)和(he)醫務(wu)人員向*CDC(疾病控制(zhi)(zhi)和(he)預防中心)上報的(de)(de)(de)(de),但(dan)這(zhe)種方法往往會(hui)有10~14天的(de)(de)(de)(de)時間延(yan)遲,而在這(zhe)兩周內(nei),疫(yi)情(qing)有可能早已經迅速擴(kuo)散(san)。而谷歌的(de)(de)(de)(de)這(zhe)款產品,卻可以利(li)用了各個地(di)(di)區用戶搜索關鍵詞(ci)的(de)(de)(de)(de)數據量來判斷(duan)流(liu)感(gan)的(de)(de)(de)(de)傳播(bo)情(qing)況,來實(shi)時呈現(xian)或預測流(liu)感(gan)蔓延(yan)到哪個地(di)(di)區了,這(zhe)對于(yu)CDC及(ji)時控制(zhi)(zhi)疫(yi)情(qing)具有更大的(de)(de)(de)(de)指導意(yi)義。
谷歌工(gong)程(cheng)師(shi)每(mei)(mei)天都會對搜(sou)索感(gan)冒(mao)相(xiang)關詞的(de)(de)搜(sou)索量(liang)做(zuo)分析,在(zai)正常(chang)情(qing)況下,某地(di)區每(mei)(mei)日的(de)(de)搜(sou)索量(liang)都會在(zai)一個正常(chang)的(de)(de)范圍內波動。但(dan)如(ru)(ru)果有(you)一天(比如(ru)(ru)12號開(kai)始(shi)),某地(di)區的(de)(de)搜(sou)索量(liang)開(kai)始(shi)持(chi)續上(shang)升,這(zhe)上(shang)升的(de)(de)背(bei)后,其實體(ti)現的(de)(de)是患感(gan)冒(mao)人數的(de)(de)增加。這(zhe)就是GFT產(chan)品背(bei)后的(de)(de)數據思維,基(ji)(ji)于搜(sou)索詞的(de)(de)熱度來(lai)預測流感(gan)的(de)(de)爆發(fa)。這(zhe)個產(chan)品,甚(shen)至(zhi)可(ke)以在(zai)流感(gan)爆發(fa)前的(de)(de)7-14天就能夠做(zuo)出(chu)預判(pan)。因此(ci)(ci),國家或企(qi)業都可(ke)以基(ji)(ji)于此(ci)(ci)預測進行相(xiang)應的(de)(de)準備活動。
所(suo)以,可以基于數據的(de)變(bian)化(hua)(hua),而探(tan)知業(ye)務(wu)的(de)變(bian)化(hua)(hua),從而可以進一步思考給(gei)出相應的(de)業(ye)務(wu)判斷(duan)和(he)業(ye)務(wu)建議。即(ji),數據的(de)變(bian)化(hua)(hua)就意(yi)味著(zhu)業(ye)務(wu)的(de)變(bian)化(hua)(hua)。
這(zhe)也是我(wo)們(men)做(zuo)(zuo)決(jue)策的(de)另(ling)一(yi)個底層邏輯,找到(dao)(dao)業務短板和變化,給出(chu)應對策略。最(zui)典型的(de)就(jiu)是運(yun)營(ying)分析(xi),通(tong)過大量的(de)KPI指標(biao)來(lai)呈現業務運(yun)營(ying)的(de)各個環節(jie)的(de)發展(zhan)情況(kuang),以找到(dao)(dao)需要改進的(de)環節(jie),并(bing)做(zuo)(zuo)出(chu)優化建議。
世界是(shi)物質(zhi)的,而(er)物質(zhi)是(shi)運(yun)動的,變(bian)化是(shi)事物的本質(zhi)。
一切事物(wu)都在運動變化(hua),這些運動變化(hua)是可以被探知(zhi)的。大數據,則是及時發現事物(wu)變化(hua)的一個工具。
3.3 理清關系
*印(yin)第安納(na)大學的(de)(de)教(jiao)授(shou)約翰·博倫(Johan Bollen),曾發表(biao)了(le)一(yi)篇文(wen)章《Twitter情(qing)(qing)緒(xu)(xu)預測(ce)股(gu)(gu)票(piao)市場(chang)》。這(zhe)(zhe)些(xie)教(jiao)授(shou)們(men)一(yi)直(zhi)想弄清楚到底(di)是什(shen)么因素(su)在影響(xiang)股(gu)(gu)票(piao)的(de)(de)漲(zhang)和跌(die)(die),以及能否預測(ce)股(gu)(gu)市的(de)(de)漲(zhang)或跌(die)(die)。于是,他們(men)收(shou)集了(le)2008~2010年期(qi)間(jian)在Twitter上(shang)發表(biao)的(de)(de)上(shang)億條(tiao)條(tiao)文(wen),然(ran)后(hou)做(zuo)了(le)一(yi)個(ge)對(dui)用戶(hu)(hu)(hu)(hu)情(qing)(qing)緒(xu)(xu)的(de)(de)量(liang)化模(mo)型(xing),就(jiu)是根據(ju)發表(biao)條(tiao)文(wen)的(de)(de)字詞來估算用戶(hu)(hu)(hu)(hu)的(de)(de)情(qing)(qing)緒(xu)(xu),并將其量(liang)化為(wei)一(yi)個(ge)情(qing)(qing)緒(xu)(xu)數(shu)值。一(yi)個(ge)用戶(hu)(hu)(hu)(hu)就(jiu)有一(yi)個(ge)情(qing)(qing)緒(xu)(xu)指(zhi)標,然(ran)后(hou),他們(men)把當天發表(biao)條(tiao)文(wen)的(de)(de)所有用戶(hu)(hu)(hu)(hu)的(de)(de)情(qing)(qing)緒(xu)(xu)指(zhi)標綜(zong)(zong)合起來,最后(hou)形成了(le)一(yi)個(ge)客(ke)戶(hu)(hu)(hu)(hu)群的(de)(de)綜(zong)(zong)合情(qing)(qing)緒(xu)(xu)指(zhi)數(shu)。最后(hou),他們(men)把這(zhe)(zhe)個(ge)客(ke)戶(hu)(hu)(hu)(hu)群的(de)(de)綜(zong)(zong)合情(qing)(qing)緒(xu)(xu)指(zhi)數(shu)按照(zhao)時間(jian)的(de)(de)維(wei)度連接起來就(jiu)形成了(le)一(yi)條(tiao)情(qing)(qing)緒(xu)(xu)曲(qu)線(xian),然(ran)后(hou),再把這(zhe)(zhe)條(tiao)情(qing)(qing)緒(xu)(xu)曲(qu)線(xian)和道瓊(qiong)斯指(zhi)數(shu)曲(qu)線(xian)進行比對(dui)。經過不斷的(de)(de)優(you)化他們(men)量(liang)化情(qing)(qing)緒(xu)(xu)的(de)(de)模(mo)型(xing),他們(men)很驚(jing)奇地發現(xian),這(zhe)(zhe)條(tiao)情(qing)(qing)緒(xu)(xu)曲(qu)線(xian)的(de)(de)波動(dong)居然(ran)和股(gu)(gu)票(piao)曲(qu)線(xian)的(de)(de)漲(zhang)跌(die)(die)有著驚(jing)人一(yi)致(如下圖所求)。
仔細觀察一(yi)下(xia),下(xia)圖的情(qing)緒曲線與(yu)股(gu)票(piao)曲線并不是完全重疊的,而是,情(qing)緒曲線在股(gu)票(piao)曲線波(bo)動(dong)的之前。也(ye)就(jiu)是說,當情(qing)緒曲線往(wang)后(hou)挪3~4天以后(hou),情(qing)緒的波(bo)動(dong)和股(gu)票(piao)的漲(zhang)跌就(jiu)基本上吻合了,這也(ye)就(jiu)說明,可(ke)以利(li)用情(qing)緒來初(chu)步判斷股(gu)票(piao)的漲(zhang)跌,這開啟(qi)了大數據炒股(gu)的新(xin)時代。
用大(da)數(shu)據的技術(shu)語言來說,就是,情(qing)緒指(zhi)數(shu)與股票(piao)指(zhi)數(shu)的具(ju)有相關性(xing)。
相關性分析,是大數據時代用(yong)得(de)最多的(de)(de)一類(lei)分析方法之一,可用(yong)來(lai)探索事(shi)物之間的(de)(de)相互影響(xiang)和相互制約的(de)(de)關系。
比(bi)如(ru),企業的采購、生廠、設(she)計、市場、售后等等,都是相(xiang)互影響和相(xiang)系(xi)制約的。
唯物辯(bian)證法認為,世(shi)界上(shang)的一切事物都(dou)處在普遍聯系中(zhong),沒(mei)有任何一個事物是孤(gu)立地存在的。聯系是指事物之間(jian)以及事物內部諸要素之間(jian)相互(hu)連結(jie)、相互(hu)依賴、相互(hu)影響、相互(hu)作(zuo)用、相互(hu)轉(zhuan)化等相互(hu)關系。
一句話,萬物皆有聯(lian)系!而(er)大數據,成為探索(suo)事物間相互(hu)聯(lian)系的一種有效的手段(duan)。
3.4 預測未來(lai)
大數據(ju)的核心是預(yu)測。
在(zai)2008年,當大多(duo)數企業(ye)在(zai)經(jing)濟危機中掙扎(zha)時,阿里巴巴卻相對(dui)輕松地(di)地(di)度過(guo)了此次危機,因為阿里巴巴提前(qian)就預測到經(jing)濟危機要來了。
他們是如何預(yu)測到經(jing)濟危機要來(lai)的(de)呢(ni)?其(qi)實馬(ma)云(yun)在(zai)很多次場合都說過,他說阿里巴(ba)巴(ba)有(you)兩大類重要的(de)數據(ju)(ju),一類是交易數據(ju)(ju),另一類是詢盤(pan)數據(ju)(ju)。詢盤(pan)數據(ju)(ju),指的(de)就是在(zai)網站的(de)瀏覽數據(ju)(ju)、搜索數據(ju)(ju)、點出數據(ju)(ju)等等。
很顯然,詢(xun)(xun)盤數(shu)(shu)(shu)據(ju)和(he)(he)交(jiao)(jiao)(jiao)易數(shu)(shu)(shu)據(ju)是有關(guan)(guan)系(xi)的(de)。首先,詢(xun)(xun)盤量和(he)(he)交(jiao)(jiao)(jiao)易量存在(zai)正相關(guan)(guan)的(de)關(guan)(guan)系(xi);其次,詢(xun)(xun)盤數(shu)(shu)(shu)據(ju)肯定發(fa)(fa)生在(zai)交(jiao)(jiao)(jiao)易數(shu)(shu)(shu)據(ju)的(de)前面(mian)。阿里巴(ba)巴(ba)每個月(yue)都會對這兩大類數(shu)(shu)(shu)據(ju)進行統(tong)計和(he)(he)分析,找到他們的(de)關(guan)(guan)系(xi)和(he)(he)規(gui)律。在(zai)2008年的(de)年初,他們發(fa)(fa)現詢(xun)(xun)盤數(shu)(shu)(shu)據(ju)已經持續(xu)幾個月(yue)都在(zai)下降了,盡管此時交(jiao)(jiao)(jiao)易數(shu)(shu)(shu)據(ju)并沒有明(ming)顯的(de)下降趨勢,但基于上面(mian)的(de)關(guan)(guan)系(xi),可預見,在(zai)未來的(de)交(jiao)(jiao)(jiao)易數(shu)(shu)(shu)據(ju)也肯定會下降。因此,阿里巴(ba)巴(ba)才(cai)作出了“經濟危機”的(de)初步判(pan)斷,然后(hou),再收集更多的(de)數(shu)(shu)(shu)據(ju)來驗證(zheng)這個判(pan)斷的(de)正確(que)性,并進而作了大量的(de)準備(bei),從而安然度過這次經濟危機。
大(da)(da)家都知道(dao),大(da)(da)數據(ju)分(fen)析(xi)的(de)(de)是已(yi)經發生過(guo)(guo)的(de)(de)數據(ju),那么(me)過(guo)(guo)去(qu)的(de)(de)數據(ju)已(yi)經發生了還(huan)有(you)什(shen)么(me)用呢(ni)?其(qi)實,大(da)(da)數據(ju)只是借(jie)分(fen)析(xi)過(guo)(guo)去(qu)的(de)(de)數據(ju),來(lai)探索事(shi)物的(de)(de)規律和(he)特征,其(qi)目的(de)(de)是為了預(yu)判(pan)事(shi)物在未來(lai)的(de)(de)發展變化或發展趨勢,
因此,大數據的(de)(de)目的(de)(de)是(shi)預(yu)測,基于(yu)對事(shi)物的(de)(de)預(yu)測結果(guo)(guo),用來作出相(xiang)應的(de)(de)策略調整。如果(guo)(guo)預(yu)測的(de)(de)結果(guo)(guo)不是(shi)我們想要(yao)的(de)(de),則需要(yao)調整相(xiang)應的(de)(de)策略,施加(jia)影(ying)響因素,使得(de)事(shi)物朝著(zhu)我們想要(yao)的(de)(de)方向去發(fa)展。
所(suo)以,大數據(ju)描述(shu)的是過去,表達(da)的卻是未來(lai)(lai)!只有(you)預見未來(lai)(lai),才(cai)能把握未來(lai)(lai)!
可(ke)見,大數據之(zhi)所以能夠用來進(jin)行業務決(jue)策,不外(wai)乎就是通過對(dui)數據的分析,來實現對(dui)業務特征、業務規(gui)律(lv)、業務變(bian)化(hua)的把握,以及影響(xiang)業務變(bian)化(hua)的關鍵因素進(jin)行分析,來達到了解業務,預測業務未來發展的目(mu)的。
所以,大數(shu)(shu)據分析的(de)(de)核(he)心價值,就是去發現數(shu)(shu)據的(de)(de)特征、變化和(he)關系。
因為數(shu)據(ju)的(de)(de)(de)特征(zheng)就(jiu)是業務的(de)(de)(de)特征(zheng),數(shu)據(ju)的(de)(de)(de)變(bian)化(hua)就(jiu)是業務的(de)(de)(de)變(bian)化(hua),數(shu)據(ju)間(jian)的(de)(de)(de)關系就(jiu)是業務因素間(jian)的(de)(de)(de)關系。
轉載://citymember.cn/zixun_detail/111710.html