興迪資訊科技有限公司

New Design Information Technologies Ltd.

小(xiǎo)數據如何起步,從小(xiǎo)數據到到數據
來源: | 作者:pro46dade | 發布時間: 2017-09-05 | 1115 次浏覽 | 分(fēn)享到:
要做大(dà)數據,首先要了解自己的企業,或者自己所在的行業的核心是什麽。我(wǒ)(wǒ)們現在經常發現,有很多企業在競争的過程中(zhōng),最終不是被現在的競争對手打敗,而是被很多不是你的競争對手所打敗。很簡單的一(yī)個例子,大(dà)家都認爲亞馬遜是做電商(shāng)的,但這是錯的,它現在最主要的收入來自于雲(雲服務)。也就是說企業需要找到自己的核心數據(價值)。
目前國内外(wài)關于大(dà)數據的談論很多,大(dà)多是談運營級别的,或者說從服務端、服務方提得較多一(yī)些。筆者要跟大(dà)家交流的問題是作爲各類企業尤其是客戶方的企業來說,大(dà)數據跟他們有什麽關系,或者說作爲企業方怎樣去(qù)參與,這是企業方現在面臨的最大(dà)問題。
這個問題的答案重點在于大(dà)數據應該從小(xiǎo)數據開始。因爲現在很多企業面臨的最大(dà)問題不是怎麽用大(dà)數據,而是内部的一(yī)些小(xiǎo)數據整合出現問題,或者小(xiǎo)數據都沒用好的情況下(xià)怎麽用大(dà)數據。大(dà)數據應該是從小(xiǎo)數據逐漸演變上去(qù)的,是一(yī)個正常的生(shēng)态,而不是瞬間變化的。大(dà)數據這個概念跟自媒體的概念類似,需要企業自己去(qù)建設,而不是從一(yī)開始就想着依靠别人。很多企業在談自媒體的時候,像談别人的事情一(yī)樣。比如一(yī)談自媒體,就覺得那是第三方提供的一(yī)個平台,大(dà)家在那兒發發牢騷。自媒體是自己的媒體,企業自己也要參與進去(qù)。同樣大(dà)數據不是别人的大(dà)數據,我(wǒ)(wǒ)們假設有一(yī)個第三方提供了大(dà)量的數據,有很多很多信息,CI、BI之類的很多模塊化東西供我(wǒ)(wǒ)們來用。如果這樣的話,你有,競争對手也有,你能得到的東西,競争對手也能得到的情況下(xià),就不能稱之爲核心競争力。大(dà)數據作爲企業來說要變成自身的一(yī)個競争力,企業必須得建立自己的企業級的數據。
要做大(dà)數據,首先要了解自己的企業,或者自己所在的行業的核心是什麽。我(wǒ)(wǒ)們現在經常發現,有很多企業在競争的過程中(zhōng),最終不是被現在的競争對手打敗,而是被很多不是你的競争對手所打敗。很簡單的一(yī)個例子,大(dà)家都認爲亞馬遜是做電商(shāng)的,但這是錯的,它現在最主要的收入來自于雲(雲服務)。也就是說企業需要找到自己的核心數據(價值),這個是最關鍵的。隻有在這個基礎上,建立自己的大(dà)數據才有可能,才能做一(yī)些延伸。其次,要找到内部的一(yī)些外(wài)圍相關數據,去(qù)慢(màn)慢(màn)地成長它。有點像滾雪球,第一(yī)層是核心,第二層是外(wài)圍相關的數據。第三層是什麽?就是外(wài)部機構的一(yī)些結構化數據。第四層是社會化的,以及各種現在所謂的非結構化的數據。這幾層要一(yī)層一(yī)層地找到它,而且要找到與自己相關的有價值的東西。這樣你的大(dà)數據才能建立起來。
第一(yī)步,找到核心數據。核心數據現在對很多企業來說實際上就是CRM,自己的用戶系統,這是最重要的。第二步,外(wài)圍數據。比如企業經常會在線上線下(xià)舉辦一(yī)些活動,在做活動的時候,消費者的信息隻是簡單地提供在表單裏面,還是進入了CRM的系統裏? 第三步,常規渠道的數據。舉例來說一(yī)個銷售快銷品的企業,能不能夠得到沃爾瑪的數據,家樂福的數據?很多國外(wài)大(dà)數據的案例,說消費者買啤酒的時候也會購買剃須刀之類,或者一(yī)個母嬰産品的消費者她今天在買這個産品,預示着她後面必然會買另一(yī)個産品。這就有一(yī)個前期的挖掘。這些價值怎麽來的,這就需要企業去(qù)找常規渠道裏面的數據,跟自己的CRM結合起來,才能爲自己下(xià)一(yī)步做市場營銷、做推廣、産品創新等建立基礎。第四步,外(wài)部的社會化的或者非結構化的數據,即現在所謂的社會化媒體數據。這方面信息的主要特征是非結構化,而且非常龐大(dà)。這對企業來說最大(dà)的價值是什麽?當你的用戶在社會化媒體上發言的時候,你有沒有跟他建立聯系?這裏有個概念叫做DC(digital connection)。所謂的互聯網實際就是一(yī)種DC,但是通常互聯網上的那種DC是在娛樂層面。用到商(shāng)業裏面的話,就是企業必須得跟消費者建立這種DC關系,它的價值才能發揮出來。否則,你的數據以及很多的CRM數據都是死的。就像國外(wài)CRM之父Paul Greenberg寫的四本CRM相關書籍,前面三本都是在講數據庫、系統之類的。第四本書的時候,就沒有再講那些東西,講什麽?講互動,講DC,講怎麽跟消費者建立關系。

有了這個數據庫去(qù)進行數據挖掘,或者在建立數據的過程中(zhōng),企業需要從什麽方向去(qù)探索,也不是漫無目的的。首先應該跟着你的業務,業務現在有哪些問題,或者說這個行業裏面主要的競争點在哪裏,這是很關鍵的。有了這個業務關系以後,再形成假設,也就是說未來的競争點可能在哪裏,大(dà)到未來的戰略競争,小(xiǎo)到哪些方面。然後下(xià)一(yī)步要怎麽做,這些形成一(yī)個假設,其次做一(yī)些小(xiǎo)樣本的測試。很多企業一(yī)看大(dà)數據就很恐怖,說我(wǒ)(wǒ)也買不起那些大(dà)數據,也雇不起那麽專業的團隊,怎麽辦?自己做一(yī)些小(xiǎo)樣本的測試,甚至通過電子表格Excel都可以做數據挖掘。不一(yī)定非要那麽龐大(dà)、那麽貴的數據。然後再做大(dà)樣本的驗證,驗證出來的結果就可以應用到現實中(zhōng)去(qù)。
在大(dà)數據尤其是互聯網時代還有一(yī)個最重要的點,就是失效預警。即你發現一(yī)個規律,在現實中(zhōng)應用了,但是你一(yī)定要設立一(yī)些預警指标。就是當指标達到什麽程度的時候,之前發現的規律失效,那你就必須發現新的、相關的,否則也會造成一(yī)種浪費。筆者看到一(yī)篇文章,其中(zhōng)有一(yī)個重要結論。大(dà)家都在說大(dà)數據的價值很有用的時候,很多企業說我(wǒ)(wǒ)積累了多少TB,多少PB,但是你基于老的數據得出的很多結論實際是在浪費你的資源。你挖掘出來很多數據、很多規律,如果錯了,明天按這個去(qù)做,就是浪費。因此需要有一(yī)個失效預警。在這樣的過程中(zhōng),最終你需要對應建立起内部團隊,他們對數據的敏感度也才能培養起來。這時候你再去(qù)買大(dà)數據服務的時候才是有價值的。
所有這些工(gōng)作作爲企業來說是需要内部去(qù)做的,最終才能開花結果,有一(yī)些收獲。企業大(dà)數據起步,要從小(xiǎo)數據開始。
注1:關于數據挖掘過程中(zhōng)是直接上來就大(dà)數據、全數據,還是可以從一(yī)些小(xiǎo)數據、小(xiǎo)樣本入手,這方面目前存在一(yī)些争論。本文爲複旦大(dà)學主辦的“大(dà)數據與營銷傳播”高峰論壇的演講稿整理,僅代表作者觀點,供參考。