“數據是有靈魂的”,在我一直尋求數據靈魂的道路上,又走過了一年。2016這一年發生了太多太多的事情,Alphago戰勝了李世石,資本寒冬的到來,Spark2.0發布,我也加盟易觀這家專業的大數據分析公司,從過去一個大集團軍的炮兵連連長,變為小集團軍的軍長。
2016年,大數據整個行業也發生了很多重要的變化,我根據自己的觀察,簡要地分析下2016年大數據行業發生的四個重要變化的理解:
大數據的下半場
在2016年,王興說,互聯網已經進入了“下半場”,互聯網人口紅利的時間已經過去了,需要對用戶的深耕細作獲得更多的收入和利潤。過去的一年里,也涌現了很多不同行業不同技術的大數據公司,從輿情分析到數據平臺,從產品用戶分析到金融風險評估,每一家公司都看上去有獨門絕技。
但是在資本寒冬的影響下,大數據也進入了它的下半場:大數據從人人都喊大數據,開始進入到企業實用階段;投資人從看團隊、看產品進入到看收入看客戶的階段。收入和增長成為大數據公司融資下半場的門票,而打贏下半場兩個核心圍繞業務理解和核心算法逐步展開。
準確業務的理解、抓住痛點可以確保大數據不是空中樓閣,幫助企業解決實際問題從而獲得高額收入。
而算法的門檻是繼大數據采集、數據并行計算之后新的技術門檻。大數據結合現在被炒的火爆的AI算法,在互聯網、零售、金融等很多領域建立起各領域的數據模型,隨著數據反復驗證,數據模型將會越來越精準,在行業中擁有行業理解、數據和算法迭代能力的公司逐步立于不敗之地。
大數據和開源
在2016年提到大數據,不得不提開源的問題,2015年底Greenplum開源,2016年年初Tachyon更名Alluxio成立商業公司,Kylin也成立了商業化公司Kyligence,還有很多過去開源的大數據組件都相互效仿紛紛商業化。一方面,開源的確在大數據普及過程當中功不可沒,另一方面,開源在企業大數據應用過程當中添加了非常多的不確定性。每個企業的管理者都很難為不確定的結果買單,因此開源組件的商業化是一個市場轉化的必然。
但是,大多數開源組件在中國都會遇到當年軟件在中國售賣的難題,客戶總認為硬件值錢、軟件不值錢。解決方案是軟件需要集成方案一起售賣,只不過新時代下集成商越來越難做,具有大數據集成能力的公司和團隊還是太少。
當然,令人欣慰的是,華人在大數據開源組件和商業化過程當中影響力越來越大,像Kylin一樣的Apache金牌項目在未來也會越來越多,也希望國內企業和政府給國內大數據企業更多的機會,讓中國的大數據企業能走向世界。
傳統公司的“互聯網化”和互聯網公司的“傳統化”
在2016年,互聯網+的概念依然火爆,很多傳統公司在想著怎樣利用互聯網這個工具增加自己的收入或者估值。而另一個方面,從我的觀點來看,互聯網公司卻在逐步的“傳統化”。互聯網公司初期的紅利得益于新一代互聯網技術的發展,萌生BAT這樣以產品技術為驅動的巨無霸的公司。
但是隨著新興技術的成熟,一方面,每個“技術驅動”的公司都在用自己的技術搭建類似的業務平臺,重復制造車輪;另一方面,重復制造車輪的開發者也在企業內部遇到了成長瓶頸。最近從大互聯網公司出來的大數據和周邊技術創業者屢見不鮮,利用在互聯網公司海量數據處理的經驗給其他公司提供服務成為VC最常見的case。
和我交流的創業者都知道,我個人非常歡迎這種“組團”的服務,我認為無論是否是互聯網公司,一個企業應該做最擅長的技術部分而不是一攬子都做,過去因為技術不成熟只有自己摸石頭過河,技術組件成熟之后完全可以拿來主義。
因此,在易觀核心技術是圍繞在數據采集、接收、并行計算和算法方面,周邊的運維監控、查詢引擎我們都在積極尋找合作伙伴來加快易觀整體的產品技術的研發進程。如羅胖的跨年演講中提到,適合的分工協作,從小講為企業和個人節約時間,從大講為整個人類節約時間。我持有不要重復造輪子的理念,讓企業內專業的技術人員可以更多的分配到更適合的工作上去。
大數據將走向何方?
在2016年,我一直思考這個問題。過去在我的概念里,把(大)數據,分為1.0,2.0,3.0幾個階段:
1.0階段是企業ERP/CRM時代,主要面對的是企業內部的結構化數據,使用者主要是公司管理層,大部分數據解決方案是BI、A-CRM一類的解決方案;
2.0階段是互聯網的大數據時代,主要以用戶網絡行為非結構化的log為主,使用者不僅僅是公司管理者,也包括了線上的用戶,數據解決方案包括推薦引擎、個性化營銷、欺詐識別等;
3.0階段是IoT/O2O階段,通過智能的采集設備,將用戶線下的行為軌跡,生理健康特征等采集起來,解決方案包括線上線下結合的客群畫像分析、網點/交通/城市規劃、定向營銷等。
下一個數據應該走向何方呢?我在2016初步有一個結論,從1.0的交易流到2.0的線上行為軌跡流,到3.0的線下行為軌跡流,數據距離消費者距離越來越近,對業務的影響也越來越大。從種種跡象表明,未來數據4.0時代將會是用戶意識流的數據分析。
隨著大數據和AI的發展,計算機可以采集到越來越多的人們線上線下的行為,通過AI的算法先從用戶的所在的場景分析入手,開始建立場景引擎,分析給出用戶此時此刻此地的需求。再從用戶日常行為與習慣結合用戶的生理特征分析用戶所處的情感狀態,賦予合適的心情誘導與撫慰。最終分析用戶的心理需求與訴求,建立心境引擎將用戶的意識與潛意識構建模型,幫助用戶解決心理問題、給出或誘導用戶得到符合用戶心理預期的服務。我想,達到這一步的時候,大數據才會完美的和AI結合在一起,AI才會由“人工智能”變為易觀CEO于揚先生提的“擬人智能”時代。
最后,根據自己在易觀的創業經歷,給大數據創業者的幾個建議/忠告:
易觀的市場VP李智在2016年新年的時候,送給了我一本書《繽紛的海洋》,讀過之后非常有感觸。每一個海洋物種都有它天然抵抗海浪以及天敵的特性,也和其它物種一起產生某種協同,從而生長出如此繽紛美麗的海洋世界。
仔細想過之后,這些海洋生物不就是現在創業大潮當中的創業者么?在復雜的社會變革環境里,大家各懷絕技,創造出紛繁復雜的企業生態,無論生存或死亡都給這個社會的大海留下美麗的創業生態群落。作為一個10多年數據的從業者加盟到創業環境當中摸爬滾打1年了,對于大數據的創業者有幾個心得想分享給大家:
1.勇于調整和決策
創業者面臨的環境遠非大企業的環境所比,無論資金上和團隊上都會有極大的挑戰,就像是打德州的錦標賽,籌碼本不多,一個極小的錯過或失誤都可能導致整體的牌局的失敗。回顧2016年,無論是從公用云遷移到自建的混合云,還是將研發團隊中心調整到長沙,又或是產品方向的調整,這在過去大型企業里看來都是一件不可能完成的事情(需保證公司每日過百億數據量幾千萬日活的數據分析業務),但是回顧當時如果沒有管理團隊的果斷決策,恐怕也不會有后面順利的融資,這里非常感謝易觀CEO于揚先生給我的指導,受益頗多。每個創業者其實都是窮其所能在關鍵時期將過去的不可能事情成為可能,才可以在復雜的商業環境中脫穎而出。
2.要組團而不是單干
大數據最近非常火爆,投資也源源不斷。在做大數據創業的時候,無論公司是小是大往往有一個誤區,認為花時間找到團隊可以做到大數據端到端的解決方案,一個公司獨立完成對一個客戶的所有需求的交付。這是一個誤區,哪怕強大如當年IBM,Teradata,HP這樣的公司,也無法完成這樣的宏愿。
目前國內的大數據創業公司也應該根據自己的特點選擇一個專注點直接擊穿,其他選擇合適別家公司的生態組合,最終滿足市場的的需求。
個人也是如此,我見識過太多的小伙伴或者小團隊抱著滿腔熱情準備創業,大部分都會鎩羽而歸,不是技術不好或者商務不好,需要的是個人之間的組團和企業之間的組團才可以在大數據熱潮當中立于不敗之地。
3.要忽悠更要實操
大數據最近過于火爆,出現了很多能說不能做的公司,最終使得大數據很多時候和“大忽悠”畫上了等號。作為一個多年數據業務的我來講,有時候也覺得挺悲哀。一方面,國內很多企業認知數據價值和數據分析價值時,需要市場培育的時間,“忽悠”在某種程度上是必要的,這樣才可以讓企業管理者反思自己的需求,投入資金不斷嘗試。而忽悠過后的落地和實施更加重要,只有讓企業實現業務價值才可以讓數據分析成為一個可持續的生意,而不是一場“大數據運動”。只有技術或者只有業務方案都不能成為一個完整的大數據解決方案,需要對業務本身的深刻理解加上過硬的技術和落地實施能力才可以幫助企業通過數據提效避險。
2016年已經過去,2017年已經到來,新的一年,我會依然堅定不移的走在追求“數據靈魂”的道路上。我不知道人類“意識大數據”的時代何時可以到來,但是我相信隨著人類生活的數字化,AI算法的不斷精進,總有一天人類無法看清自己的事情會讓數據和AI算法看清,在那時,蘇格拉底的那句名言“認識你自己”將會是大數據輔助你來完成。
(審核編輯: 智匯小蟹)
分享