日前,百度開放云天工智能物聯網平臺再添一款重量級產品——分布式時序數據庫,距今年7月13日百度CEO李彥宏在百度云計算戰略發布會上宣布推出天工平臺不到3周時間。百度開放云也成為國內首家發布物聯網云數據庫的公有云廠商。
根據相關研究機構預測,到2020年,將有125億帶有傳感器的設備被使用、監控以及自動化部署,屆時全球數據總量將超過40ZB(相當于4萬億GB),這一數據量將是2012年的22倍,年復合增長率48%。物聯網發展已經成為驅動中國實現自動化生產的關鍵目標,而物聯網大數據將是其中的重要課題。
大數據的存儲模型經歷了多個發展階段,其中,關系型數據庫在計算機數據管理的發展史上是一個重要的里程碑。數據結構化、最低冗余度、較高的程序與數據獨立性、易于擴充、易于編制應用程序等優點,使其一直長期被廣泛應用于數據的存儲、處理及分析,但隨著網絡技術和軟件技術的飛速發展,人們發現關系型數據庫系統雖然技術很成熟,但其局限性也是顯而易見:它能很好地處理所謂的“表格型數據”,卻對越來越多復雜類型的數據無能為力。
隨著云計算時代的到來,云端的拓展也成了物聯網的重要趨勢之一。百度開放云天工平臺此次發布的分布式時序數據庫,不僅在原本關系型數據庫的優勢上給予優化,其非結構化的數據處理方式,也更好的迎合了信息時代下的數據多樣化趨勢。
時間序列數據——是在不同時間點上收集的數據,反映事物隨時間變化而變化的過程。某個鍋爐過去24小時內每分鐘的溫度就是典型的時間序列數據,它的特點是每一個時間戳對應一個數值(在上面的例子里,這個數值就是溫度)。在不同的應用場景中,這個數值可以是電流、電壓、轉速、濃度、分貝、頻率,無論是哪種度量,每一個數值都對應一個具體的采集時間戳。
天工平臺的時序數據庫(TSDB)是一種非關系型數據庫。區別于傳統的關系型數據庫,TSDB針對時間序列數據的存儲、查詢和展現進行了專門的優化,從而獲得極高的數據壓縮能力、極優的查詢性能,特別契合需要處理海量時間序列數據的物聯網應用場景,在工業制造、環境、能源、水務、物流等領域有著巨大的需求。
具體來說,基于云端去中心化架構的TSDB,能夠實現數據的海量存儲;與傳統數據庫相比存儲效率提升數十到數百倍,極大節約存儲空間;高速的檢索使數百萬條數據的查詢得以秒級響應;不僅支持十幾種聚合操作,強大的Open API還能使企業得以方便的對接各種第三方物聯網應用;此外,基于分布式架構的TSDB采用多副本存儲策略,在確保服務更加穩定的同時,更為用戶提供快速彈性擴展能力,用戶不用再擔心丟數據或者無法處理不斷增長的海量數據。
此外,TSDB更好的延續了工業用戶使用實時歷史數據庫的習慣,所采用的分布式區中心架構打破了傳統架構在性能和容量上的瓶頸,能更好地滿足工業等領域處理海量時序數據的需求,方便工業物聯網應用更加便捷地搭建在云端,實現海量數據上云,進而與開放云大數據產品與服務快速對接,實現更加高效的數據分析,洞察數據價值。
通過持續技術創新和不斷積累行業經驗,天工平臺日益成為更懂行業的智能物聯網平臺,在工業制造、能源、零售O2O、車聯網、物流等行業提供完整的解決方案。至此,天工智能物聯網平臺已經發布包括時序數據庫在內的物接入、物解析、物管理等一系列產品,據悉后續還會有規則引擎、流式處理等重量級產品推出。隨著天工平臺的完善和發展,百度開放云將成為爭奪物聯網市場的重要玩家。
(審核編輯: 智匯小蟹)
分享