工業(yè)大數(shù)據(jù):數(shù)據(jù)采集的那些事
點(diǎn)擊:2502
A+ A-
所屬頻道:新聞中心
實(shí)現(xiàn)工業(yè)4.0,需要高度的工業(yè)化、自動(dòng)化基礎(chǔ),是漫長(zhǎng)的征程。工業(yè)大數(shù)據(jù)是未來(lái)工業(yè)在全球市場(chǎng)競(jìng)爭(zhēng)中發(fā)揮優(yōu)勢(shì)的關(guān)鍵。無(wú)論是德國(guó)工業(yè)4.0、美國(guó)工業(yè)互聯(lián)網(wǎng)還是《中國(guó)制造2025》,各國(guó)制造業(yè)創(chuàng)新戰(zhàn)略的實(shí)施基礎(chǔ)都是工業(yè)大數(shù)據(jù)的搜集和特征分析,及以此為未來(lái)制造系統(tǒng)搭建的無(wú)憂環(huán)境。不論智能制造發(fā)展到何種程度,數(shù)據(jù)采集都是生產(chǎn)中最實(shí)際最高頻的需求,也是工業(yè)4.0的先決條件。
數(shù)字化工廠不等于無(wú)人工廠,產(chǎn)品配置,制造流程越復(fù)雜越多變,越需要人的參與;在數(shù)字化工廠當(dāng)中,工人更多地是處理異常情況,調(diào)整設(shè)備。但數(shù)據(jù)采集一直是困擾著所有制造工廠的傳統(tǒng)痛點(diǎn),自動(dòng)化設(shè)備品牌類型繁多,廠家和數(shù)據(jù)接口各異,國(guó)外廠家本地支持有限,不同采購(gòu)年代。即便產(chǎn)量停機(jī)數(shù)據(jù)自動(dòng)采集了,也不等于整個(gè)制造過(guò)程數(shù)據(jù)都獲得了,只要還有其他人工參與環(huán)節(jié),這些數(shù)據(jù)就不完整。
工業(yè)數(shù)據(jù)采集類型
互聯(lián)網(wǎng)的數(shù)據(jù)主要來(lái)自于互聯(lián)網(wǎng)用戶和服務(wù)器等網(wǎng)絡(luò)設(shè)備,主要是大量的文本數(shù)據(jù)、社交數(shù)據(jù)以及多媒體數(shù)據(jù)等,而工業(yè)數(shù)據(jù)主要來(lái)源于機(jī)器設(shè)備數(shù)據(jù)、工業(yè)信息化數(shù)據(jù)和產(chǎn)業(yè)鏈相關(guān)數(shù)據(jù)。
從數(shù)據(jù)采集的類型上看,不僅要涵蓋基礎(chǔ)的數(shù)據(jù),還將逐步包括半結(jié)構(gòu)化的用戶行為數(shù)據(jù),網(wǎng)狀的社交關(guān)系數(shù)據(jù),文本或音頻類型的用戶意見(jiàn)和反饋數(shù)據(jù),設(shè)備和傳感器采集的周期性數(shù)據(jù),網(wǎng)絡(luò)爬蟲(chóng)獲取的互聯(lián)網(wǎng)數(shù)據(jù),以及未來(lái)越來(lái)越多有潛在意義的各類數(shù)據(jù)。主要包括以下幾種:
1、海量的Key-Value數(shù)據(jù)。在傳感器技術(shù)飛速發(fā)展的今天,包括光電、熱敏、氣敏、力敏、磁敏、聲敏、濕敏等不同類別的工業(yè)傳感器在現(xiàn)場(chǎng)得到了大量應(yīng)用,而且很多時(shí)候機(jī)器設(shè)備的數(shù)據(jù)大概要到ms的精度才能分析海量的工業(yè)數(shù)據(jù),因此,這部分?jǐn)?shù)據(jù)的特點(diǎn)是每條數(shù)據(jù)內(nèi)容很少,但是頻率極高。
2、文檔數(shù)據(jù)。包括工程圖紙、仿真數(shù)據(jù)、設(shè)計(jì)的CAD圖紙等,還有大量的傳統(tǒng)工程文檔。
3、信息化數(shù)據(jù)。由工業(yè)信息系統(tǒng)產(chǎn)生的數(shù)據(jù),一般是通過(guò)數(shù)據(jù)庫(kù)形式存儲(chǔ)的,這部分?jǐn)?shù)據(jù)是最好采集的。
4、接口數(shù)據(jù)。由已經(jīng)建成的工業(yè)自動(dòng)化或信息系統(tǒng)提供的接口類型的數(shù)據(jù),包括txt格式、JSON格式、XML格式等。
5、視頻數(shù)據(jù)。工業(yè)現(xiàn)場(chǎng)會(huì)有大量的視頻監(jiān)控設(shè)備,這些設(shè)備會(huì)產(chǎn)生大量的視頻數(shù)據(jù)。
6、圖像數(shù)據(jù)。包括工業(yè)現(xiàn)場(chǎng)各類圖像設(shè)備拍攝的圖片(例如,巡檢人員用手持設(shè)備拍攝的設(shè)備、環(huán)境信息圖片)。
7、音頻數(shù)據(jù)。包括語(yǔ)音及聲音信息(例如,操作人員的通話、設(shè)備運(yùn)轉(zhuǎn)的音量等)。
8、其他數(shù)據(jù)。例如遙感遙測(cè)信息、三維高程信息等等。
數(shù)據(jù)采集的方法
傳統(tǒng)的數(shù)據(jù)采集方法包括人工錄入、調(diào)查問(wèn)卷、電話隨訪等方式,大數(shù)據(jù)時(shí)代到來(lái)后,一個(gè)突出的變化是數(shù)據(jù)采集的方法有了質(zhì)的飛躍,下面所介紹的數(shù)據(jù)采集方式的突破直接改變著大數(shù)據(jù)應(yīng)用的場(chǎng)景。
1、傳感器
傳感器是一種檢測(cè)裝置,能感受到被測(cè)量的信息,并能將檢測(cè)感受到的信息,按一定規(guī)律變換成為電信號(hào)或其他所需形式的信息輸出,以滿足信息的傳輸、處理、存儲(chǔ)、顯示、記錄和控制等要求。在生產(chǎn)車(chē)間中一般存在許多的傳感節(jié)點(diǎn),24小時(shí)監(jiān)控著整個(gè)生產(chǎn)過(guò)程,當(dāng)發(fā)現(xiàn)異常時(shí)可迅速反饋至上位機(jī),可以算得上是數(shù)據(jù)采集的感官接受系統(tǒng),屬于數(shù)據(jù)采集的底層環(huán)節(jié)。
傳感器在采集數(shù)據(jù)的過(guò)程中主要特性是其輸入與輸出的關(guān)系。
其靜態(tài)特性反映了傳感器在被測(cè)量各個(gè)值處于穩(wěn)定狀態(tài)時(shí)的輸入和輸出關(guān)系,這意味著當(dāng)輸入為常量,或變化極慢時(shí),這一關(guān)系就稱為靜態(tài)特性。我們總是希望傳感器的輸入與輸出成唯一的對(duì)照關(guān)系,最好是線性關(guān)系。
一般情況下,輸入與輸出不會(huì)符合所要求的線性關(guān)系,同時(shí)由于存在這遲滯、蠕變等因素的影響,使輸入輸出關(guān)系的唯一性也不能實(shí)現(xiàn)。因此我們不能忽視工廠中的外界影響,其影響程度取決于傳感器本身,可通過(guò)傳感器本身的改善加以抑制,有時(shí)也可以加對(duì)外界條件加以限制。
2、RFID技術(shù)
RFID(Radio Frequency Identification,射頻識(shí)別)技術(shù)是一種非接觸式的自動(dòng)識(shí)別技術(shù),通過(guò)射頻信號(hào)自動(dòng)識(shí)別目標(biāo)對(duì)象并獲取相關(guān)的數(shù)據(jù)信息。利用射頻方式進(jìn)行非接觸雙向通信,達(dá)到識(shí)別目的并交換數(shù)據(jù)。RFID技術(shù)可識(shí)別高速運(yùn)動(dòng)物體并可同時(shí)識(shí)別多個(gè)標(biāo)簽,操作快捷方便。
在工作時(shí),RFID讀寫(xiě)器通過(guò)天線發(fā)送出一定頻率的脈沖信號(hào),當(dāng)RFID標(biāo)簽進(jìn)入磁場(chǎng)時(shí),憑借感應(yīng)電流所獲得的能量發(fā)送出存儲(chǔ)在芯片中的產(chǎn)品信息(Passive Tag,無(wú)源標(biāo)簽或被動(dòng)標(biāo)簽),或者主動(dòng)發(fā)送某一頻率的信號(hào)(Active Tag,有源標(biāo)簽或主動(dòng)標(biāo)簽)。
閱讀器對(duì)接收的信號(hào)進(jìn)行解調(diào)和解碼然后送到后臺(tái)主系統(tǒng)進(jìn)行相關(guān)處理;主系統(tǒng)根據(jù)邏輯運(yùn)算判斷該卡的合法性,針對(duì)不同的設(shè)定做出相應(yīng)的處理和控制,發(fā)出指令信號(hào)控制執(zhí)行機(jī)構(gòu)動(dòng)作。
RFID技術(shù)解決了物品信息與互聯(lián)網(wǎng)實(shí)現(xiàn)自動(dòng)連接的問(wèn)題,結(jié)合后續(xù)的大數(shù)據(jù)挖掘工作,能發(fā)揮其強(qiáng)大的威力。
數(shù)據(jù)采集技術(shù)難點(diǎn)
在當(dāng)今的制造業(yè)領(lǐng)域,數(shù)據(jù)采集是一個(gè)難點(diǎn)。很多企業(yè)的生產(chǎn)數(shù)據(jù)采集主要依靠傳統(tǒng)的手工作業(yè)方式,采集過(guò)程中容易出現(xiàn)人為的記錄錯(cuò)誤且效率低下。
有些企業(yè)雖然引進(jìn)了相關(guān)技術(shù)手段,并且應(yīng)用了數(shù)據(jù)采集系統(tǒng),但是由于系統(tǒng)本身的原因以及企業(yè)沒(méi)有選擇最適合自己的數(shù)據(jù)采集系統(tǒng),因此也無(wú)法實(shí)現(xiàn)信息采集的實(shí)時(shí)性、精確性和延伸性管理,各單元出現(xiàn)了信息斷層的現(xiàn)象。
技術(shù)難點(diǎn)主要包括以下幾方面:
1、數(shù)據(jù)量巨大。任何系統(tǒng),在不同的數(shù)據(jù)量面前,需要的技術(shù)難度都是完全不同的。
如果單純是將數(shù)據(jù)采到,可能還比較好完成,但采集之后還需要處理,因?yàn)楸仨毧紤]數(shù)據(jù)的規(guī)范與清洗,因?yàn)榇罅康墓I(yè)數(shù)據(jù)是“臟”數(shù)據(jù),直接存儲(chǔ)無(wú)法用于分析,在存儲(chǔ)之前,必須進(jìn)行處理,對(duì)海量的數(shù)據(jù)進(jìn)行處理,從技術(shù)上又提高了難度。
2、工業(yè)數(shù)據(jù)的協(xié)議不標(biāo)準(zhǔn)。互聯(lián)網(wǎng)數(shù)據(jù)采集一般都是我們常見(jiàn)的HTTP等協(xié)議,但在工業(yè)領(lǐng)域,會(huì)出現(xiàn)ModBus、OPC、CAN、ControlNet、DeviceNet、Profibus、Zigbee等等各類型的工業(yè)協(xié)議,而且各個(gè)自動(dòng)化設(shè)備生產(chǎn)及集成商還會(huì)自己開(kāi)發(fā)各種私有的工業(yè)協(xié)議,導(dǎo)致在工業(yè)協(xié)議的互聯(lián)互通上,出現(xiàn)了極大地難度。
很多開(kāi)發(fā)人員在工業(yè)現(xiàn)場(chǎng)實(shí)施綜合自動(dòng)化等項(xiàng)目時(shí),遇到的最大問(wèn)題及時(shí)面對(duì)眾多的工業(yè)協(xié)議,無(wú)法有效的進(jìn)行解析和采集。
3、視頻傳輸所需帶寬巨大。傳統(tǒng)工業(yè)信息化由于都是在現(xiàn)場(chǎng)進(jìn)行數(shù)據(jù)采集,視頻數(shù)據(jù)傳輸主要在局域網(wǎng)中進(jìn)行,因此,帶寬不是主要的問(wèn)題。
但隨著云計(jì)算技術(shù)的普及及公有云的興起,大數(shù)據(jù)需要大量的計(jì)算資源和存儲(chǔ)資源,因此工業(yè)數(shù)據(jù)逐步遷移到公有云已經(jīng)是大勢(shì)所趨了。但是,一個(gè)工業(yè)企業(yè)可能會(huì)有幾十路視頻,成規(guī)模的企業(yè)會(huì)有上百路視頻,這么大量的視頻文件如何通過(guò)互聯(lián)網(wǎng)順暢到傳輸?shù)皆贫耍情_(kāi)發(fā)人員需要面臨的巨大挑戰(zhàn)。
4、對(duì)原有系統(tǒng)的采集難度大。在工業(yè)企業(yè)實(shí)施大數(shù)據(jù)項(xiàng)目時(shí),數(shù)據(jù)采集往往不是針對(duì)傳感器或者PLC,而是采集已經(jīng)完成部屬的自動(dòng)化系統(tǒng)上位機(jī)數(shù)據(jù)。
這些自動(dòng)化系統(tǒng)在部署時(shí)廠商水平參差不齊,大部分系統(tǒng)是沒(méi)有數(shù)據(jù)接口的,文檔也大量缺失,大量的現(xiàn)場(chǎng)系統(tǒng)沒(méi)有點(diǎn)表等基礎(chǔ)設(shè)置數(shù)據(jù),使得對(duì)于這部分?jǐn)?shù)據(jù)采集的難度極大。
5、安全性考慮不足。原先的工業(yè)系統(tǒng)都是運(yùn)行在局域網(wǎng)中,安全問(wèn)題不是突出考慮的重點(diǎn)。
一旦需要通過(guò)云端調(diào)度工業(yè)之中最為核心的生產(chǎn)能力,又沒(méi)有對(duì)安全的充分考慮,造成損失,是難以彌補(bǔ)的。2015年,受網(wǎng)絡(luò)安全事件影響的工業(yè)企業(yè)占比達(dá)到30%,因病毒造成停機(jī)的企業(yè)高達(dá)20%。僅美國(guó)國(guó)土安全部的工業(yè)控制系統(tǒng)網(wǎng)絡(luò)應(yīng)急響應(yīng)小組(ICS-CERT)就收到了295起針對(duì)關(guān)鍵基礎(chǔ)設(shè)施的攻擊事件。
工業(yè)數(shù)據(jù)采集方案案例
方案一:物聯(lián)網(wǎng)工業(yè)現(xiàn)場(chǎng)數(shù)據(jù)采集系統(tǒng)
本項(xiàng)目屬于物聯(lián)網(wǎng)終端傳感器系統(tǒng)的一種,通過(guò)裝在機(jī)器上的無(wú)線模塊,采集指定機(jī)器PLC工作信息,上傳到主機(jī),主機(jī)處理數(shù)據(jù)后上傳到云服務(wù)器,用戶可在手機(jī)、平板、電腦上查看機(jī)器工作信息,并可以有限度地設(shè)置機(jī)器工作參數(shù)。
方案二:太陽(yáng)能充電的數(shù)據(jù)采集數(shù)傳模塊
本方案成品底部槽位可以嵌入工業(yè)上標(biāo)準(zhǔn)din35的導(dǎo)軌,方便安裝;自帶兩路數(shù)字量輸入、兩路模擬量輸入、八路IO輸出。方案還采用了太陽(yáng)能充電模式,集成GPRS模塊,可掉線自動(dòng)復(fù)位,避免一般外置DTU掉線后需要發(fā)短信重啟的問(wèn)題。
方案三:U盤(pán)數(shù)據(jù)轉(zhuǎn)存,無(wú)紙記錄儀解決方案
無(wú)紙記錄儀是采用了最新U盤(pán)數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)轉(zhuǎn)存技術(shù)的新型無(wú)紙記錄儀。根據(jù)用戶要求其數(shù)據(jù)存儲(chǔ)容量最大可配置到32G,可以滿足任何工業(yè)現(xiàn)場(chǎng)的數(shù)據(jù)存儲(chǔ)要求。特別是通過(guò)U盤(pán)將儀表記錄的數(shù)據(jù)取出方式,與IC卡等其他方式相比,其具有數(shù)據(jù)存儲(chǔ)量大,使用方便可靠等優(yōu)點(diǎn),適合現(xiàn)場(chǎng)實(shí)際使用。
(審核編輯: 智匯胡妮)
分享