<em id="jzppr"><span id="jzppr"><pre id="jzppr"></pre></span></em>
            <form id="jzppr"></form>

              <noframes id="jzppr">

              <form id="jzppr"></form>

              智能制造的核心技術之數據獲取與處理

              0
              2022-03-23 來源:?智造苑

               「 1. 數據的來源、特點與類型 」


               
              數據是制造業提高核心能力、整合產業鏈的核心手段,也是實現從要素驅動向創新驅動轉型的有力手段。數據所帶來的核心價值在于可以真實地反映和描述生產制造過程,這也就為制造過程的分析和優化提供了全新的手段與方法。因此,數據驅動也可以說是實現智能制造的關鍵步驟。
               
              傳統的分析和優化過程基于模型,而數據分析可以彌補模型精度不足。
                 
              制造業數據泛指在工業領域中,圍繞典型智能制造模式,從客戶需求到銷售、訂單、計劃、研發、設計、工藝、制造、采購、供應、庫存、發貨和交付、售后服務、運維、報廢或回收再制造等整個產品全生命周期各個環節所產生的各類數據及相關技術和應用的總稱。
               
              制造業數據的來源主要包括了3個方面:企業內部信息系統,物聯網信息以及企業外部信息。企業內部信息系統是指企業運營管理相關的業務數據,包括企業資源計劃(ERP)、產品生命周期管理(PLM)、供應鏈管理(SCM)、客戶關系管理(CRM)和能耗管理系統(EMS)等。這些系統中包含了企業生產、研發、物流、客戶服務等數據,存在于企業或者產業鏈內部。物聯網信息包含了制造過程中的數據,主要是指工業生產過程中,裝備、物料及產品加工過程的工況狀態參數、環境參數等生產情況數據,通過制造執行系統(MES)實時傳遞。企業外部信息則是指產品售出之后的使用、運營情況的數據,同時還包括大量客戶名單、供應商名單、外部的互聯網等數據。其中產品運營數據亦可來自物聯網系統。
               
              隨著傳感器的普及,以及數據采集、存儲技術的飛速發展,制造業數據同樣呈現出了大數據的基本特性,如圖1所示,已經具備了典型的“4V”特征,即規模性(volume)、多樣性(variety)、高速性(velocity)和價值密度低(value)。
               
               
              圖1 制造業數據特性
               
              規模性是指制造業數據體量比較大,大量機器設備的高頻數據和互聯網數據持續涌入,大型工業企業的數據集將達到PB級甚至EB級別。以半導體制造為例,單片晶圓質量檢測時,每個站點能生成幾MB數據。一臺快速自動檢測設備每年就可以收集到將近2TB的數據;多樣性是指數據類型多樣和來源廣泛。制造業數據分布廣泛,數據來源于機器設備、工業產品、管理系統、互聯網等各個環節,并且結構復雜,既有結構化和半結構化的傳感數據,也有非結構化數據。
               
              制造業數據除了具備傳統的大數據“4V”共性特點以外,還兼具了體現制造業特點的“3M”特性,即多來源(multi-source)、多維度(multi-dimension)、多噪聲(much noise)。
               
              多來源是指制造業數據來源廣泛。數據覆蓋了整個產品全生命周期各個環節。同樣以晶圓生產為例,晶圓制造車間的產品訂單信息、產品工藝信息、制造過程信息、制造設備信息分別來源于排產與派工系統、產品數據管理系統、制造執行系統和制造數據采集系統、數據采集與監控系統和良率管理系統等;多維度是指同一個體具有多個維度的特征屬性,不同屬性直接存在復雜的關聯或者耦合關系,并共同影響當前個體狀態。
               
              制造業數據類型繁多,根據不同的分類標準,數據的類型也不盡相同。
               
              從數據來源來看,制造業數據可以分為研發數據域(研發設計數據、開發測試數據等)、生產數據域(控制信息、工況狀態、工藝參數、系統日志等)、運維數據域(物流數據、產品運行狀態數據、產品售后服務數據等)、管理數據域(系統設備資產信息、客戶與產品信息、產品供應鏈數據、業務統計數據等)、外部數據域(與其他主體共享的數據等)。
               
              從數據形式來看,制造業數據可以分為結構化數據、半結構化數據和非結構化數據。結構化數據由二維表結構來邏輯表達和實現的數據,嚴格地遵循數據格式與長度規范,主要通過關系型數據庫進行存儲和管理,企業的ERP、財務系統都屬于典型的結構化數據;半結構化數據并不符合關系型數據庫或其他數據表的形式關聯起來的數據模型結構,但包含相關標記,用來分隔語義元素以及對記錄和字段進行分層。例如,不同工人的個人信息就是典型的半結構化數據;非結構化數據是數據結構不規則或不完整,沒有預定義的數據模型,不方便用數據庫二維邏輯表來表現的數據。包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻、視頻信息等。
               
              從數據處理的角度來看,制造業數據可以分為原始數據與衍生數據。原始數據是指來自上游系統的,沒有做過任何加工的數據;衍生數據是指通過對原始數據進行加工處理后產生的數據。衍生數據包括各種數據集市、匯總層、數據分析和挖掘結果等等。雖然會從原始數據中產生大量衍生數據,但還是會保留一份未作任何修改的原始數據,一旦衍生數據發生問題,可以隨時從原始數據重新計算。
               
               
              「 2. 數據獲取技術 」

               
              數據的采集是獲得有效數據的重要途徑,同時也是工業大數據分析和應用的基礎。數據采集與治理的目標是從企業內部和外部等數據源獲取各種類型的數據,并圍繞數據的使用,建立數據標準規范和管理機制流程,保證數據質量,提高數據管控水平。在智能制造中,數據分析往往需要更精細化的數據,因此對數據采集能力有著較高的要求。例如,高速旋轉設備的故障診斷需要分析高達每秒千次采樣的數據,要求無損全時采集數據。通過故障容錯和高可用架構,即使在部分網絡、機器故障的情況下,仍保證數據的完整性,杜絕數據丟失。同時還需要在數據采集過程中自動進行數據實時處理,例如校驗數據類型和格式,異常數據分類隔離、提取和告警等。
               
              常用的數據獲取技術以傳感器為主,結合RFID、條碼掃描器、生產和監測設備、PDA、人機交互、智能終端等手段實現生產過程中的信息獲取。并通過互聯網或現場總線等技術實現原始數據的實時準確傳輸。
               
              傳感器屬于一種被動檢測裝置,可以將檢測到的信息按照一定規律變化成電信號或者其他形式的信息輸出,從而滿足信息傳輸、處理、存儲和控制等需求,主要包括了光電、熱敏、氣敏、力敏、磁敏、聲敏、濕敏等不同類別的傳感器。
              射頻識別技術(RFID)是一種自動識別技術,通過無線射頻方式進行非接觸雙向數據通信,利用無線射頻方式對記錄媒體(電子標簽或射頻卡)進行讀寫,從而達到識別目標和數據交換的目的。RFID具有適用性廣、穩定性強、安全性高、使用成本低等特點,在產品的生產和流通過程中有著廣泛的應用。物流倉儲是RFID最有潛力的應用領域之一。
               
              條形掃描器也被稱為條碼掃描槍/閱讀器,是用于讀取條碼所包含信息的設備。由光源發出的光線經過光學系統照射到條碼符號上面,并反射到掃碼槍等光學儀器上,通過光電轉換,經譯碼器解釋為計算機可以直接接受的數字信號。條碼技術具有準確性高、速度快、標識制作成本低等優點,因此在智能制造中有著廣泛的應用前景。
               
               
              「 3. 數據處理技術 」

               
              數據處理是智能制造的關鍵技術之一,其目的是從大量的、雜亂無章、難以理解的數據中抽取并推導出對于某些特定的人們來說是有價值、有意義的數據。常見的數據處理流程主要包括數據清洗、數據融合、數據分析以及數據存儲,如圖2所示。
               
               
              圖2數據處理流程
               
              數據處理是為了更好地利用數據。
                 
               
              1)數據清洗
               
              數據清洗也稱為數據預處理,是指對所收集數據進行分析前所做的審核、篩選等必要的處理,并對存在問題的數據進行處理。從而將原始的低質量數據轉化為方便分析的高質量數據,確保數據的完整性、一致性、唯一性和合理性??紤]到制造業數據具有的高噪聲特性,原始數據往往難以直接用于分析,無法為智能制造提供決策依據。因此,數據清洗是實現智能制造、智能分析的重要環節之一。
               
              數據清洗主要包含3部分內容:數據清理、數據變換以及數據歸約。
               
              (1)數據清理是指通過人工或者某些特定的規則對數據中存在的缺失值、噪聲、異常值等影響數據質量的因素進行篩選,并通過一系列方法對數據進行修補,從而提高數據質量。缺失值是指在數據采集過程中,因為人為失誤、傳感器異常等原因造成的某一段數據丟失或不完整。常用的處理缺失值方法包括人工填補、均值填補、回歸填補、熱平臺填補、期望最大化填補、聚類填補以及回歸填補等方法。近年來隨著人工智能方法的興起,基于人工智能算法的缺失值處理方法逐漸受到關注,例如利用人工神經網絡、貝葉斯網絡對缺失的部分進行預測等。噪聲是指數據在收集、傳輸過程中受到環境、設備等因素的干擾,產生了某種波動。常用的去噪方法包括了平滑去噪、回歸去噪、濾波去噪等。異常值是指樣本中的個別值,其數據明顯偏離其余的觀測值。然而,在數據預處理時,異常值是否需要處理需要視情況而定,因為有一些異常值真的是因為生產過程中出現了異常導致,這些數據往往包含了更多有用的信息。常用的異常值檢測方法包括了人工界定、3σ原則、箱型圖分析、格拉布斯檢驗法等。
               
              (2)數據變換是指通過平滑聚集、數據概化、規范化等方式將數據轉換成適用于數據挖掘的形式。制造業數據種類繁多,來源多樣,來自不同系統,不同類別的數據往往具備不同的表達形式,通過數據變換將所有的數據統一成標準化、規范化、適合數據挖掘的表達形式。
               
              (3)數據規約是指在盡可能保持數據原貌的前提下,最大限度地精簡數據量。制造業數據具有海量特性,大大增加了數據分析和存儲的成本。通過數據規約可以有效地降低數據體量、減少運算和存儲成本,同時提高數據分析效率。常見的數據規約方法包括特征歸約(特征重組或者刪除不相關特征)、樣本歸約(從樣本中篩選出具有代表性的樣本子集)、特征值歸約(通過特征值離散化簡化數據描述)等。
               
              2)數據融合
               
              數據融合是指將各種傳感器在空間和時間上的互補與冗余信息依據某種優化準則或算法組合來,產生對觀測對象的一致性解釋和描述。其目標是基于各傳感器檢測信息分解人工觀測信息。通過對信息的優化組合來導出更多的有效信息。制造業數據存在多源特性,同一觀測對象在不同傳感器、不同系統下,存在著多種觀測數據。通過數據融合可以有效地形成各個維度之間的互補,從而獲得更有價值的信息。常用的數據融合方法可以分為數據層融合、特征層融合以及決策層融合。這里需要明確,數據歸約是針對單一維度進行的數據約減,而數據融合則是針對于不同維度之間的數據進行。
               
              3)數據分析
               
              數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,將它們加以匯總和理解并消化,以求最大化地開發數據的功能,發揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。數據分析是智能制造中的重要環節之一,與其他領域的數據分析不同,制造業數據分析需要融合生產過程中的機理模型,以“數據驅動+機理驅動”的雙驅動模式來進行數據分析,從而建立高精度、高可靠性的模型來真正解決實際的工業問題。
               
              現有的數據分析技術依據分析目的可以分為探索性數據分析和定性數據分析,根據實時性可以劃分為離線數據分析和在線數據分析。
               
              探索性數據分析是指通過作圖、造表、用各種形式的方程擬合,計算某些特征量等手段探索規律性的可能形式,從而尋找和揭示隱含在數據中的規律。定性數據分析則是在探索性分析的基礎上提出一類或幾類可能的模型,然后通過進一步的分析從中挑選一定的模型。
               
              離線數據分析用于計算復雜度較高,時效性要求較低的應用場景,分析結果具有一定的滯后性。而在線數據分析則是直接對數據進行在線處理,實時性相對較高,并且能夠隨時根據數據變化修改分析結果。
               
              常見的數據分析方法包括了列表法、作圖法、時間序列分析、聚類分析、回歸分析等。
               
              (1)列表法將數據按一定規律用列表方式表達出來,是記錄和處理最常用的方法。表格的設計要求對應關系清楚,簡單明了,有利于發現相關量之間的相關關系;此外還要求在標題欄中注明各個量的名稱、符號、數量級和單位等。根據需要還可以列出除原始數據以外的計算欄目和統計欄目等。
               
              (2)作圖法可以醒目地表達各個數據之間的變化關系。從圖線上可以簡便求出需要的某些結果,還可以把某些復雜的函數關系,通過一定的變換用圖形表示出來。
               
              (3)時間序列分析方法可以用來描述某一對象隨著時間發展而變化的規律,并根據有限長度的觀察數據,建立能夠比較精確地反映序列中所包含的動態依存關系的數學模型,并借以對系統的未來進行預報。例如,通過對數控機床電壓的時間序列數據進行分析,可以實現機床的運行狀態預測,從而實現預防性維護。常用的時間序列分析方法包括平滑法、趨勢擬合法、AR模型、MA模型、ARMA模型以及ARIMA模型等。
               
              (4)聚類分析是指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程,其目標是在相似的基礎上收集數據來分類。聚類分析在產品的全生命周期有著廣泛的應用,例如通過聚類分析可以提高各個零部件之間的一致性,從而提高產品的穩定性。常見的聚類分析方法包括基于劃分的聚類方法(K-means,K-medoids)、基于層次的聚類方法(DIANA)以及基于密度的聚類方法(譜聚類、DBSAN)等。
               
              (5)回歸分析是指通過定量分析確定兩種或兩種以上變量之間的相互依賴關系?;貧w分析按照涉及的變量的多少,分為一元回歸和多元回歸分析;按照因變量的多少,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析。常用的回歸分析方法主要包括線性回歸、邏輯回歸、多項式回歸、逐步回歸、嶺回歸以及Lasso回歸等。近年來,隨著人工智能的飛速發展,除了上述方法外,以深度學習為代表的神經網絡,以及以支持向量機為代表的統計學習開始逐漸受到關注。
               
              在制造業中,數據處理通?;诔S玫臄祿治龊蜋C器學習技術。
                 
              工業大數據平臺是制造業數據處理的主要載體,也是未來推動制造業大數據深度應用,提升產業發展的重要基石。以GE、IBM為首的國際知名企業都已在工業大數據平臺上取得了不錯的應用效果,目前我國部分企業已經具備自主研制的工業大數據平臺,在工業大數據平臺的工業大數據采集、工業大數據存存儲管理、工業大數據分析關鍵支撐技術上也已經有所突破。
               
               
              「 4. 數據獲取與處理在智能制造中的應用 」

               
              1)海爾空調噪聲大數據智能分析
               
              海爾膠州空調互聯工廠部署有國內唯一的分貝檢測設備,當空調測試分貝大于標準分貝時,系統判斷為不合格。但此設備無法識別空調運行中的異音,如摩擦音、共振音、口哨音等。此外,每天快節拍、高強度的空調裝配流水線工作導致檢測工人聽取噪聲時間過長,易產生疲勞和誤判,偶爾有不合格品流到下線,影響產線整體檢驗的可靠性。因此,急需找到新式噪聲識別方法,解決企業當前痛點。
               
              針對該問題,海爾通過整合平臺上的軟件及硬件資源,與美林數據共同開發了空調噪聲智能檢測系統,有效地解決了無法準確、可靠識別異音的痛點。解決方案包括非結構化音頻數據實時采集與存儲、分析建模與智能識別、結果輸出與可視化展現三大部分。通過對生產線大量的歷史檢測音頻采集,并結合先進的人工智能算法,實現空調噪聲的智能檢測,并將檢驗結果實時反饋至企業的工業互聯網平臺,支持產線質量問題在線統計與分析。該技術有效地提高了檢測準確率和可靠性,降低了檢測成本,促進了生產的智能化程度。
               
              2)Hirotec利用數據預防意外停機
               
              Hirotec是一家市值超過16億美元,公司遍布全球23個地方的汽車部件和工具制造商。非計劃停機維修一直是Hirotec公司面臨的重大難題,每秒鐘的非計劃停機維修都可以造成高達361美元的經濟損失。因此,Hirotec公司迫切地希望減少停機時間,以避免不必要的損失。
               
              為了實現這一目標,Hirotec在其工廠車間使用了基于物聯網和云的技術通過傳感器的部署與數據的采集,實現了設備運行狀態的實時監控。并利用機器學習方法幫助預測和預防系統故障。在運行其物聯網平臺的3個試點并審查數據后,Hirotec能夠將系統的人工檢查時間縮短100%。
               
               
              「 5. 數據獲取與處理未來發展趨勢 」

               
              1)數據來自數字孿生
               
              在智能制造中,數據起到了至關重要的作用。數據的對于整個生產全生命周期的覆蓋程度、數據的質量以及分析結果的好壞將會直接影響最終的生產效率以及產品價值。目前現有的數據獲取與處理都是基于現實中的真實數據進行的。隨著數字孿生技術的發展,通過構建虛擬生產環境,進而獲取虛擬數據可以為數據的分析與利用提供更加廣闊的思路和途徑。通過虛構環境的模擬可以有效地提高數據的覆蓋程度,并對數據的分析結果進行有效驗證,從而更好地反饋實際生產。
               
              2)5G技術加速實時通信
               
              5G,即第五代移動通信技術,也就是用于無線的、可移動設備上的第五代通信技術。根據國際電信聯盟(ITU)發布的5G標準草案,5G鏈接密度將達到每平方公里100萬臺設備,這也就意味著在5G時代,大量的物品可以通過5G網絡接入,從而構建真的萬物互聯。與此同時,5G技術具有超高的傳輸速率以及超低的傳輸延遲。在實際使用環境下,5G技術能夠達到1.8Gbps的下載速率,理論延遲最大不超過4ms。
               
              作為新一代移動通信技術,5G技術切合了傳統制造企業智能制造轉型對無線網絡的應用需求,能滿足工業環境下設備互聯和遠程交互應用需求。在物聯網、工業自動化控制、物流追蹤、工業AR、機器人等工業應用領域,5G技術起著支撐作用。同時給數據的傳輸、存儲、以及在線分析提供了全新的途徑。讓以前受限于通訊速度和帶寬的大規模數據分析技術有了用武之地。
               
              3)數據安全愈發重要
               
              數據在給制造業帶來巨大利益同時,其自身的安全也讓企業面臨著巨大的風險。數據中所包含的敏感信息和關鍵參數,如果遭到泄露,將會直接對企業造成巨大的損失。同時,通過惡意篡改數據,影響正常生產從而造成重大損失,甚至危及人員生命安全的案例也時有發生。數據的安全漏洞主要是由于工業控制系統的協議多采用明文形式、工業環境多采用通用操作系統且不及時更新、從業人員的網絡安全意識不高,再加上工業數據的來源多樣,具有不同的格式和標準所導致。所以,在工業應用環境中,應對數據安全有著更高的要求,任何信息安全事件的發生都有可能威脅工業生產運行安全、人員生命安全甚至國家安全等。因此,研究制造業數據的安全管理,加強對數據的安全保護變得尤為重要。
               
              改編自:《智能制造概論》(作者:李培根,高亮)
               
               

              相關新聞

              版權聲明

              1、凡本網注明“來源:中國輕工業網” 的作品,版權均屬于中國輕工業網,未經本網授權,任何單位及個人不得轉載、摘編或以其它方式使用。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:中國輕工業網”。違反上述聲明者,本網將追究其相關法律責任。
              2、凡本網注明 “來源:XXX(非中國輕工業網)” 的作品,均轉載自其它媒體,轉載目的在于信息之傳播,并不代表本網贊同其觀點和對其真實性負責。
              3、如因作品內容、版權和其它問題需要同本網聯系的,請于轉載之日起30日內進行。
              4、免責聲明:本站信息及數據均為非營利用途,轉載文章版權歸信息來源網站或原作者所有。

              返回頂部
              日本一级婬片A片免费播放口