4/24/2017

IOT 蒐集到壞資料怎麼辦

CIO雜誌4月號有這麼一篇文章,很有意思

當我們在看到LPWA搜集資料的方式  可能是間歇的發送資料甚至經過一段時間才發送一直資料例如停車格的停車收費計算 水表電表瓦斯表的抄表 這些互聯網的應用都是訴求不需要頻繁的發送資料卻要在少數的資料當中對消費者來進行收費  因此資料的正確性非常的重要

根據奇異 predix 軟體公司CTO的分享 物聯網說搜集到的資料大概有40% 是假造的或者具有欺騙性的 這些資料很多是因為操作人員的不慎而重複上傳我複製質量 也可能閒置的機器不斷地自動送出重複的訊息

還有一種情況例如農田的感測器  如果有昆蟲我是鳥類 或是糞便沾黏到上面 將會造成測量數據的嚴重錯誤 或是有人惡意的我外在的樹枝吹落影響等等原因 都可能扭曲他所傳回來的數據 還有居家監控 土石流監控 病人的血液檢測  如果傳回來的數據是錯誤的 反而會造成更多資源的浪費

此外也可能是感測器本身的硬體和軟體損壞 因而不傳回任何的資料 或是重複傳回錯誤的資料 也將造成很大的困擾  那要怎麼辦呢

一種方法 就是有同時兩到三個裝置 做為互相校對, 然後定期巡檢現場;

如果因為感測器的裝置在郊區/偏遠的地方無法定期巡查,可以提高部署的密度,再透過數學的方法找出離群值與原因

另一種方式 實力有不同的感測裝置來檢查可能出問題的原因 例如在感測器的附近加裝攝影機透過攝影機來追蹤不同感測器的安裝狀況  反過來透過其他的感測器來確保攝影機的正常運作 同樣的在醫院內對於病人的檢測可以透過不同的感測裝置 提供不同的數據

IBM提出透過機器學習來協助物聯網資料正確性的比對 透過不同裝置回傳的資料 加上雲端系統的機器學習與分析 可以快速找出異常感測器的狀態一起糾正資料 例如在公唱的空調回傳的資料 空調目前處於關機狀態 但若是工廠電表呈現的事電流的快速增加 雲端的系統就會進行比對分析 提供適當的告警 這就是物聯網機器學習合作的結晶




沒有留言: