在全球工業步入4.0時代之時,智能化也在航運與船舶工業中興起。賽博物理系統(CPS)、物聯網(IoT)、大數據(Big data)在航運與船舶工業界也開始成為熱點話題。MARINTEK公司長期在航運和船舶信息化方面投入研究,在業界擁有較高的知名度。海事研究中心編譯整理了該公司2016年中發表的關于未來航運和船舶中大數據應用的相關研究成果以供參考。盡管目前航運和船舶工業中的數據規模尚與“大數據”有所差距,但不妨從大數據的視角審視未來智能化的航運業中對大規模數據的組織和利用趨勢,發掘未被利用的數據資源,實現更安全、更經濟、更環保的航行。
1 航運和船舶中的主要數據源
1.1 船橋數據網絡、各類船載設備
船橋系統與設備間常有標準化或定制的數據接口,使得數據的集中收集成為可能。隨著IMO和船旗國對船用設備的種類要求逐漸增多,數據源也在隨之增加。此外,一些特殊設備如波浪雷達、溢油監測裝置、慣導設備等也能夠通過標準或非標準的接口提供大量數據。
1.2 自動化控制系統和賽博物理系統
無論是傳統的自動控制系統和新興的CPS中都集成了多種設備和信息系統,產生大量數據。但系統中數據的可獲取性和數據質量常有參差不齊的情況。
1.3 性能監控系統
過去幾年,船舶裝載性能監測和優化設備的情況較多。這類設備包括軸扭矩測量儀、燃油流量計、環境狀態傳感器等,通常都是高質量的數據源。但因一些監測和服務由第三方機構提供,除數據可獲取性會受到一定影響,成本因素也需要考慮。
1.4 船舶報告數據
船舶向岸端發送的大量運營和管理報告是重要的數據源,是很有價值的數據輸入。但由于部分內容需要依靠人工輸入,加之存在刻意誤報(以逃避監管)的情況存在,數據質量存在不確定性。
1.5 外部監控數據:AIS和VTS
AIS的推廣提供了大量的數據(例如位置、速度、航向等更新頻率可高達每10秒1次)。獲取AIS數據較為便利,但數據質量和花費會隨著提供方不同而發生變化。另一方面,VTS中包含與船舶運行和狀態有關的大量數據,但通常不可公開獲取。
1.6 氣象數據
包括氣象預報數據和歷史數據,獲取較為便利。
1.7 港口數據
港口和船舶代理對船舶近港和港口內的活動情況有詳細的記錄,可提供詳細的誤期、裝卸貨時間等數據。這類數據常用于相關資費的計算,因此較為準確。
2 船舶數據收集中的障礙因素
2.1 場景相關的數據質量問題
用于不同目的(如用于精確控制和閾值警告)的傳感器在數據質量上也有差異;同類的傳感器在使用場景不同的情況下,對數據質量的要求也會有所差異,于是便導致了整個系統中的數據質量不統一問題。對于在脫離原始場景情況下獲取的原始數據(例如船舶上安裝有相當數量的位置傳感器,但每個傳感器都有獨立的參照位置點),需要對其可用性仔細核對并在必要時予以校正。
2.2 外部環境影響問題
外部因素可導致數據質量下降的問題。例如對水船速、風速等的測量可能因傳感器設置的位置不同而產生差異。設置在船體外部的傳感器可能因外力損壞、污染物附著、性能衰退等因素造成無效數據的出現。
2.3 人工輸入引起的錯誤問題
人工數據錄入錯誤是一種重要的數據錯誤來源。隨著船舶自動報告成為IMO E-航海戰略實施計劃中的高優先級方案之一,這一問題將有望得到逐步解決。
2.4 主觀/蓄意誤報數據問題
一些有商業用途的敏感數據存在被認為誤報的可能性。雖然現今數據的真實性可被很大程度地交叉驗證,但處理商業敏感信息時仍需警惕這一問題。
2.5 專有數據和接口問題
部分船舶設備和系統沒有配備通用的數據格式和接口,導致信息的獲取需要付出額外的成本(包括轉接設備、人工服務等)。隨著更多新造船舶自設計之初就具有較高的集成度和標準化的數據格式和接口,這一問題有望得到逐步解決。
2.6 AIS 和衛星數據獲取中的偽數據問題
由于AIS和衛星數據的獲取與基站和接收弧段等因素有關,船舶獲取數據的時間間隔可能呈不規則分布狀態。相應的數據過濾和插值可能導致偽數據的產生,并導致部分數據的可信度降低。
2.7 賽博空間安全問題
高度數字化和信息化的船舶系統對賽博空間安全提出的很高需求。例如對船舶通信鏈路的入侵可能導致導航設備被“劫持”,從而產生錯誤數據。因此通過技術手段確保網絡安全和對數據進行查驗十分必要。
3 船舶和航運大數據的管理和使用
對數據的管理和使用主要分為三個角度考慮:即存儲管理、數據質量管理和分析利用。
3.1 存儲管理
存儲大量數據的過程中,對冗余數據的處理直接影響到存取效率和后期分析的準確性,即需要在不丟失重要信息的情況下對冗余數據進行合理取舍。該研究提出了一種二級數據處理機制:在第一級對數據進行簡單初篩,并存儲盡可能多的信息;第二級使用專用算法對數據進行提取并進行結構化處理,供后續分析使用。
3.2 數據質量
數據質量問題大致可分為四類:(1)不可靠數據、(2)場景相關的偽數據、(3)技術性偽數據、(4)非對應數據。可通過對傳感器系統的校正、異常值檢測、統計學檢測等技術手段和數學方法進行質量控制和管理,去除或減少無效數據。
3.3 數據利用
對大數據的利用主要有兩種模式,即“基于模型”和“基于發現”。前者可利用大量數據對各種模型和理論假設進行驗證,但前提是要有已知模型的存在。后者的優勢在于發現新的數據關聯性和規律,但要考慮結果適用性的風險(即結果可能存在較大的隨機性)。
4 大數據應用的時效性
航運業有多種潛在的基于大數據的應用場景,時效性可從實時的在線決策到長期的船隊數據統計分析等。
4.1 在線決策支持
此類應用將使用實時數據或調用短期歷史數據記錄進行計算處理,以支持與動力輸出、船舶航向控制等相關的實時任務,例如惡劣氣象條件下的決策支持、動力優化等。
4.2 船舶性能優化和維護
此類應用基于較長期的數據積累,例如對船舶機械設備運行狀況進行長期跟蹤,以相應地監測船舶設備狀態,對維護計劃進行優化管理。
4.3 船隊優化
更大的數據集合可以用于比較同類船舶在一定時間內的性能,可用于特定航線船隊的性能分析,提供優化的運營策略。
4.4 預測分析
大數據可用于新船的設計和性能預測,即結合新船的虛擬模型,引入歷史數據用于預測新船在各種工作條件下的性能特點,為設計迭代提供依據。
大數據應用是一把雙刃劍。一方面,對大量數據的利用無疑將能夠提供更多支持航運和船舶工業的工具和手段;另一方面,數據的質量和處理方法可能使分析結果產生偏差,為管理和運營產生負面影響。但獲取、存儲、積累、傳輸和最大化利用大量數據的趨勢在航運中是明確的,與航運和船舶工業的智能化密不可分,正在成為智能時代全新的挑戰和機遇。(來源:吳笑風 國際海事研究中心)