2017年1月6日,東北石油大學(xué)校長助理、教授李春生在CIO時代APP微講座欄目作了題為《油田大數(shù)據(jù)應(yīng)用探索》的主題分享,他從大數(shù)據(jù)的基本概念、油田大數(shù)據(jù)應(yīng)用過程、油田數(shù)據(jù)現(xiàn)狀分析、油田大數(shù)據(jù)應(yīng)用方向、大數(shù)據(jù)應(yīng)用案例分析五個方面談油田大數(shù)據(jù)應(yīng)用探索。
一、大數(shù)據(jù)的基本概念
?。ㄒ唬┐髷?shù)據(jù)的定義
大數(shù)據(jù)是指無法在一點時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
針對油田而言,它的數(shù)據(jù)相對其他行業(yè)是較為完整的。油田從勘探開始,一直到采油的整個生產(chǎn)過程中,其所有的數(shù)據(jù)都有記錄,但不同階段記錄的數(shù)據(jù)形式是不同的。例如在早期是報表記錄,后來通過數(shù)據(jù)采集形成大力度的數(shù)據(jù),目前通過互聯(lián)網(wǎng)的應(yīng)用已形成詳細的數(shù)據(jù)記錄。國際上為有效管理目前的油田數(shù)據(jù),五大石油公司及一些院校成立了相關(guān)組織,用于制定油田數(shù)據(jù)的模型和標準。目前國內(nèi)試圖引入該組織,但歷經(jīng)十多年后還是停滯了。
中國的油田目前的數(shù)據(jù)管理基本為兩個階段:第一個階段是上世紀八十年代,制定了勘探開發(fā)數(shù)據(jù)庫,將國內(nèi)各個行業(yè)的教師、專家聚集在一起制定中國石油標準。勘探開發(fā)數(shù)據(jù)庫是面向主題的一些數(shù)據(jù),根據(jù)業(yè)務(wù)的基本情況組織數(shù)據(jù)。第二個階段是目前的石油行業(yè)開始了一種新的數(shù)據(jù)組織方法,對數(shù)據(jù)進行分層次多極化管理。
(二)大數(shù)據(jù)的系統(tǒng)研究維度
提到大數(shù)據(jù)應(yīng)用從以下三個方面進行:理論方面、技術(shù)方面、時間方面。
理論方面。主要是認知必要的途徑,即被廣泛認同傳播的基準路線,如特征定義、價值探討、目前和未來的發(fā)展趨勢、大數(shù)據(jù)隱私等等。
技術(shù)方面。主要是云計算、分布式處理平臺、存儲技術(shù)、感知技術(shù)等等。
實踐方面。包括互聯(lián)網(wǎng)的大數(shù)據(jù)、政府的大數(shù)據(jù)、企業(yè)的大數(shù)據(jù)及個人的大數(shù)據(jù)。
二、油田大數(shù)據(jù)的應(yīng)用過程
主要分為大數(shù)據(jù)形成、淺表特征呈現(xiàn)、數(shù)據(jù)挖掘分析及其多元化應(yīng)用研究四個方面。
大數(shù)據(jù)的形成由以下幾個方面逐步形成:辦公數(shù)據(jù)備案、生產(chǎn)數(shù)據(jù)積累、數(shù)據(jù)集成與整合、業(yè)務(wù)數(shù)據(jù)處理等等來形成原始數(shù)據(jù)。
淺表特征主要是做在原始區(qū)域的基礎(chǔ)上如何進行簡單的應(yīng)用和展示,如專項數(shù)據(jù)成圖、模擬仿真建模、列表式展示等等。
數(shù)據(jù)挖掘分析主要是在原來數(shù)據(jù)積累的基礎(chǔ)上進行潛在特征的挖掘、異常追蹤預(yù)警、知識發(fā)現(xiàn)、趨勢分析等。
多元化應(yīng)用研究主要是結(jié)合GIS應(yīng)用、數(shù)模分析、立體仿真成像、一體化研究等使數(shù)據(jù)發(fā)揮更大的潛在價值。
三、油田數(shù)據(jù)現(xiàn)狀分析
(一)基本概況
涉及領(lǐng)域廣。如生產(chǎn)數(shù)據(jù)、地質(zhì)地貌數(shù)據(jù)、措施數(shù)據(jù)、作業(yè)數(shù)據(jù)、輔助支撐數(shù)據(jù)等,基本涵蓋了油田勘探、開發(fā)、生產(chǎn)、裝備等所有相關(guān)領(lǐng)域。
數(shù)據(jù)存儲形式。包括了結(jié)構(gòu)化(關(guān)系型數(shù)據(jù)庫)、半結(jié)構(gòu)化(電子表格)及非結(jié)構(gòu)化數(shù)據(jù)。
邏輯組成。目前國內(nèi)的油田采取A1,A2,A3…,按不同行業(yè)分出不同的類別,組成所有的數(shù)據(jù)??碧介_發(fā)數(shù)據(jù)邏輯、井下作業(yè)數(shù)據(jù)庫邏輯等,過程邏輯結(jié)構(gòu)及面向?qū)ο筮壿嫿Y(jié)構(gòu)交叉。不但能夠提高模式表達的準確率,同時使方法具備。
(二)數(shù)據(jù)特點
數(shù)據(jù)完整性較好、數(shù)據(jù)基數(shù)大、數(shù)據(jù)間業(yè)務(wù)關(guān)系極強、數(shù)據(jù)準確率較高、數(shù)據(jù)更新速度快、數(shù)據(jù)呈現(xiàn)多樣性。
四、油田大數(shù)據(jù)的應(yīng)用方向
主要有以下四個方面:油田大數(shù)據(jù)集成與處理;追蹤式業(yè)務(wù)及日常工作管理;油田開發(fā)生產(chǎn)領(lǐng)域的知識發(fā)現(xiàn)及推理應(yīng)用;與地理信息系統(tǒng)(GIS)、3D建模技術(shù)等結(jié)合,以便于指導(dǎo)決策。
?。ㄒ唬┯吞锎髷?shù)據(jù)集成與處理
油田大數(shù)據(jù)集成與處理的目標主要立足于油田應(yīng)用業(yè)務(wù)的本身、油田業(yè)務(wù)數(shù)據(jù)結(jié)構(gòu)涉及業(yè)務(wù)數(shù)據(jù)模型采用實用的技術(shù)集成和處理過程。由于歷史原因,油田所有的信息系統(tǒng)一開始不是集成在一起來做,而是分散孤立的系統(tǒng),數(shù)據(jù)類型、表示方式均不相同,如何使所有的油田數(shù)據(jù)統(tǒng)一化,是集成所做的工作,將分散在各地的數(shù)據(jù)如何集中起來也是其工作之一。包含的過程有三點:第一,基于油田業(yè)務(wù)的數(shù)據(jù)結(jié)構(gòu)、構(gòu)建、應(yīng)用領(lǐng)域的業(yè)務(wù)數(shù)據(jù)模型;第二,設(shè)計數(shù)據(jù)集成、數(shù)據(jù)處理過程;第三,完成數(shù)據(jù)模型的管理及對數(shù)據(jù)過程的控制。數(shù)據(jù)集成的意義是強化后期深入數(shù)據(jù)計算和分析能力,摒棄不相關(guān)的數(shù)據(jù),提高數(shù)據(jù)處理速度。這項技術(shù)的難點主要是數(shù)據(jù)處理過程的設(shè)計,相對困難一些,針對不同的數(shù)據(jù)分別一一處理,沒有統(tǒng)一的方法。具體實例如下圖:
首先進行模型設(shè)計,模型中有設(shè)計兩個實體,一個是動態(tài)數(shù)據(jù)實體(反映油田的生產(chǎn)單元),一個是靜態(tài)數(shù)據(jù)實體(描述油田生產(chǎn)單元生產(chǎn)的基本屬性)。在兩個實體描述過程中需要三個數(shù)據(jù),分別為開發(fā)歷程數(shù)據(jù)、動態(tài)管理數(shù)據(jù)、產(chǎn)量預(yù)測及其預(yù)警。模型設(shè)計成功后面對的問題是如何采用數(shù)據(jù)集成集成相關(guān)數(shù)據(jù),采用軟件Agent技術(shù),在集成的地方開發(fā)一個控制中心,生產(chǎn)各個Agent,根據(jù)需要將其分布在各個地方。其中主要包括控制中心(派出Agent、生產(chǎn)Agent)、行為業(yè)務(wù)響應(yīng)(響應(yīng)式Agent)、孤獨業(yè)務(wù)處理模型(定時式Agent)。
?。ǘ┳粉櫴綐I(yè)務(wù)及日常工作管理
主要采用層級劃分的思想結(jié)合實際業(yè)務(wù)、工作及其模式管理進行場景式追蹤,為決策者提供自上而下的管理支持。包含的過程有三點:第一,底層數(shù)據(jù)模型的建立,數(shù)據(jù)的抽取與處理;第二,涉及領(lǐng)域的日常工作及業(yè)務(wù)管理功能的設(shè)計;第三,管理結(jié)構(gòu)與功能對接及其一體化追蹤模式設(shè)計。這項功能的意義是強化決策者管理能力,提高日常工作效率和管理水平。這項工作的難點是數(shù)據(jù)模型的建立標準業(yè)務(wù)管理及其日常工作的涵蓋度。
(三)油田開發(fā)生產(chǎn)領(lǐng)域的知識發(fā)現(xiàn)及推理應(yīng)用
知識發(fā)現(xiàn)的目標是以知識工程為主導(dǎo),采用數(shù)據(jù)挖掘、模式挖掘等技術(shù),實現(xiàn)對油田開發(fā)、生產(chǎn)、勘探等領(lǐng)域的專家知識發(fā)現(xiàn)及推理應(yīng)用。包含的過程有數(shù)據(jù)獲取、只是挖掘及知識推理。這項功能的意義是深層發(fā)現(xiàn)潛在知識,強化預(yù)警及動態(tài)分析能力。這項工作的難點是理論方法及應(yīng)用推廣。
(四)與地理信息系統(tǒng)(GIS)、3D建模技術(shù)相結(jié)合
與地理信息系統(tǒng)(GIS)、3D建模技術(shù)等結(jié)合,挖掘出的使知識更有清晰的呈現(xiàn)過程,目前這方面的應(yīng)用可以使知識更加通俗易懂。
五、大數(shù)據(jù)應(yīng)用案例
(一)聚驅(qū)生產(chǎn)動態(tài)預(yù)警系統(tǒng)
如今通過收集聚驅(qū)所有數(shù)據(jù),找到各種報表,針對已知的情況挖掘聚驅(qū)所有的數(shù)據(jù)呈現(xiàn)的模式分布,進而形成知識。當(dāng)然,數(shù)據(jù)在實施生產(chǎn)的過程中應(yīng)與挖掘模式進行適應(yīng)性匹配,如果與趨勢吻合,便可以產(chǎn)生預(yù)警,通報有關(guān)人員。這一系統(tǒng)以數(shù)據(jù)挖掘為基礎(chǔ),實現(xiàn)聚驅(qū)生產(chǎn)模式發(fā)現(xiàn),用以對單井未來生產(chǎn)狀況分析。
(二)天然氣安全隱患跟蹤系統(tǒng)
這個項目以天然氣安全隱患管理日常業(yè)務(wù)功能為基礎(chǔ),開發(fā)輔助決策、隱患綜合跟蹤系統(tǒng),依據(jù)自頂向下的管理模式面向決策者開開放隱患問題的綜合跟蹤,將下面工作站對應(yīng)的隱患問題進行匯總,以業(yè)務(wù)單位的模式實現(xiàn)隱患追蹤。隱患的來源有兩種途徑:一種是通過人工上報;一種是通過生產(chǎn)過程的挖掘,進行實時數(shù)據(jù)挖掘。決策者可根據(jù)跟蹤系統(tǒng)追蹤到隱患問題的源頭。其應(yīng)用方式是根節(jié)點統(tǒng)計下節(jié)單位的所有風(fēng)險隱患,以單位為基準進行二級單位追蹤,并一直追蹤到基層單位的風(fēng)險隱患情況,在基層單位實現(xiàn)風(fēng)險隱患匯總,并可查看各類風(fēng)險隱患的分析報告與結(jié)果。這個項目是通過數(shù)據(jù)的綜合應(yīng)用達到科學(xué)化管理。
第三十四屆CIO班招生
國際CIO認證培訓(xùn)
首席數(shù)據(jù)官(CDO)認證培訓(xùn)
責(zé)編:李春生
免責(zé)聲明:本網(wǎng)站(http://www.www.gypb.net/)內(nèi)容主要來自原創(chuàng)、合作媒體供稿和第三方投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
本網(wǎng)站刊載的所有內(nèi)容(包括但不僅限文字、圖片、LOGO、音頻、視頻、軟件、程序等)版權(quán)歸原作者所有。任何單位或個人認為本網(wǎng)站中的內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,請及時通知本站,予以刪除。