新冠疫情防控工作對數據治理的啟示
張靖笙
當前我國甚至全球還正面臨新冠肺炎的嚴重疫情,這場無情的疫情已經奪走了許多生命,也對社會和經濟產生了巨大的影響。
可能全世界的人都會有個疑問,為什么時至人工智能時代的今日,還能冒出個如此厲害的新型病毒,讓我們的公共醫(yī)療衛(wèi)生體系連預知和預防都幾乎措手不及?就這個病毒和這場疫情,我們需要搞清楚為什么的地方有很多,毫無疑問,這個小小的病毒告訴我們,我們對自然界的無知還遠遠大于大多數人愿意承認的程度,個別人的無知只是鬧笑話,可整個人類的無知就非??膳铝?。所以從積極的方面來看,這個病毒是自然界送給人類非常重要而且寶貴的一課,好讓我們好好反省反省,人類的科學技術是不是真如自己以為的那么強大和發(fā)達。
今天已經是大數據人工智能時代了,大數據人工智能幾乎集合了當前人類最尖端的智力成果,此時此刻,我想向全體數據同行鄭重拷問一個問題,我們的信息系統(tǒng)如果在未來面對新型冠狀病毒一樣史無前例的突發(fā)狀況到底還能不能發(fā)揮正常的作用不失靈?可能很多人會說,靖笙你問這個也太苛刻太極端了,可是這個問題我們不問,不代表它不存在。其實大家都心知肚明,這樣的可能始終存在,只是還沒發(fā)生我們視而不見而已。
按我們的常識,病毒是一種低級生命,是簡單和弱智的,而凝結了人類頂級智力成果設計出來的人工智能信息系統(tǒng)應該是復雜和高明的,但今天我們不得不承認,從某種意義上,今天體現我們人類最高智力水平的復雜智能系統(tǒng)卻還遠遠不如自然生命中貌似低級和弱小的病毒聰明,因為我們的智能系統(tǒng)能正常發(fā)揮效用需要依賴太多精密的設計和巧妙的配合,那條弦搭錯了就失靈了,相比之下,狡猾的病毒卻總能出人意料地找到人類的空子鉆。
疫情發(fā)生以來,我國廣大科研工作者也在團結戰(zhàn)疫,用醫(yī)學、生物、化學、數學、統(tǒng)計等科研和專業(yè)方法圍繞新冠肺炎疫情的研究跟蹤、建模分析與數值模擬方面做出了許多出色的研究成果,這方面研究有非常有現實的意義,同時,我相信也很可能產生人類新認知的重大理論成果。作為數據工作者,面對這次疫情,我們能學到些什么,或者從中得到什么啟示呢?
回顧中國在這次疫情防控中的作為,讓我們看到一波非常符合大數據思維的操作,取得成績已經得到國內外廣泛的肯定。前天(2020年3月10日),習總書記親赴武漢考察疫情防控工作的講話中,有一段特別引發(fā)我的共鳴:“這次新冠肺炎疫情防控,是對治理體系和治理能力的一次大考,既有經驗,也有教訓。要放眼長遠,總結經驗教訓,加快補齊治理體系的短板和弱項,為保障人民生命安全和身體健康筑牢制度防線?!绷暱倳涍@個指示讓我對數據管理和數據治理工作也有一種靈犀點通的感覺。
我們講了這么多年的數據管理和數據治理工作,就是缺乏這種風險意識和安全防控思維,數據狀況毫無疑問就是各種信息和人工智能系統(tǒng)安全和健康的晴雨表,數據質量和數據安全問題直接體現的就是這些系統(tǒng)發(fā)生亞健康甚至病情的癥狀,可我們搞了這么多年的技術工作,何時從這個層面思考過數據治理工作呢?
在我們傳統(tǒng)觀念中,信息系統(tǒng)只要能跑沒有發(fā)生故障就是健康的,我只能說這種理解太狹隘了,完全是唯技術思維,在這種思維下,信息系統(tǒng)管理者根本就不關心這些系統(tǒng)里數據內容在實際的業(yè)務和生產工作中到底發(fā)揮了多少價值和效用。我在過往的工作中,曾經接觸過某些銀行單位,有些系統(tǒng)都已經成為僵尸系統(tǒng)了,就是根本沒人用,里面的數據早已經過時也沒人碰,可是仍然花費不菲的運維成本天天空跑,沒人喊停也沒人敢停,理由是萬一哪天誰要用呢?這難道不是一種非常典型的“健康”系統(tǒng)下的數據“病態(tài)”嗎?捫心自問,我們在這種錯誤的信息系統(tǒng)“健康”觀念難道不是眾多數據質量問題的“病因”嗎?
言及于此,板子不能都打在單位負責信息技術的工作人員身上,說老實話,關于信息系統(tǒng)的健康問題,就拿我們今天人手一部的智能手機舉例,手機雖然對于我們大多數人來說技術上是個黑箱,可是涉及到我們每個人那么多重要和敏感的隱私信息,不做好手機的數據安全健康工作就后患無窮了。我相信大家都有同感,特別是安卓系統(tǒng)手機用戶,我們一段時間不做手機系統(tǒng)的健康檢測和垃圾清理就卡殼了,你不勤做這事能怪手機生產商嗎?當然不能,而手機生產商如果不提供對應的防護功能無疑讓自己的用戶如在新冠病毒面前裸奔。
話又說回來,類似我剛才批評的銀行業(yè)單位,偏偏就是今天我國信息化發(fā)展水平走到最前沿的行業(yè)之一,這讓我們有一種巨大的錯覺,仿佛數據質量問題就是企業(yè)信息化發(fā)展后的副作用或者后遺癥,企業(yè)沒有信息化工作就沒有數據質量問題,也無需考慮什么數據治理體系和治理能力建設了,這恰恰是當今絕大多數中國企業(yè)最可悲的地方,雷同于我們還不知道新冠病毒的傳染威力之前的高危險狀態(tài),無知者無畏,但危險卻是無所不在。
數字經濟時代的數據問題如各種病毒一樣無處不在,雖然今天很多人都口口聲聲想要用大數據,可在日常工作中面對本單位現存的數據質量(健康)問題,又有多少人真正關心、真正愿意下大力氣去做好數據治理工作呢?當人手一臺智能手機已成常態(tài)的今天,不存在與數據絕緣的工作,也不存在與數據無關的組織,所以組織有數據健康問題不可怕,自以為沒問題或者對問題熟視無睹才可怕。在這個基礎上,我們再結合本單位數據管理與治理現狀認真學習一下習總書記的指示,我們對本單位的信息化發(fā)展和數據健康也要做好類似新冠肺炎病毒這種完全無法預料的突發(fā)新疫情防控工作,加快補齊數據治理體系的短板和弱項。
所以,每個組織都要放眼長遠來反思自身數據治理體系的短板和弱項,從防患于未然的高度來統(tǒng)籌部署自身的數據治理體系和治理能力發(fā)展,這既是數字經濟時代背景下高質量發(fā)展的要求,也是防控新的歷史條件下市場不確定風險的求生之道。
(此稿完成于2020年3月12日,如需引用請注明出處)