美國國家情報委員會2012年12月10日公布《2030全球趨勢:可能的世界》的研究報告中指出:到2030年,有4個領域的新技術將深刻影響全球經濟、社會和軍事局勢的發展。一是信息技術即將進入大數據時代。二是新的城市建設技術。三是新的制造與自動化技術。四是與重要資源相關的突破性技術。在這四個領域中的大數據時代,由于信息技術的發展,使得“數據儲存和處理能力正在變得技術免費;網絡和云計算將會全球普及;社交媒體和網絡安全將會成為很大的新市場”,將對政府統計帶來嚴峻的挑戰。
一、大數據將對政府統計工作的挑戰
當今世界許多有識人士也認為,大數據的出現是一場生活、工作與思維的大變革,開啟了一次重大的時代轉型,就像望遠鏡讓我們能夠感受宇宙,顯微鏡讓我們能夠觀測微生物一樣,大數據正在改變我們的生活以及理解世界的方式,成為新發明和新服務的源泉,而更多的改變正蓄勢待發,一場正在到來的海量數據革命將改變政府、社會與人們的生活。
(一)大數據將對政府統計權威性的挑戰
政府統計是發布國情國力統計數據的主體,各級政府統計部門擔負著信息、資訊和監測的職能,其主體地位是由國家的法律所賦予的。隨著大數據時代的到來,政府統計部門不再是唯一的海量數據擁有者,互聯網上每時每刻生成了大量的交易和價格信息。如在淘寶網上,許許多多的店主開了許許多多的網店,經營著許許多多的各種各樣的商品,綜合性的淘寶價格指數就應運而生。雖然淘寶價格指數中的商品種類大大少于國家的CPI(居民消費價格指數),雖然這些商品的價格對市場上全部商品的價格未必有代表性,雖然確定權重的依據也僅僅是來自這個網上購物的群體及行為,但其畢竟是在一個規模越來越大的總體基礎上生成的,畢竟有實時產生的大量基礎信息做基礎,畢竟有越來越多的人關注、了解和參與這個不斷變化著的指數。就其這一點來說,就對國家發布的CPI數據是一個挑戰。
(二)大數據將對政府統計生產方式的挑戰
目前海量般的數據產生的主體不一,來源更日趨多元,不同內容和形式的大數據也標準各異。是讓大數據的產生者執行統一標準、或是按照統一標準進行加工,還是由政府統計把數據拿來之后再做標準化處理?不少國家已經開始運用商業記錄代替政府統計,新加坡已經在利用商場和超市商業記錄的價格信息計算CPI。北歐丹麥、芬蘭等國均已停止傳統意義上的人口普查,取而代之的是完全使用日常行政登記數據進行人口普查。
(三)大數據將對政府統計信息化建設的挑戰
在大數據時代,從數據搜集到數據處理,結構化與非結構化、標準統一于標準各異、只面對樣本與面對龐大的總體,差異無疑是巨大的,對后者的搜集和處理難度也明顯大于前者。政府統計除了提高搜集、處理、存儲過程中的技術手段外,還需要添置相應的先進設備、網絡、平臺等與應用大數據相適應的硬件設施。除此外,政府統計要應用大數據,需要大數據的生產者提供第三方信息,這需要政府統計要有更多懂數據、懂信息的人才,加強統計隊伍建設、引進和培養復合型人才也已經迫在眉睫。
(四)大數據將對網絡安全和人才短缺的挑戰
由于大數據快速產生,數量不斷擴大,價值不斷上升,數據在使用上的信息系統和網絡更加開放,使得數據外泄的風險在增加。美國斯諾登在香港向世界公開曝光的監聽“棱鏡門”事件,引發了全球信息安全大討論和對人臉識別等前言技術的爭議,迫使國際組織和各國政府需要調整他們的安全政策,以適應更開放和動態的環境。國際經合組織早在2002年發布的《安全指導原則》就提出在不限制數據開放的前提下,從技術層面推進安全,這對數據驅動的經濟模式非常有益。
建設一支擁有數量管理和分析能力的人才隊伍對實現“數據驅動經濟”非常重要。這類人才往往需要具備精湛的專業技能,如信息通信、數理統計能力及具體的行業知識。隨著數據分析需求的激增,在不遠的將來,數據科學家很有可能短缺。美國著名咨詢公司麥肯錫2011年就預測,僅美國對高級分析師的需求就將從現在的14萬人增加到2018年的19萬人。另外,對數據管理和普通數據分析的崗位需求也將達到150萬人。除之外,大數據時代對基礎設施的要求越來越高,特別是高速寬帶網的要求,如移動寬帶的出現極大的促進經濟和商業數據的收集、傳送和應用。據統計,國際經合組織成員國擁有的聯網家用智能設備為18億臺,2017年將達58億臺,2022年將達140億臺。目前IPv4格式的網絡地址基本被用完,未來的上百億臺設備亟需政府啟動向IPv6的遷移。但是目前網絡地址的轉移非常緩慢。
二、政府統計應對大數據的創新與應用
在大數據時代,隨著信息技術的發展、民主意識的崛起、政府執政理念的轉變,政府也在逐漸轉變自己的角色,現已成為世界各國政府的共同理念。美國現任總統奧巴馬曾指出:“為了引領一個開放政府的新時代,面對信息,政府機關的第一反應必須是公開。這意味著我們必須堅定地公開信息,而不是等待公眾查詢。所有的政府機關都應該利用最新的技術推進信息公開,這種公開應該是及時的?!贝髷祿闹匾饬x和深遠影響如同《大數據時代》作者維克多所說,大數據時代的經濟學、政治學、社會學和許多科學門類都會發生巨大甚至是本質上的變化和發展,進而影響人類的價值體系、知識體系和生活方式。
(一)充分運用大數據,官方統計數據收集多元化
“大數據”突出的特點之一就是數據產生頻率高。在統計數據的搜集上:一是官方統計要充分利用和使用行政記錄或商業記錄,作為統計調查數據的重要來源,繼續得到滿足統計需要的數據資料,就能夠有效降低調查成本。本文已經提到了新加坡、芬蘭、丹麥等國運用商業記錄取代政府統計就是典型范例。二是合理利用大數據資源提高攻擊數據的及時性,縮短統計數據生產周期。比如,在網絡銷售領域,互聯網實際上已經成為獲取價格信息的豐富來源,中國阿里巴巴淘寶網發布綜合性淘寶價格指數就是其中一例,使用這類信息能夠縮短政府統計數據生產的周期,彌補政府統計調查在及時性方面的不足。三是合理利用大數據資源可以改善官方統計數據的質量。官方統計的很多數據是通過抽樣調查取得的,由于經費等制約,數據的精確度和覆蓋范圍有限,有時還要面對“瞞報、拒報和漏報”等情況。大數據在某些領域卻能夠提供覆蓋全部(或近乎全部)對象的數據資料。
(二)加強大數據研究,實現統計管理模式創新
可以說對大數據的研究將是世界各國未來科技及經濟社會發展的重大研究戰略之一,因為只有緊緊抓住大數據時代這個大機遇,才能得到大數據的大價值:一是要優先網絡大數據的研究。這是大數據的重要組成部分,與人、與社會科學的活動密切相關。同時網絡數據科學和工程是信息科學技術與社會科學等多個不同領域高度交叉的新型學科方向,對國家的穩定與發展有獨特的作用。
美國奧巴馬政府已投資2億美元支持大數據的發展,同時支持建立全球性的互聯網域名系統,早在2009年就由美國商務部負責開發,以增加互聯網領域的透明度,而不讓某個國家或地區控制互聯網。二是要加強大數據科學的基礎研究,包括大數據分析算法和大數據系統的效率研究。其基礎研究離不開對相關學科的領域知識與研究方法論的借鑒,包括大數據基礎研究和大數據環境下的計算模型及大數據的安全問題等。三是要加強大數據研究的組織構架研究。中國政府已經啟動了“中國大數據科學與工程研究三年行動計劃”,并從宏觀上對我國的大數據產學研用做出系統全面的短期與長期規劃,醞釀成立國家級的行業大數據共享聯盟。
(三)以創新為本,將大數據開發作為新的經濟增長點
大數據的出現被人認為就像是世界第三次浪潮的到來一樣,孕育著大數據時代的到來,一個大規模生產、分享和應用數據的時代正在全球開啟。許多企業和研究咨詢機構已發現了這座金礦所蘊藏的巨大價值,利用所謂“數據挖掘技術(DataMining)”國際經合組織前不久公布了一份題為《探索數據驅動創新作為一種新的增長源泉》的報告。報告提出,社會和經濟活動的不斷網絡化,數據收集、傳輸、存儲和分析成本的下降,共同導致了一個有助于培育新的產業、工業和產品的大數據時代的出現。報告提出,由數據驅動的社會經濟模式開始顯現,數據已成為創造競爭優勢和驅動創新、可持續發展的核心資產。大數據給我們帶了的真正機遇是把許多信息碎片拼起來,為我們的決策服務。
大數據時代最大的挑戰是如何從大數據中獲取最大價值,需要創新和探索。在大數據時代,數據科學家既要熟悉商業環境,也要有操作層面的知識,通過生成、采集、存儲、加工、發布、分析等六個環節形成數據價值鏈。由于數據鏈的成本降低,推動著數據生成與使用的增速,同時隨著網絡參與度的提高和電子服務的推廣,由此產生的現象——通常被稱為“大數據”——標志著向數據驅動型經濟的轉移,在這樣一種經濟中,數據增強競爭力,推動創新、公平與可持續發展。據美國麥肯錫的一份報告中提到,大數據的增值形成了億萬美元的推動力,在公共管理、在線廣告、醫療衛生、公用事業和物流運輸五大行業,通過數據使用顯示了創新和生產力增長的高潛力。
(四)審視“海量數據”,呼吁各國加強統計立法工作
國際官方統計界早在上世紀末就開始使用或關注大數據的發展,早在1992年“利用行政記錄”就被寫進國際官方統計基本原則。聯合國《官方統計基本原則》第五款規定:用于統計目的的數據可以來自各種渠道,如統計調查或行政記錄等。目前,美國、歐盟是最早使用行政記錄的國家,目前有些國家還利用商業紀錄作為官方統計的一部分,其中丹麥和芬蘭并用商業記錄取代國家的人口普查。中國新修訂的《中華人民共和國統計法》第二章第十六條明確規定,統計調查要“充分利用行政記錄等資料”,這是中國使用大數據在法律的依據。
中國人大通過的加強網絡信息保護的決定就是一個好的開始,當前正在加緊制定《中華人民共和國信息公開法》,提出信息公開為原則,以適應大數據時代的到來,防止信息被損壞、篡改、泄露或被竊,保護公民的隱私和國家的信息安全。提高官方統計服務水平,打造法治政府、透明政府。大數據時代統計數據的開放,要求是更深層次的,包括獲得數據的方式、產生的方法必須是透明的,必須同時發布一系列的文檔說明數據的來源和產生的方法,向社會公布各項數據的詳細指標解釋。政府職能要轉向公共服務,減少對市場的干預,充分發揮社會主義市場經濟的作用,創新公眾參與渠道,以提高政府治理的效率。