成人免费毛片AAAAAA片|国产精品久久久久成人|日本中文免费一区二区三区|麻豆久久久9性大片

首頁(yè) > 最新動(dòng)態(tài) > 行業(yè)動(dòng)態(tài)

梅宏:大數據發(fā)展現狀與未來(lái)趨勢


中國特色社會(huì )主義進(jìn)入新時(shí)代,實(shí)現中華民族偉大復興的中國夢(mèng)開(kāi)啟新征程。黨中央決定實(shí)施國家大數據戰略,吹響了加快發(fā)展數字經(jīng)濟、建設數字中國的號角。習近平總書(shū)記在十九屆中共中央政治局第二次集體學(xué)習時(shí)的重要講話(huà)中指出:“大數據是信息化發(fā)展的新階段”,并做出了“推動(dòng)大數據技術(shù)產(chǎn)業(yè)創(chuàng )新發(fā)展、構建以數據為關(guān)鍵要素的數字經(jīng)濟、運用大數據提升國家治理現代化水平、運用大數據促進(jìn)保障和改善民生、切實(shí)保障國家數據安全”的戰略部署,為我國構筑大數據時(shí)代國家綜合競爭新優(yōu)勢指明了方向!

  今天,我擬回顧大數據的發(fā)端、發(fā)展和現狀,研判大數據的未來(lái)趨勢,簡(jiǎn)述我國大數據發(fā)展的態(tài)勢,并匯報我對信息化新階段和數字經(jīng)濟的認識,以及對我國發(fā)展大數據的若干思考和建議。

  一、大數據的發(fā)端與發(fā)展

  從文明之初的“結繩記事”,到文字發(fā)明后的“文以載道”,再到近現代科學(xué)的“數據建?!?,數據一直伴隨著(zhù)人類(lèi)社會(huì )的發(fā)展變遷,承載了人類(lèi)基于數據和信息認識世界的努力和取得的巨大進(jìn)步。然而,直到以電子計算機為代表的現代信息技術(shù)出現后,為數據處理提供了自動(dòng)的方法和手段,人類(lèi)掌握數據、處理數據的能力才實(shí)現了質(zhì)的躍升。信息技術(shù)及其在經(jīng)濟社會(huì )發(fā)展方方面面的應用(即信息化),推動(dòng)數據(信息)成為繼物質(zhì)、能源之后的又一種重要戰略資源。

  “大數據”作為一種概念和思潮由計算領(lǐng)域發(fā)端,之后逐漸延伸到科學(xué)和商業(yè)領(lǐng)域。大多數學(xué)者認為,“大數據”這一概念最早公開(kāi)出現于1998年,美國高性能計算公司SGI的首席科學(xué)家約翰·馬西(John Mashey)在一個(gè)國際會(huì )議報告中指出:隨著(zhù)數據量的快速增長(cháng),必將出現數據難理解、難獲取、難處理和難組織等四個(gè)難題,并用“Big Data(大數據)”來(lái)描述這一挑戰,在計算領(lǐng)域引發(fā)思考。2007年,數據庫領(lǐng)域的先驅人物吉姆·格雷(Jim Gray)指出大數據將成為人類(lèi)觸摸、理解和逼近現實(shí)復雜系統的有效途徑,并認為在實(shí)驗觀(guān)測、理論推導和計算仿真等三種科學(xué)研究范式后,將迎來(lái)第四范式——“數據探索”,后來(lái)同行學(xué)者將其總結為“數據密集型科學(xué)發(fā)現”,開(kāi)啟了從科研視角審視大數據的熱潮。2012年,牛津大學(xué)教授維克托·邁爾-舍恩伯格(Viktor Mayer-Schnberger)在其暢銷(xiāo)著(zhù)作《大數據時(shí)代(Big Data: A Revolution That Will Transform How We Live,Work,and Think)》中指出,數據分析將從“隨機采樣”、“精確求解”和“強調因果”的傳統模式演變?yōu)榇髷祿r(shí)代的“全體數據”、“近似求解”和“只看關(guān)聯(lián)不問(wèn)因果”的新模式,從而引發(fā)商業(yè)應用領(lǐng)域對大數據方法的廣泛思考與探討。

  大數據于2012、2013年達到其宣傳高潮,2014年后概念體系逐漸成形,對其認知亦趨于理性。大數據相關(guān)技術(shù)、產(chǎn)品、應用和標準不斷發(fā)展,逐漸形成了包括數據資源與API、開(kāi)源平臺與工具、數據基礎設施、數據分析、數據應用等板塊構成的大數據生態(tài)系統,并持續發(fā)展和不斷完善,其發(fā)展熱點(diǎn)呈現了從技術(shù)向應用、再向治理的逐漸遷移。經(jīng)過(guò)多年來(lái)的發(fā)展和沉淀,人們對大數據已經(jīng)形成基本共識:大數據現象源于互聯(lián)網(wǎng)及其延伸所帶來(lái)的無(wú)處不在的信息技術(shù)應用以及信息技術(shù)的不斷低成本化。大數據泛指無(wú)法在可容忍的時(shí)間內用傳統信息技術(shù)和軟硬件工具對其進(jìn)行獲取、管理和處理的巨量數據集合,具有海量性、多樣性、時(shí)效性及可變性等特征,需要可伸縮的計算體系結構以支持其存儲、處理和分析。

  大數據的價(jià)值本質(zhì)上體現為:提供了一種人類(lèi)認識復雜系統的新思維和新手段。就理論上而言,在足夠小的時(shí)間和空間尺度上,對現實(shí)世界數字化,可以構造一個(gè)現實(shí)世界的數字虛擬映像,這個(gè)映像承載了現實(shí)世界的運行規律。在擁有充足的計算能力和高效的數據分析方法的前提下,對這個(gè)數字虛擬映像的深度分析,將有可能理解和發(fā)現現實(shí)復雜系統的運行行為、狀態(tài)和規律。應該說(shuō)大數據為人類(lèi)提供了全新的思維方式和探知客觀(guān)規律、改造自然和社會(huì )的新手段,這也是大數據引發(fā)經(jīng)濟社會(huì )變革最根本性的原因。

  二、大數據的現狀與趨勢

  全球范圍內,研究發(fā)展大數據技術(shù)、運用大數據推動(dòng)經(jīng)濟發(fā)展、完善社會(huì )治理、提升政府服務(wù)和監管能力正成為趨勢。下面將從應用、治理和技術(shù)三個(gè)方面對當前大數據的現狀與趨勢進(jìn)行梳理。

  一是已有眾多成功的大數據應用,但就其效果和深度而言,當前大數據應用尚處于初級階段,根據大數據分析預測未來(lái)、指導實(shí)踐的深層次應用將成為發(fā)展重點(diǎn)。

  按照數據開(kāi)發(fā)應用深入程度的不同,可將眾多的大數據應用分為三個(gè)層次。第一層,描述性分析應用,是指從大數據中總結、抽取相關(guān)的信息和知識,幫助人們分析發(fā)生了什么,并呈現事物的發(fā)展歷程。如美國的DOMO公司從其企業(yè)客戶(hù)的各個(gè)信息系統中抽取、整合數據,再以統計圖表等可視化形式,將數據蘊含的信息推送給不同崗位的業(yè)務(wù)人員和管理者,幫助其更好地了解企業(yè)現狀,進(jìn)而做出判斷和決策。第二層,預測性分析應用,是指從大數據中分析事物之間的關(guān)聯(lián)關(guān)系、發(fā)展模式等,并據此對事物發(fā)展的趨勢進(jìn)行預測。如微軟公司紐約研究院研究員David Rothschild通過(guò)收集和分析賭博市場(chǎng)、好萊塢證券交易所、社交媒體用戶(hù)發(fā)布的帖子等大量公開(kāi)數據,建立預測模型,對多屆奧斯卡獎項的歸屬進(jìn)行預測。2014和2015年,均準確預測了奧斯卡共24個(gè)獎項中的21個(gè),準確率達87.5%。第三層,指導性分析應用,是指在前兩個(gè)層次的基礎上,分析不同決策將導致的后果,并對決策進(jìn)行指導和優(yōu)化。如無(wú)人駕駛汽車(chē)分析高精度地圖數據和海量的激光雷達、攝像頭等傳感器的實(shí)時(shí)感知數據,對車(chē)輛不同駕駛行為的后果進(jìn)行預判,并據此指導車(chē)輛的自動(dòng)駕駛。

  當前,在大數據應用的實(shí)踐中,描述性、預測性分析應用多,決策指導性等更深層次分析應用偏少。一般而言,人們做出決策的流程通常包括:認知現狀、預測未來(lái)和選擇策略這三個(gè)基本步驟。這些步驟也對應了上述大數據分析應用的三個(gè)不同類(lèi)型。不同類(lèi)型的應用意味著(zhù)人類(lèi)和計算機在決策流程中不同的分工和協(xié)作。例如:第一層次的描述性分析中,計算機僅負責將與現狀相關(guān)的信息和知識展現給人類(lèi)專(zhuān)家,而對未來(lái)態(tài)勢的判斷及對最優(yōu)策略的選擇仍然由人類(lèi)專(zhuān)家完成。應用層次越深,計算機承擔的任務(wù)越多、越復雜,效率提升也越大,價(jià)值也越大。然而,隨著(zhù)研究應用的不斷深入,人們逐漸意識到前期在大數據分析應用中大放異彩的深度神經(jīng)網(wǎng)絡(luò )尚存在基礎理論不完善、模型不具可解釋性、魯棒性較差等問(wèn)題。因此,雖然應用層次最深的決策指導性應用,當前已在人機博弈等非關(guān)鍵性領(lǐng)域取得較好應用效果,但是,在自動(dòng)駕駛、政府決策、軍事指揮、醫療健康等應用價(jià)值更高,且與人類(lèi)生命、財產(chǎn)、發(fā)展和安全緊密關(guān)聯(lián)的領(lǐng)域,要真正獲得有效應用,仍面臨一系列待解決的重大基礎理論和核心技術(shù)挑戰。在此之前,人們還不敢、也不能放手將更多的任務(wù)交由計算機大數據分析系統來(lái)完成。這也意味著(zhù),雖然已有很多成功的大數據應用案例,但還遠未達到我們的預期,大數據應用仍處于初級階段。未來(lái),隨著(zhù)應用領(lǐng)域的拓展、技術(shù)的提升、數據共享開(kāi)放機制的完善,以及產(chǎn)業(yè)生態(tài)的成熟,具有更大潛在價(jià)值的預測性和指導性應用將是發(fā)展的重點(diǎn)。

  二是大數據治理體系遠未形成,特別是隱私保護、數據安全與數據共享利用效率之間尚存在明顯矛盾,成為制約大數據發(fā)展的重要短板,各界已經(jīng)意識到構建大數據治理體系的重要意義,相關(guān)的研究與實(shí)踐將持續加強。

  隨著(zhù)大數據作為戰略資源的地位日益凸顯,人們越來(lái)越強烈地意識到制約大數據發(fā)展最大的短板之一就是:數據治理體系遠未形成,如數據資產(chǎn)地位的確立尚未達成共識,數據的確權、流通和管控面臨多重挑戰;數據壁壘廣泛存在,阻礙了數據的共享和開(kāi)放;法律法規發(fā)展滯后,導致大數據應用存在安全與隱私風(fēng)險;等等。如此種種因素,制約了數據資源中所蘊含價(jià)值的挖掘與轉化。

  其中,隱私、安全與共享利用之間的矛盾問(wèn)題尤為凸顯。一方面,數據共享開(kāi)放的需求十分迫切。近年來(lái)人工智能應用取得的重要進(jìn)展,主要源于對海量、高質(zhì)量數據資源的分析和挖掘。而對于單一組織機構而言,往往靠自身的積累難以聚集足夠的高質(zhì)量數據。另外,大數據應用的威力,在很多情況下源于對多源數據的綜合融合和深度分析,從而獲得從不同角度觀(guān)察、認知事物的全方位視圖。而單個(gè)系統、組織的數據往往僅包含事物某個(gè)片面、局部的信息,因此,只有通過(guò)共享開(kāi)放和數據跨域流通才能建立信息完整的數據集。

  然而,另一方面,數據的無(wú)序流通與共享,又可能導致隱私保護和數據安全方面的重大風(fēng)險,必須對其加以規范和限制。例如,鑒于互聯(lián)網(wǎng)公司頻發(fā)的、由于對個(gè)人數據的不正當使用而導致的隱私安全問(wèn)題,歐盟制定了“史上最嚴格的”數據安全管理法規《通用數據保護條例》(General Data Protection Regulation,GDPR),并于2018年5月25日正式生效?!稐l例》生效后,Facebook和谷歌等互聯(lián)網(wǎng)企業(yè)即被指控強迫用戶(hù)同意共享個(gè)人數據而面臨巨額罰款,并被推上輿論的風(fēng)口浪尖。2020年1月1日,被稱(chēng)為美國“最嚴厲、最全面的個(gè)人隱私保護法案”——《加利福利亞消費者隱私法案》(CCPA)將正式生效。CCPA規定了新的消費者權利,旨在加強消費者隱私權和數據安全保護,涉及企業(yè)收集的個(gè)人信息的訪(fǎng)問(wèn)、刪除和共享,企業(yè)負有保護個(gè)人信息的責任,消費者控制并擁有其個(gè)人信息,這是美國目前最具典型意義的州隱私立法,提高了美國保護隱私的標準。在這種情況下,過(guò)去利用互聯(lián)網(wǎng)平臺中心化搜集用戶(hù)數據,實(shí)現平臺化的精準營(yíng)銷(xiāo)的這一典型互聯(lián)網(wǎng)商業(yè)模式將面臨重大挑戰。

  我國在個(gè)人信息保護方面也開(kāi)展了較長(cháng)時(shí)間的工作,針對互聯(lián)網(wǎng)環(huán)境下的個(gè)人信息保護,制定了《全國人民代表大會(huì )常務(wù)委員會(huì )關(guān)于加強網(wǎng)絡(luò )信息保護的決定》《電信和互聯(lián)網(wǎng)用戶(hù)個(gè)人信息保護規定》《全國人民代表大會(huì )常務(wù)委員會(huì )關(guān)于維護互聯(lián)網(wǎng)安全的決定》和《消費者權益保護法》等相關(guān)法律文件。特別是2016年11月7日,全國人大常委會(huì )通過(guò)的《中華人民共和國網(wǎng)絡(luò )安全法》中明確了對個(gè)人信息收集、使用及保護的要求,并規定了個(gè)人對其個(gè)人信息進(jìn)行更正或刪除的權利。2019年,中央網(wǎng)信辦發(fā)布了《數據安全管理辦法(征求意見(jiàn)稿)》,向社會(huì )公開(kāi)征求意見(jiàn),明確了個(gè)人信息和重要數據的收集、處理、使用和安全監督管理的相關(guān)標準和規范。相信這些法律法規將在促進(jìn)數據的合規使用、保障個(gè)人隱私和數據安全等方面發(fā)揮不可或缺的重要作用。然而,從體系化、確保一致性、避免碎片化考慮,制訂專(zhuān)門(mén)的數據安全法、個(gè)人信息保護法是必要的。

  另一方面,我們也應看到,這些法律法規也將在客觀(guān)上不可避免地增加數據流通的成本、降低數據綜合利用的效率。如何兼顧發(fā)展和安全,平衡效率和風(fēng)險,在保障安全的前提下,不因噎廢食,不對大數據價(jià)值的挖掘利用造成過(guò)分的負面影響,是當前全世界在數據治理中面臨的共同課題。

  近年來(lái),圍繞大數據治理這一主題及其相關(guān)問(wèn)題,國際上已有不少成功的實(shí)踐和研究探索工作,諸如在國家層面推出的促進(jìn)數據共享開(kāi)放、保障數據安全和保護公民隱私的相關(guān)政策和法規,針對企業(yè)機構的數據管理能力評估和改善,面向數據質(zhì)量保證的方法與技術(shù),促進(jìn)數據互操作的技術(shù)規范和標準等。然而,考察當前的研究和實(shí)踐,仍存在三個(gè)方面的主要問(wèn)題。

  一是大數據治理概念的使用相對“狹義”,研究和實(shí)踐大都以企業(yè)組織為對象,僅從個(gè)體組織的角度考慮大數據治理的相關(guān)問(wèn)題,這與大數據跨界流動(dòng)的迫切需求存在矛盾,限制了大數據價(jià)值的發(fā)揮。二是現有研究實(shí)踐對大數據治理內涵的理解尚未形成共識,不同研究者從流程設計、信息治理和數據管理應用等不同視角,給出了大數據治理的不同定義,共識的形成尚有待時(shí)日!三是大數據治理相關(guān)的研究實(shí)踐多條線(xiàn)索并行,關(guān)聯(lián)性、完整性和一致性不足。諸如,國家層面的政策法規和法律制定等較少被納入大數據治理的視角;數據作為一種資產(chǎn)的地位仍未通過(guò)法律法規予以確立,難以進(jìn)行有效的管理和應用;大數據管理已有不少可用技術(shù)與產(chǎn)品,但還缺乏完善的多層級管理體制和高效管理機制;如何有機結合技術(shù)與標準,建立良好的大數據共享與開(kāi)放環(huán)境仍需要進(jìn)一步探索。缺少系統化設計,僅僅在已有的相關(guān)體系上進(jìn)行擴展和延伸,可能會(huì )導致數據治理的“碎片化”和一致性缺失等等。

  當前,各界已經(jīng)普遍認識到了大數據治理的重要意義,大數據治理體系建設已經(jīng)成為大數據發(fā)展重點(diǎn),但仍處在發(fā)展的雛形階段,推進(jìn)大數據治理體系建設將是未來(lái)較長(cháng)一段時(shí)間內需要持續努力的方向。

  三是數據規模高速增長(cháng),現有技術(shù)體系難以滿(mǎn)足大數據應用的需求,大數據理論與技術(shù)遠未成熟,未來(lái)信息技術(shù)體系將需要顛覆式創(chuàng )新和變革。

  近年來(lái),數據規模呈幾何級數高速成長(cháng)。據國際信息技術(shù)咨詢(xún)企業(yè)國際數據公司(IDC)的報告,2020年全球數據存儲量將達到44ZB(1021),到2030年將達到2500ZB。當前,需要處理的數據量已經(jīng)大大超過(guò)處理能力的上限,從而導致大量數據因無(wú)法或來(lái)不及處理,而處于未被利用、價(jià)值不明的狀態(tài),這些數據被稱(chēng)為“暗數據”。據國際商業(yè)機器公司(IBM)的研究報告估計,大多數企業(yè)僅對其所有數據的1%進(jìn)行了分析應用。

  近年來(lái),大數據獲取、存儲、管理、處理、分析等相關(guān)的技術(shù)已有顯著(zhù)進(jìn)展,但是大數據技術(shù)體系尚不完善,大數據基礎理論的研究仍處于萌芽期。首先,大數據定義雖已達成初步共識,但許多本質(zhì)問(wèn)題仍存在爭議,例如:數據驅動(dòng)與規則驅動(dòng)的對立統一、“關(guān)聯(lián)”與“因果”的辯證關(guān)系、“全數據”的時(shí)空相對性、分析模型的可解釋性與魯棒性等;其次,針對特定數據集和特定問(wèn)題域已有不少專(zhuān)用解決方案,是否有可能形成“通用”或“領(lǐng)域通用”的統一技術(shù)體系,仍有待未來(lái)的技術(shù)發(fā)展給出答案;其三,應用超前于理論和技術(shù)發(fā)展,數據分析的結論往往缺乏堅實(shí)的理論基礎,對這些結論的使用仍需保持謹慎態(tài)度。

  推演信息技術(shù)的未來(lái)發(fā)展趨勢,較長(cháng)時(shí)期內仍將保持漸進(jìn)式發(fā)展態(tài)勢,隨技術(shù)發(fā)展帶來(lái)的數據處理能力的提升將遠遠落后于按指數增長(cháng)模式快速遞增的數據體量,數據處理能力與數據資源規模之間的“剪刀差”將隨時(shí)間持續擴大,大數據現象將長(cháng)期存在。在此背景下,大數據現象倒逼技術(shù)變革,將使得信息技術(shù)體系進(jìn)行一次重構,這也帶來(lái)了顛覆式發(fā)展的機遇。例如,計算機體系結構以數據為中心的宏觀(guān)走向和存算一體的微觀(guān)走向,軟件定義方法論的廣泛采用,云邊端融合的新型計算模式等;網(wǎng)絡(luò )通信向寬帶、移動(dòng)、泛在發(fā)展,海量數據的快速傳輸和匯聚帶來(lái)的網(wǎng)絡(luò )的Pb/s級帶寬需求,千億級設備聯(lián)網(wǎng)帶來(lái)的Gb/s級高密度泛在移動(dòng)接入需求;大數據的時(shí)空復雜度亟需在表示、組織、處理和分析等方面的基礎性原理性突破,高性能、高時(shí)效、高吞吐等極端化需求呼喚基礎器件的創(chuàng )新和變革;軟硬件開(kāi)源開(kāi)放趨勢導致產(chǎn)業(yè)發(fā)展生態(tài)的重構;等等。

  三、大數據與數字經(jīng)濟

  大數據是信息技術(shù)發(fā)展的必然產(chǎn)物,更是信息化進(jìn)程的新階段,其發(fā)展推動(dòng)了數字經(jīng)濟的形成與繁榮。信息化已經(jīng)歷了兩次高速發(fā)展的浪潮,始于上世紀80年代,隨個(gè)人計算機大規模普及應用所帶來(lái)的以單機應用為主要特征的數字化(信息化1.0),及始于上世紀90年代中期,隨互聯(lián)網(wǎng)大規模商用進(jìn)程所推動(dòng)的以聯(lián)網(wǎng)應用為主要特征的網(wǎng)絡(luò )化(信息化2.0)。當前,我們正在進(jìn)入以數據的深度挖掘和融合應用為主要特征的智能化階段(信息化3.0)。在“人機物”三元融合的大背景下,以“萬(wàn)物均需互聯(lián)、一切皆可編程”為目標,數字化、網(wǎng)絡(luò )化和智能化呈融合發(fā)展新態(tài)勢。

  在信息化發(fā)展歷程中,數字化、網(wǎng)絡(luò )化和智能化是三條并行不悖的主線(xiàn)。數字化奠定基礎,實(shí)現數據資源的獲取和積累;網(wǎng)絡(luò )化構建平臺,促進(jìn)數據資源的流通和匯聚;智能化展現能力,通過(guò)多源數據的融合分析呈現信息應用的類(lèi)人智能,幫助人類(lèi)更好地認知復雜事物和解決問(wèn)題。

  信息化新階段開(kāi)啟的另一個(gè)重要表征是信息技術(shù)開(kāi)始從助力經(jīng)濟發(fā)展的輔助工具向引領(lǐng)經(jīng)濟發(fā)展的核心引擎轉變,進(jìn)而催生一種新的經(jīng)濟范式—“數字經(jīng)濟”。數字經(jīng)濟是指以數字化知識和信息為關(guān)鍵生產(chǎn)要素、以現代信息網(wǎng)絡(luò )為重要載體、以信息通信技術(shù)的有效使用為效率提升和經(jīng)濟結構優(yōu)化的重要推動(dòng)力的一系列經(jīng)濟活動(dòng),是以新一代信息技術(shù)和產(chǎn)業(yè)為依托,繼農業(yè)經(jīng)濟、工業(yè)經(jīng)濟之后的新經(jīng)濟形態(tài)。從構成上看,農業(yè)經(jīng)濟屬單層結構,以農業(yè)為主,配合以其他行業(yè),以人力、畜力和自然力為動(dòng)力,使用手工工具,以家庭為單位自給自足,社會(huì )分工不明顯,行業(yè)間相對獨立;工業(yè)經(jīng)濟是兩層結構,即提供能源動(dòng)力和行業(yè)制造設備的裝備制造產(chǎn)業(yè),以及工業(yè)化后的各行各業(yè),并形成分工合作的工業(yè)體系。數字經(jīng)濟則可分為三個(gè)層次:提供核心動(dòng)能的信息技術(shù)及其裝備產(chǎn)業(yè)、深度信息化的各行各業(yè)以及跨行業(yè)數據融合應用的數據增值產(chǎn)業(yè)。當前,數字經(jīng)濟正處于成型展開(kāi)期,將進(jìn)入信息技術(shù)引領(lǐng)經(jīng)濟發(fā)展的爆發(fā)期、黃金期!

  從另一個(gè)視角來(lái)看,如果說(shuō)過(guò)去20多年,互聯(lián)網(wǎng)高速發(fā)展引發(fā)了一場(chǎng)社會(huì )經(jīng)濟的“革命”,深刻地改變了人類(lèi)社會(huì ),現在可以看到,互聯(lián)網(wǎng)革命的上半場(chǎng)已經(jīng)結束。上半場(chǎng)的主要特征是“2C”(面向最終用戶(hù)),主戰場(chǎng)是面向個(gè)人提供社交、購物、教育、娛樂(lè )等服務(wù),可稱(chēng)為“消費互聯(lián)網(wǎng)”。而互聯(lián)網(wǎng)革命的下半場(chǎng)正在開(kāi)啟,其主要特征將是“2B”(面向組織機構),重點(diǎn)在于促進(jìn)供給側的深刻變革,互聯(lián)網(wǎng)應用將面向各行業(yè),特別是制造業(yè),以?xún)?yōu)化資源配置、提質(zhì)增效為目標,構建以工業(yè)物聯(lián)為基礎和工業(yè)大數據為要素的工業(yè)互聯(lián)網(wǎng)。作為互聯(lián)網(wǎng)發(fā)展的新領(lǐng)域,工業(yè)互聯(lián)網(wǎng)是新一代信息技術(shù)與生產(chǎn)技術(shù)深度融合的產(chǎn)物,它通過(guò)人、機、物的深度互聯(lián),全要素、全產(chǎn)業(yè)鏈、全價(jià)值鏈的全面鏈接,推動(dòng)形成新的工業(yè)生產(chǎn)制造和服務(wù)體系。當前,新一輪工業(yè)革命正在拉開(kāi)帷幕,在全球范圍內不斷顛覆傳統制造模式、生產(chǎn)組織方式和產(chǎn)業(yè)形態(tài),而我國正處于由數量和規模擴張向質(zhì)量和效益提升轉變的關(guān)鍵期,需要抓住歷史機遇期,促進(jìn)新舊動(dòng)能轉換,形成競爭新優(yōu)勢。我國是制造大國和互聯(lián)網(wǎng)大國,推動(dòng)工業(yè)互聯(lián)網(wǎng)創(chuàng )新發(fā)展具備豐富的應用場(chǎng)景、廣闊的市場(chǎng)空間和巨大的推進(jìn)動(dòng)力。

  數字經(jīng)濟未來(lái)發(fā)展呈現如下趨勢:一是以互聯(lián)網(wǎng)為核心的新一代信息技術(shù)正逐步演化為人類(lèi)社會(huì )經(jīng)濟活動(dòng)的基礎設施,并將對原有的物理基礎設施完成深度信息化改造和軟件定義,在其支撐下,人類(lèi)極大地突破了溝通和協(xié)作的時(shí)空約束,推動(dòng)平臺經(jīng)濟、共享經(jīng)濟等新經(jīng)濟模式快速發(fā)展。以平臺經(jīng)濟中的零售平臺為例,百貨大樓在前互聯(lián)網(wǎng)時(shí)代對促進(jìn)零售業(yè)發(fā)展起到了重要作用。而從上世紀九十年代中后期開(kāi)始,伴隨互聯(lián)網(wǎng)的普及,電子商務(wù)平臺逐漸興起。與要求供需方必須在同一時(shí)空達成交易的百貨大樓不同,電子商務(wù)平臺依托互聯(lián)網(wǎng),將遍布全球各個(gè)角落的消費者、供貨方連接在一起,并聚合物流、支付、信用管理等配套服務(wù),突破了時(shí)空約束,大幅減少了中間環(huán)節,降低了交易成本,提高了交易效率。按阿里研究院的報告,過(guò)去十年間,中國電子商務(wù)規模增長(cháng)了10倍,并呈加速發(fā)展趨勢。二是各行業(yè)工業(yè)互聯(lián)網(wǎng)的構建將促進(jìn)各種業(yè)態(tài)圍繞信息化主線(xiàn)深度協(xié)作、融合,在完成自身提升變革的同時(shí),不斷催生新的業(yè)態(tài),并使一些傳統業(yè)態(tài)走向消亡。如隨著(zhù)無(wú)人駕駛汽車(chē)技術(shù)的成熟和應用,傳統出租車(chē)業(yè)態(tài)將可能面臨消亡。其他很多重復性的、對創(chuàng )新創(chuàng )意要求不高的傳統行業(yè)也將退出歷史舞臺。2017年10月,《紐約客》雜志報道了劍橋大學(xué)兩名研究者對未來(lái)365種職業(yè)被信息技術(shù)淘汰的可能性分析,其中電話(huà)推銷(xiāo)員、打字員、會(huì )計等職業(yè)高居榜首。三是在信息化理念和政務(wù)大數據的支撐下,政府的綜合管理服務(wù)能力和政務(wù)服務(wù)的便捷性持續提升,公眾積極參與社會(huì )治理,形成共策共商共治的良好生態(tài)。四是信息技術(shù)體系將完成蛻變升華式的重構,釋放出遠超當前的技術(shù)能力,從而使蘊含在大數據中的巨大價(jià)值得以充分釋放,帶來(lái)數字經(jīng)濟的爆發(fā)式增長(cháng)。

  四、我國大數據發(fā)展的態(tài)勢

  黨的十八屆五中全會(huì )將大數據上升為國家戰略?;仡欉^(guò)去幾年的發(fā)展,我國大數據發(fā)展可總結為:“進(jìn)步長(cháng)足,基礎漸厚;喧囂已逝,理性回歸;成果豐碩,短板仍在;勢頭強勁,前景光明”。

  作為人口大國和制造大國,我國數據產(chǎn)生能力巨大,大數據資源極為豐富。隨著(zhù)數字中國建設的推進(jìn),各行業(yè)的數據資源采集、應用能力不斷提升,將會(huì )導致更快更多的數據積累。預計到2020年,我國數據總量有望達到8000EB(1018),占全球數據總量的21%,將成為名列前茅的數據資源大國和全球數據中心。

  我國互聯(lián)網(wǎng)大數據領(lǐng)域發(fā)展態(tài)勢良好,市場(chǎng)化程度較高,一些互聯(lián)網(wǎng)公司建成了具有國際領(lǐng)先水平的大數據存儲與處理平臺,并在移動(dòng)支付、網(wǎng)絡(luò )征信、電子商務(wù)等應用領(lǐng)域取得國際先進(jìn)甚至領(lǐng)先的重要進(jìn)展。然而,大數據與實(shí)體經(jīng)濟融合還遠不夠,行業(yè)大數據應用的廣度和深度明顯不足,生態(tài)系統亟待形成和發(fā)展。

  隨著(zhù)政務(wù)信息化的不斷發(fā)展,各級政府積累了大量與公眾生產(chǎn)生活息息相關(guān)的信息系統和數據,并成為最具價(jià)值數據的保有者。如何盤(pán)活這些數據,更好地支撐政府決策和便民服務(wù),進(jìn)而引領(lǐng)促進(jìn)大數據事業(yè)發(fā)展,是事關(guān)全局的關(guān)鍵。2015年9月,國務(wù)院發(fā)布《促進(jìn)大數據發(fā)展行動(dòng)綱要》,其中重要任務(wù)之一就是“加快政府數據開(kāi)放共享,推動(dòng)資源整合,提升治理能力”,并明確了時(shí)間節點(diǎn),2017年跨部門(mén)數據資源共享共用格局基本形成;2018年建成政府主導的數據共享開(kāi)放平臺,打通政府部門(mén)、企事業(yè)單位間的數據壁壘,并在部分領(lǐng)域開(kāi)展應用試點(diǎn);2020年實(shí)現政府數據集的普遍開(kāi)放。隨后,國務(wù)院和國務(wù)院辦公廳又陸續印發(fā)了系列文件,推進(jìn)政務(wù)信息資源共享管理、政務(wù)信息系統整合共享、互聯(lián)網(wǎng)政務(wù)服務(wù)試點(diǎn)、政務(wù)服務(wù)一網(wǎng)一門(mén)一次改革等,推進(jìn)跨層級、跨地域、跨系統、跨部門(mén)、跨業(yè)務(wù)的政務(wù)信息系統整合、互聯(lián)、協(xié)同和數據共享,用政務(wù)大數據支撐“放管服”改革落地,建設數字政府和智慧政府。目前,我國政務(wù)領(lǐng)域的數據開(kāi)放共享已取得了重要進(jìn)展和明顯效果。例如:浙江省推出的“最多跑一次”改革,是推進(jìn)供給側結構性改革、落實(shí)“放管服”改革、優(yōu)化營(yíng)商環(huán)境的重要舉措。以衢州市不動(dòng)產(chǎn)交易為例,通過(guò)設立綜合窗口再造業(yè)務(wù)流程,群眾由原來(lái)跑?chē)?、住建、稅?wù)3個(gè)窗口8次提交3套材料,變?yōu)橹慌芫C合窗口1個(gè)窗口1次提交1套材料,效率大幅提高。據有關(guān)統計,截至2019年上半年,我國已有82個(gè)省級、副省級和地級政府上線(xiàn)了數據開(kāi)放平臺,涉及41.93%的省級行政區、66.67%的副省級城市和18.55%的地級城市。

  我國已經(jīng)具備加快技術(shù)創(chuàng )新的良好基礎。在科研投入方面,前期通過(guò)國家科技計劃在大規模集群計算、服務(wù)器、處理器芯片、基礎軟件等方面系統性部署了研發(fā)任務(wù),成績(jì)斐然?!笆濉逼陂g在國家重點(diǎn)研發(fā)計劃中實(shí)施了“云計算和大數據”重點(diǎn)專(zhuān)項。當前科技創(chuàng )新2030大數據重大項目正在緊鑼密鼓地籌劃、部署中。我國在大數據內存計算、協(xié)處理芯片、分析方法等方面突破了一些關(guān)鍵技術(shù),特別是打破“信息孤島”的數據互操作技術(shù)和互聯(lián)網(wǎng)大數據應用技術(shù)已處于國際領(lǐng)先水平;在大數據存儲、處理方面,研發(fā)了一些重要產(chǎn)品,有效地支撐了大數據應用;國內互聯(lián)網(wǎng)公司推出的大數據平臺和服務(wù),處理能力躋身世界前列。

  國家大數據戰略實(shí)施以來(lái),地方政府紛紛響應聯(lián)動(dòng)、積極謀劃布局。國家發(fā)改委組織建設11個(gè)國家大數據工程實(shí)驗室,為大數據領(lǐng)域相關(guān)技術(shù)創(chuàng )新提供支撐和服務(wù)。發(fā)改委、工信部、中央網(wǎng)信辦聯(lián)合批復貴州、上海、京津冀、珠三角等8個(gè)綜合試驗區,正在加快建設。各地方政府紛紛出臺促進(jìn)大數據發(fā)展的指導政策、發(fā)展方案、專(zhuān)項政策和規章制度等,使大數據發(fā)展呈蓬勃之勢。

  然而,我們也必須清醒地認識到我國在大數據方面仍存在一系列亟待補上的短板。

  一是大數據治理體系尚待構建。首先,法律法規滯后。目前,我國尚無(wú)真正意義上的數據管理法規,只在少數相關(guān)法律條文中有涉及到數據管理、數據安全等規范的內容,難以滿(mǎn)足快速增長(cháng)的數據管理需求。其次,共享開(kāi)放程度低。推動(dòng)數據資源共享開(kāi)放,將有利于打通不同部門(mén)和系統的壁壘,促進(jìn)數據流轉,形成覆蓋全面的大數據資源,為大數據分析應用奠定基礎。我國政府機構和公共部門(mén)已經(jīng)掌握巨大的數據資源,但存在“不愿”、“不敢”和“不會(huì )”共享開(kāi)放的問(wèn)題。例如:在“最多跑一次”改革中,由于技術(shù)人員缺乏,政務(wù)業(yè)務(wù)流程優(yōu)化不足,涉及部門(mén)多、鏈條長(cháng),長(cháng)期以來(lái)多頭管理、各自為政等問(wèn)題,導致很多地區、鄉鎮的綜合性窗口難建立、數據難流動(dòng)、業(yè)務(wù)系統難協(xié)調。同時(shí),由于辦事流程不規范,網(wǎng)上辦事大廳指南五花八門(mén),以至于同一個(gè)縣市辦理同一項事件,需要的材料、需要集成的數據在各鄉鎮的政務(wù)審批系統里卻各有不同,造成群眾不能一次性獲得準確的相關(guān)信息而需要“跑多次”。當前,我國的政務(wù)數據共享開(kāi)放進(jìn)程,相對于《行動(dòng)綱要》明確的時(shí)間節點(diǎn),已明顯落后,且數據質(zhì)量堪憂(yōu)。不少地方的政務(wù)數據開(kāi)放平臺,仍然存在標準不統一、數據不完整、不好用甚至不可用等問(wèn)題。政務(wù)數據共享開(kāi)放意義重大,仍需要堅持不懈地持續推進(jìn)。此外,在數據共享與開(kāi)放的實(shí)施過(guò)程中,各地還存在片面強調數據物理集中的“一刀切”現象,對已有信息化建設投資保護不足,造成新的浪費。第三,安全隱患增多。近年來(lái),數據安全和隱私數據泄露事件頻發(fā),凸顯大數據發(fā)展面臨的嚴峻挑戰。在大數據環(huán)境下,數據在采集、存儲、跨境跨系統流轉、利用、交易和銷(xiāo)毀等環(huán)節的全生命周期過(guò)程中,所有權與管理權分離,真假難辨,多系統、多環(huán)節的信息隱性留存,導致數據跨境跨系統流轉追蹤難、控制難,數據確權和可信銷(xiāo)毀也更加困難。

  二是核心技術(shù)薄弱?;A理論與核心技術(shù)的落后導致我國信息技術(shù)長(cháng)期存在“空心化”和“低端化”問(wèn)題,大數據時(shí)代需避免此問(wèn)題在新一輪發(fā)展中再次出現。近年來(lái),我國在大數據應用領(lǐng)域取得較大進(jìn)展,但是基礎理論、核心器件和算法、軟件等層面,較之美國等技術(shù)發(fā)達國家仍明顯落后。在大數據管理、處理系統與工具方面,我國主要依賴(lài)國外開(kāi)源社區的開(kāi)源軟件,然而,由于我國對國際開(kāi)源社區的影響力較弱,導致對大數據技術(shù)生態(tài)缺乏自主可控能力,成為制約我國大數據產(chǎn)業(yè)發(fā)展和國際化運營(yíng)的重大隱患。

  三是融合應用有待深化。我國大數據與實(shí)體經(jīng)濟融合不夠深入,主要問(wèn)題表現在:基礎設施配置不到位,數據采集難度大;缺乏有效引導與支撐,實(shí)體經(jīng)濟數字化轉型緩慢;缺乏自主可控的數據互聯(lián)共享平臺等。當前,工業(yè)互聯(lián)網(wǎng)成為互聯(lián)網(wǎng)發(fā)展的新領(lǐng)域,然而仍存在不少問(wèn)題:政府熱、企業(yè)冷,政府時(shí)有“項目式”、“運動(dòng)式”推進(jìn),而企業(yè)由于沒(méi)看到直接、快捷的好處,接受度低;設備設施的數字化率和聯(lián)網(wǎng)率偏低;大多數大企業(yè)仍然傾向打造難以與外部系統交互數據的封閉系統,而眾多中小企業(yè)數字化轉型的動(dòng)力和能力嚴重不足;國外廠(chǎng)商的設備在我國具有壟斷地位,這些企業(yè)紛紛推出相應的工業(yè)互聯(lián)網(wǎng)平臺,搶占工業(yè)領(lǐng)域的大數據基礎服務(wù)市場(chǎng)。

  五、若干思考和建議

  最后,我想基于自己在大數據領(lǐng)域的研究實(shí)踐,匯報若干思考和建議。一家之見(jiàn),僅供參考。

  (一)大力發(fā)展行業(yè)大數據應用

  當前,我國互聯(lián)網(wǎng)領(lǐng)域的大數據應用市場(chǎng)化程度高、發(fā)展較好,但行業(yè)應用廣度和深度明顯不足,生態(tài)系統亟待形成和發(fā)展。事實(shí)上,與實(shí)體經(jīng)濟緊密結合的行業(yè)大數據應用蘊含了更加巨大的發(fā)展潛力和價(jià)值。以制造業(yè)為例,麥肯錫研究報告稱(chēng):制造企業(yè)在利用大數據技術(shù)后,其生產(chǎn)成本能夠降低10%—15%。而大數據技術(shù)對制造業(yè)的影響遠非成本這一個(gè)方面。利用源于產(chǎn)品生命周期中市場(chǎng)、設計、制造、服務(wù)、再利用等各個(gè)環(huán)節數據,制造業(yè)企業(yè)可以更加精細、個(gè)性化地了解客戶(hù)需求;建立更加精益化、柔性化、智能化的生產(chǎn)系統;創(chuàng )造包括銷(xiāo)售產(chǎn)品、服務(wù)、價(jià)值等多樣的商業(yè)模式;并實(shí)現從應激式到預防式的工業(yè)系統運轉管理模式的轉變。制造業(yè)是國民經(jīng)濟不可或缺的一環(huán),也是一個(gè)國家競爭力背后的強大力量支撐。我國制造業(yè)位居世界第一,卻大而不強。企業(yè)創(chuàng )新能力不足,高端和高價(jià)值產(chǎn)品欠缺,在國際產(chǎn)業(yè)分工中處于中低端,大力推動(dòng)制造業(yè)大數據應用的發(fā)展,對產(chǎn)業(yè)升級轉型至關(guān)重要。

  當前,我國不同行業(yè)領(lǐng)域正在積極推進(jìn)數字化轉型、網(wǎng)絡(luò )化重構、智能化提升,推動(dòng)行業(yè)大數據應用,也是推進(jìn)數字中國建設的重要途徑和基礎。

  (二)建立系統全面的大數據治理體系

  大數據是數字經(jīng)濟的關(guān)鍵要素,強大的信息技術(shù)產(chǎn)業(yè)和全面深度信息化賦能的傳統行業(yè)無(wú)疑是數字經(jīng)濟的基礎!大數據治理須從營(yíng)造大數據產(chǎn)業(yè)發(fā)展環(huán)境的視角予以全面、系統化考慮!

  我以為,在一國之范圍內,大數據治理體系建設涉及國家、行業(yè)和組織三個(gè)層次,至少包含數據的資產(chǎn)地位確立、管理體制機制、共享與開(kāi)放、安全與隱私保護等四方面內容,需要從制度法規、標準規范、應用實(shí)踐和支撐技術(shù)等視角多管齊下,提供支撐。

  在國家層次,重點(diǎn)是要在法律法規層面明確數據的資產(chǎn)地位,奠定數據確權、流通、交易和保護的基礎,制定促進(jìn)數據共享開(kāi)放的政策法規和標準規范,促進(jìn)政務(wù)數據和行業(yè)數據的融合應用,并且出臺數據安全與隱私保護的法律法規,保障國家、組織和個(gè)人的數據安全。在行業(yè)層次,重點(diǎn)是要在國家相關(guān)法律法規框架下,充分考慮本行業(yè)中企業(yè)的共同利益與長(cháng)效發(fā)展,建立規范行業(yè)數據管理的組織機構和數據管控制度,制定行業(yè)內數據共享與開(kāi)放的規則和技術(shù)規范,促進(jìn)行業(yè)內數據的共享交換和融合應用。在組織層次,重點(diǎn)是要提升企業(yè)對數據全生命期的管理能力,促進(jìn)企業(yè)內部和企業(yè)間的數據流通,提升數據變現能力,保障企業(yè)自身的數據安全及客戶(hù)的數據安全和隱私信息。

  在數據治理體系建設中,數據共享開(kāi)放是大數據資源建設的前提,在現階段重要性尤其突出。在平衡數據共享開(kāi)放和隱私保護、數據安全的關(guān)系時(shí),我以為,還是需要強調應用先行、安全并重的原則。數據共享開(kāi)放不應被孤立看待,可能需要綜合考慮數據的使用場(chǎng)合及數據主體的權益。如,數據集中管理可能帶來(lái)保管上的安全問(wèn)題,然而數據融合才能產(chǎn)生價(jià)值,一定程度的集中是趨勢所在,也更利于建立更強大可靠的保護機制;多源數據的融合可能導致信息泄露,然而在確知風(fēng)險前,是否需要因其“可能性”而拒絕技術(shù)的應用?數據脫敏仍然可能存在隱私泄露的風(fēng)險,是否允許個(gè)體在知情前提下“用隱私換方便”、“用隱私換治療換健康”?是否允許使用符合當前“標準”、但無(wú)法確保未來(lái)一定不出現信息泄露的脫敏方法,并對相關(guān)應用予以免責?當然,加強兼顧隱私保護、數據安全和數據流動(dòng)利用的新技術(shù)研發(fā),也非常必要。當前,如安全多方計算、同態(tài)加密、聯(lián)邦學(xué)習等技術(shù)研發(fā),希望允許擁有數據的各方在不向其他組織或個(gè)人公開(kāi)數據中所含敏感信息的情況下,實(shí)現數據的融合利用。雖然這些技術(shù)尚處于發(fā)展的初級階段,但因其廣闊的應用前景而受到普遍關(guān)注。

  另外,打破信息孤島、盤(pán)活數據存量是當前一項緊迫的任務(wù),而在此過(guò)程中,不宜過(guò)分強調物理集中,而應將邏輯互聯(lián)作為打通信息“孤島”的手段,邏輯互聯(lián)先行,物理集中跟進(jìn)。在數據共享體系建設中,需要在一定層級上構建物理分散、邏輯統一、管控可信、標準一致的政務(wù)信息資源共享交換體系,在不改變現有信息系統與數據資源的所有權及管理格局的前提下,明晰責權利,即:數據應用部門(mén)提需求、數據擁有部門(mén)做響應、交換平臺管理部門(mén)保流轉。同時(shí),集約化的政務(wù)云建設正成為政府、企業(yè)建設新的信息系統的首選方案,如何在新一輪建設熱潮中,從規劃、立項審批、建設、審計等環(huán)節以及方案指導、標準規范和技術(shù)支持等方面給予全方位保障,盡可能避免新“孤島”的產(chǎn)生,也是一項重大挑戰。

 ?。ㄈ┮蚤_(kāi)源為基礎構建自主可控的大數據產(chǎn)業(yè)生態(tài)

  在大數據時(shí)代,軟件開(kāi)源和硬件開(kāi)放已成為不可逆的趨勢,掌控開(kāi)源生態(tài),已成為國際產(chǎn)業(yè)競爭的焦點(diǎn)。建議采用“參與融入、蓄勢引領(lǐng)”的開(kāi)源推進(jìn)策略,一方面鼓勵我國企業(yè)積極“參與融入”國際成熟的開(kāi)源社區,爭取話(huà)語(yǔ)權;另一方面,也要在建設基于中文的開(kāi)源社區方面加大投入,匯聚國內軟硬件資源和開(kāi)源人才,打造自主可控開(kāi)源生態(tài),在學(xué)習實(shí)踐中逐漸成長(cháng)壯大,伺機實(shí)現引領(lǐng)發(fā)展。中文開(kāi)源社區的建設,需要國家在開(kāi)源相關(guān)政策法規和開(kāi)源基金會(huì )制度建立方面給予支持。此外,在開(kāi)源背景下,對“自主可控”的內涵定義也有待更新,不一定強調硬件設計和軟件代碼的所有權,更多應體現在對硬件設計方案和軟件代碼的理解、掌握、改進(jìn)及應用能力。

 ?。ㄋ模┓e極推動(dòng)國際合作并籌劃布局跨國數據共享機制

  2018年11月17日,習近平總書(shū)記在A(yíng)PEC工商領(lǐng)導人峰會(huì )上發(fā)表主旨演講指出“經(jīng)濟全球化是人類(lèi)社會(huì )發(fā)展必經(jīng)之路”,“各國都是全球合作鏈條中的一環(huán)”。在數字經(jīng)濟快速發(fā)展的時(shí)代背景下,我國應該積極推動(dòng)在大數據技術(shù)和應用方面的國際合作,建立跨國數據共享機制,與其他國家一起分享數字經(jīng)濟的紅利,同時(shí)也使我國獲得更多發(fā)展機遇和更大發(fā)展空間,積極促進(jìn)數字經(jīng)濟下人類(lèi)利益共同體和命運共同體的構建。當前,我國正在積極推動(dòng)“一帶一路”合作發(fā)展。各國在合作的各個(gè)領(lǐng)域都將產(chǎn)生大量的數據。建議積極推進(jìn)跨國的大數據治理合作,在保障數據安全的前提下,促進(jìn)數據跨境流動(dòng),從而形成圍繞國家合作各個(gè)領(lǐng)域的大數據資源,為數字經(jīng)濟領(lǐng)域的國際合作奠定堅實(shí)的基礎?!耙粠б宦贰毖鼐€(xiàn)大都屬發(fā)展中國家,無(wú)論技術(shù)還是經(jīng)濟水平較之發(fā)達國家都有明顯差距。而數字經(jīng)濟這一新經(jīng)濟形態(tài)的成型發(fā)展將帶給包括中國在內的各發(fā)展中國家經(jīng)濟轉型發(fā)展的歷史性機遇期。經(jīng)濟后發(fā)國家有機會(huì )在新經(jīng)濟的全球壟斷性格局形成之前,與發(fā)達國家站在同一起跑線(xiàn)上,并且由于沒(méi)有“路徑依賴(lài)”所帶來(lái)的歷史包袱,也有可能在新一輪的競爭中占有優(yōu)勢。

 ?。ㄎ澹┪从昃I繆,防范大數據發(fā)展可能帶來(lái)的新風(fēng)險

  大數據發(fā)展可能導致一系列新的風(fēng)險。例如,數據壟斷可能導致數據“黑洞”現象。一些企業(yè)憑借先發(fā)展起來(lái)的行業(yè)優(yōu)勢,不斷獲取行業(yè)數據,但卻“有收無(wú)放”,呈現出數據壟斷的趨勢。這種數據壟斷不僅不利于行業(yè)的健康發(fā)展,而且有可能對國家安全帶來(lái)沖擊和影響。又如,數據和算法可能導致人們對其過(guò)分“依賴(lài)”及社會(huì )“被割裂”等倫理問(wèn)題。大數據分析算法根據各種數據推測用戶(hù)的偏好并推薦內容,在帶來(lái)便利的同時(shí),也導致人們只看到自己“希望看到的”信息,從而使人群被割裂為多個(gè)相互之間難以溝通、理解的群體,其可能引發(fā)的社會(huì )問(wèn)題將是難以“亡羊補牢”的。

  需要看到,以互聯(lián)網(wǎng)為代表的新一代信息技術(shù)所帶來(lái)的這場(chǎng)社會(huì )經(jīng)濟“革命”,在廣度、深度和速度上都將是空前的,也會(huì )是遠遠超出我們從工業(yè)社會(huì )獲得的常識和認知、遠遠超出我們的預期的,適應信息社會(huì )的個(gè)體素質(zhì)的養成、滿(mǎn)足未來(lái)各種新興業(yè)態(tài)就業(yè)需求的合格勞動(dòng)者的培養,將是我們面臨的巨大挑戰!唯有全民提升對大數據的正確認知,具備用大數據思維認識和解決問(wèn)題的基本素質(zhì)和能力,才有可能積極防范大數據帶來(lái)的新風(fēng)險;唯有加快培養適應未來(lái)需求的合格人才,才有可能在數字經(jīng)濟時(shí)代形成國家的綜合競爭力。

  我的匯報結束,謝謝大家!

 ?。ㄖ髦v人:梅宏,系中國人民解放軍軍事科學(xué)院副院長(cháng))  

  名詞解釋?zhuān)?/span>

  API:應用編程接口(Application Programming Interface)的首字母縮寫(xiě),是指某軟件系統或平臺為其他應用軟件系統提供的一組函數,通過(guò)調用這些函數,其他應用軟件系統可以使用此軟件系統或平臺的部分功能或訪(fǎng)問(wèn)某些數據。

  開(kāi)源平臺:“開(kāi)源”是開(kāi)放源代碼的簡(jiǎn)稱(chēng),開(kāi)源平臺是指支持開(kāi)源社區活動(dòng),管理開(kāi)放源代碼,向所有開(kāi)源社區參與者提供相關(guān)服務(wù)的軟件平臺(平臺基于互聯(lián)網(wǎng)構建并通過(guò)互聯(lián)網(wǎng)通過(guò)服務(wù))。任何人都可以獲得開(kāi)源軟件的源代碼并加以修改,并在某個(gè)預先約定的開(kāi)源協(xié)議限制范圍內發(fā)布修改后的新版本。結合上下文,這里的開(kāi)源平臺是指提供大數據管理、處理、分析等方面能力的開(kāi)源軟件的軟件平臺。

  可伸縮的計算體系結構:可伸縮英文為scalable,指一個(gè)計算系統的能力和性能隨應用負載的增加,通過(guò)極少的改動(dòng)或配置甚至只是簡(jiǎn)單的硬件資源增加,而保持線(xiàn)性增長(cháng)的能力,是表征計算系統處理能力的一個(gè)重要的設計指標??缮炜s的計算體系結構是計算系統體系結構設計追求的重要指標,軟件定義、虛擬化、資源池化等方法和技術(shù)常用于可伸縮性的實(shí)現。

  魯棒性:魯棒是英文Robust的音譯,也就是健壯的意思,因此魯棒性也被翻譯為健壯性。魯棒性一般用于描述一個(gè)系統在異?;驑O端情況下仍然可以工作的能力。結合上下文,這里談及的大數據分析模型的魯棒性是指在數據存在錯誤、噪音、缺失,甚至在惡意數據攻擊等異常情況下,模型仍然能得到較為準確結論的能力。

  數據互操作:數據互操作是指不同信息系統之間可以通過(guò)網(wǎng)絡(luò )連接對彼此的數據進(jìn)行訪(fǎng)問(wèn),包括對其他系統數據的讀取與寫(xiě)入。數據互操作是實(shí)現數據共享的基礎。

  “全數據”:“全數據”也稱(chēng)“全量數據”,是與“采樣數據”相對的概念。傳統的數據分析受限于數據采集、存儲、處理的成本,一般都僅對問(wèn)題相關(guān)的所有數據進(jìn)行局部采樣,并基于采樣獲得的部分數據進(jìn)行分析,得出結論,結論的準確性與采樣方法以及對被采樣數據的統計假設密切相關(guān)。而大數據時(shí)代,人們開(kāi)始提出“全數據”的概念,即,并不采樣,而是將與問(wèn)題相關(guān)的所有數據全部輸入到分析模型中分析。這種方法避免了因采樣而可能帶來(lái)的誤差,但是也增加了計算成本。

  云邊端融合:云是指云計算中心,邊是指邊緣計算設備,端是指終端設備。以智能家居為例,智能電視、冰箱、空調等直接與用戶(hù)交互的設備是“端”,通過(guò)互聯(lián)網(wǎng)連接的異地的云計算平臺是“云”,而安裝在每個(gè)家庭的智能家居中控服務(wù)器是“邊”。云計算中心具有強大的計算存儲能力,一般用于復雜的數據計算處理;終端設備距離最終用戶(hù)較近,對用戶(hù)的操作響應快,一般負責與用戶(hù)進(jìn)行交互;邊緣計算設備介于“云”和“端”之間,負責對端所采集的數據做本地化處理,同時(shí)將需要更強大計算能力支持的任務(wù)和數據發(fā)往云計算中心處理,并將“云”返回的結果提供給端設備。云邊端融合是一種“云”、“邊”、“端”不同計算設備各司其職,密切協(xié)同且優(yōu)勢互補的新型計算模式。

  寬帶、移動(dòng)、泛在的網(wǎng)絡(luò )通信:“寬帶”是指通信速率高,海量大數據的高速傳輸需求推動(dòng)骨干網(wǎng)絡(luò )向Pb/s發(fā)展;“移動(dòng)”是指移動(dòng)通信;“泛在”是指無(wú)所不在。寬帶、移動(dòng)、泛在通信是指:未來(lái)大量移動(dòng)終端和物聯(lián)網(wǎng)設備通過(guò)無(wú)所不在的接入網(wǎng)絡(luò )接入主干網(wǎng)并通過(guò)高速主干網(wǎng)絡(luò )進(jìn)行通信。

  安全多方計算:安全多方計算是為解決在保護隱私信息以及沒(méi)有可信第三方的前提下,一組互不信任的參與方之間的協(xié)同計算問(wèn)題而提出的理論框架。安全多方計算能夠同時(shí)確保輸入的隱私性和計算的正確性,在無(wú)可信第三方的前提下通過(guò)數學(xué)理論保證參與計算的各方成員輸入信息不暴露,且同時(shí)能夠獲得準確的運算結果。此項技術(shù)的研究尚處于初級階段。

  同態(tài)加密:同態(tài)加密是一種密碼學(xué)技術(shù),其核心在于保證:對經(jīng)過(guò)同態(tài)加密的數據進(jìn)行處理(如:運行某種數據分析算法)后得到輸出,將這一輸出進(jìn)行解密,其結果與用同一方法(即上述數據分析算法)處理未加密的原始數據得到的輸出結果一致。同態(tài)加密技術(shù)使得數據擁有者可以將數據加密后交給第三方處理,從第三方獲得處理結果后,對此結果進(jìn)行解密便可獲得所期望的結果。如此一來(lái),數據擁有者就不必擔心因將原始數據交給第三方而存在的隱私泄露風(fēng)險,同時(shí)又能獲得第三方提供的數據分析服務(wù)。此項技術(shù)的研究尚處于初級階段。

  聯(lián)邦學(xué)習:聯(lián)邦機器學(xué)習是一個(gè)多組織協(xié)同的機器學(xué)習框架,使得一個(gè)組織在不共享原始數據的情況下,可以利用其他組織數據中所蘊含的信息和知識,建立協(xié)同的機器學(xué)習模型。此模型比各組織僅利用本組織內部數據而訓練的機器學(xué)習模型有更高的性能。此項技術(shù)的研究尚處于初級階段。

  ZB、EB、Pb/s、Gb/s:在計算機領(lǐng)域,一個(gè)二進(jìn)制位稱(chēng)為一個(gè)比特,一般用小寫(xiě)b表示;而8個(gè)二進(jìn)制位稱(chēng)一個(gè)字節,用大寫(xiě)B表示。簡(jiǎn)言之:1B=8b。計算數據量或數據所需存儲空間大小時(shí),習慣用字節為單位(用B表示)。1KB=1024B,1MB=1024KB,1GB=1024MB(通常簡(jiǎn)記為109),1TB=1024GB,1PB=1024TB,1EB=1024PB,1ZB=1024EB。1EB約等于10億GB,而1ZB約等于1萬(wàn)億GB。假設一首長(cháng)為3分鐘的歌曲錄制成MP3文件(44K/320kbps音質(zhì)),大小約為8MB,那么1ZB的數據存儲空間可存儲MP3格式歌曲140萬(wàn)億多首,如果全部聽(tīng)一遍,需要8億多年。計算網(wǎng)絡(luò )傳輸速率時(shí)習慣上用比特每秒為單位(用b/s表示)。1Pb/S和1Gb/S分別代表1秒鐘傳輸的數據是1P(1000萬(wàn)億)個(gè)比特和1G(10億)個(gè)比特。網(wǎng)絡(luò )速率1Gb/S(此處是小寫(xiě)b)的情況下,下載一個(gè)2GB(此處是大寫(xiě)B)的電影,需要16秒;而網(wǎng)絡(luò )速率1Pb/S的情況下,僅需要0.016毫秒。

注:本文轉載自中國人大網(wǎng),轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責。如有侵權行為,請聯(lián)系我們,我們會(huì )及時(shí)刪除。
上一篇《中國地理信息產(chǎn)業(yè)報告》顯示,預計今年總產(chǎn)值達4360億元
下一篇生態(tài)環(huán)境部已完成環(huán)渤海入海排污口兩級排查

相關(guān)文章

二維碼