數(shù)據(jù)的經(jīng)濟學(xué)分析:要素、產(chǎn)業(yè)和市場
文/江小涓
中國社會科學(xué)院大學(xué)教授、國務(wù)院原副秘書長
去年以來,數(shù)據(jù)是一個很熱的熱點,從經(jīng)濟學(xué)的角度需要一個很好的分析框架,因為經(jīng)濟學(xué)中的生產(chǎn)要素分析是一個非常成熟的體系。我們現(xiàn)在把數(shù)據(jù)當(dāng)成生產(chǎn)要素,這對經(jīng)濟學(xué)界的理論提出了很大的挑戰(zhàn),我們來探討研究什么問題,才能稱之為學(xué)術(shù)研究。中國是首個把數(shù)據(jù)作為生產(chǎn)要素的國家,這在國際上是沒有先例的。作為一種生產(chǎn)要素,確權(quán)、交易、收益等概念需要納入分析框架中;作為一個產(chǎn)業(yè),產(chǎn)業(yè)組織、生產(chǎn)消費、價格形成等概念需要納入分析框架中;作為一個市場,創(chuàng)新、競爭、公共品等概念需要納入分析框架中。考慮到數(shù)據(jù)的特點,還需要在分析中擴展框架和增加維度。并且,研究方向要呼應(yīng)經(jīng)濟學(xué)的宗旨:研究社會資源配置的總體效率并盡可能合理分配??傊畬W(xué)術(shù)研究應(yīng)該致力于知識體系的構(gòu)建和完善。當(dāng)下關(guān)于數(shù)據(jù)要素市場的研究,比較集中在數(shù)據(jù)確權(quán)、定價、交易等領(lǐng)域,希望學(xué)術(shù)界整體在數(shù)據(jù)研究方面繼續(xù)加強學(xué)術(shù)含量高的研究,來促進(jìn)理論發(fā)展,服務(wù)實踐,促進(jìn)國際交流,這是過去一年多我在參與數(shù)據(jù)問題時非常深切的體會。從經(jīng)濟學(xué)視角思考,數(shù)據(jù)研究涉及非常多的學(xué)術(shù)問題:數(shù)據(jù)作為要素,配置效率怎么樣,比如確權(quán)、交易和收益的制度安排,最終希望配置的效率最高;數(shù)據(jù)作為產(chǎn)業(yè),需要研究具體經(jīng)濟主體的行為及其市場影響,例如消費者和生產(chǎn)者行為、均衡價格、創(chuàng)新行為等;數(shù)據(jù)作為市場,要研究數(shù)據(jù)市場的規(guī)則、行為和結(jié)構(gòu),特別是AI出現(xiàn)以后的巨型企業(yè),對競爭規(guī)則、壟斷的判定,政府的規(guī)制該怎么做,是非常具有挑戰(zhàn)的問題;數(shù)據(jù)作為半公共品,公共利益和市場效益如何權(quán)衡,政府供給和市場供給的組合怎么判斷。
接下來舉例來講,數(shù)據(jù)要素我以確權(quán)、流通和收益為例,數(shù)據(jù)產(chǎn)業(yè)我用創(chuàng)新范式的改變作為例子,數(shù)據(jù)市場我們用規(guī)模遞增下的競爭和壟斷作為例子,公共數(shù)據(jù)以免費開發(fā)和收費開發(fā)的平衡作例子。
關(guān)于數(shù)據(jù)要素
數(shù)據(jù)是一個生產(chǎn)要素,又是一個非常特別的要素,面臨的理論挑戰(zhàn)非常多。數(shù)據(jù)的獨特性質(zhì)主要體現(xiàn)在以下幾個方面:首先是多主體生產(chǎn)因而確權(quán)困難,數(shù)據(jù)的生成過程錯綜復(fù)雜,常常是多方主體相互協(xié)作的結(jié)果,包含了不同主體不同程度的投入和貢獻(xiàn),因此確權(quán)困難。其次是多場景復(fù)用方便,一組數(shù)據(jù)可以被不同主體以不同方式重復(fù)利用,在使用上不具有競爭性和排他性,不易清晰明確主張權(quán)力。第三是數(shù)據(jù)中的敏感信息多,許多數(shù)據(jù)的內(nèi)容多層次多元化,可能承載了需要保護的個人信息和商業(yè)機密,即使匿名化和去標(biāo)識化,也有可能被挖掘出來。第四是減損貶值快,絕大部分?jǐn)?shù)據(jù)的價值在于實時性,有研究表明一年期以上的數(shù)據(jù)貶值達(dá)到 98% 以上,保值增值十分困難。各位想想,你經(jīng)常點什么外賣,搜索過什么類型的服務(wù)、APP 就會推薦推送給你相關(guān)的內(nèi)容,這都是從即時數(shù)據(jù)中挖掘到的,幾個月后可能你的口味發(fā)生了變化,按照現(xiàn)在數(shù)據(jù)推送就沒有意義。第五是具有交易和交互兩類流通方式,特別是交互型流動即數(shù)據(jù)在不同主體間的非交易型流通使用,與其他生產(chǎn)要素流通使用的形態(tài)相比有顯著不同。這個是我們后面要分析的重點問題??紤]到上述問題,在“數(shù)據(jù)二十條”的起草制定中,針對數(shù)據(jù)要素這些與其他生產(chǎn)要素不同的特點,文件的重點是構(gòu)建起主要架構(gòu),即所謂的“四梁八柱”,許多更具體的內(nèi)容都需要不斷探索發(fā)展,并從社會有較多共識、實踐有迫切需求、符合數(shù)據(jù)要素特征、與理論體系有較好契合性這些角度排出工作的重點。例如,在起步階段不回避“所有權(quán)”,但更強調(diào)持有權(quán)、使用權(quán)、經(jīng)營權(quán),讓數(shù)據(jù)先動起來用起來,就是現(xiàn)階段中國特色數(shù)據(jù)產(chǎn)權(quán)制度的一個鮮明特點。再如,處理好場內(nèi)交易和場外交易的關(guān)系也是現(xiàn)實針對性很強的問題。從實踐看,數(shù)據(jù)流通使用既有通過數(shù)據(jù)交易所完成的“場內(nèi)交易”,也有企業(yè)與企業(yè)之間直接發(fā)生“場外交易”,更有規(guī)模巨大的非交易型的數(shù)據(jù)交互。因此“數(shù)據(jù)二十條”并未強調(diào)以哪種流通方式為主,而是提出場內(nèi)交易與場外交易相結(jié)合,不斷探索創(chuàng)新。在公共數(shù)據(jù)開放共享和開發(fā)利用、構(gòu)建安全貫穿數(shù)據(jù)治理全過程的安全治理模式等方面,也都從理論與實踐的結(jié)合出發(fā),既提出長遠(yuǎn)發(fā)展方向,也明確當(dāng)下工作重點。理解了數(shù)據(jù)要素的特點,就能理解一年多來數(shù)據(jù)要素市場發(fā)展中的困難與問題。數(shù)據(jù)要素交易所在“數(shù)據(jù)二十條”出臺前后特別是以后快速增長,但大體上是一個有市無價,或者有市有價無交易的情況,這在其他要素市場上很難看到。各地數(shù)據(jù)交易所發(fā)展很快,到 2023 年 10 月已經(jīng)超過 48 家。每個交易所都有成千上萬家的數(shù)據(jù)服務(wù)商,也有些入場準(zhǔn)備參與確權(quán)交易的數(shù)據(jù)供應(yīng)方。但一年多下來(有些起步早的交易所嘗試時間更長,有些已有十年之久)數(shù)據(jù)交易量非常少,整體上仍在嘗試性起步階段。其實許多數(shù)據(jù)持有者都明白,數(shù)據(jù)交易很不容易,那他們?yōu)槭裁捶e極“入場”呢?企業(yè)期待數(shù)據(jù)入表,將數(shù)據(jù)資產(chǎn)化,進(jìn)而能夠去做金融創(chuàng)新、融資擔(dān)?;蛸Y產(chǎn)證券化等。下圖是各個數(shù)據(jù)交易所表達(dá)自己平臺能夠做什么的邏輯:做數(shù)據(jù)資產(chǎn)登記、數(shù)據(jù)資產(chǎn)評估;然后發(fā)放數(shù)據(jù)資產(chǎn)憑證,進(jìn)而入表;入表后的主線是去做金融創(chuàng)新、融資貸款等,其次是進(jìn)行數(shù)據(jù)資產(chǎn)的交易。我和銀行開玩笑,說“數(shù)據(jù)要素市場建設(shè)發(fā)展的接力棒交到了金融領(lǐng)域,你們遲遲不接棒”。金融業(yè)不敢往下做的原因之一,就是認(rèn)為數(shù)據(jù)資產(chǎn)定價、交易方式特別是易貶損特點帶來的挑戰(zhàn)和風(fēng)險都是新問題,需要積極而謹(jǐn)慎,發(fā)展與安全并重。不過,雖然我們將數(shù)據(jù)納入傳統(tǒng)生產(chǎn)要素分析框架中有困難,但這是一個新事物,需要留給創(chuàng)新足夠的時間和空間。而且我們不一定要將其“裝”進(jìn)我們熟悉的體系構(gòu)建中間去,要允許探索。但從學(xué)術(shù)理論角度看,總要構(gòu)建一個學(xué)術(shù)體系出來,這是一個非常有創(chuàng)新意義也有挑戰(zhàn)的領(lǐng)域。
關(guān)于數(shù)據(jù)產(chǎn)業(yè)
數(shù)據(jù)產(chǎn)業(yè)鏈條中,各環(huán)節(jié)參與方的行為和以往不一樣,這個方面要研究的新問題很多。因為最近我在做一項數(shù)字時代創(chuàng)新問題研究,就拿它舉例?,F(xiàn)在數(shù)據(jù)創(chuàng)新范式按照國內(nèi)外的很多學(xué)者來說,進(jìn)入了“數(shù)據(jù)密集型”的科研創(chuàng)新范式。我們能看到除了數(shù)字行業(yè)自身以外,生物醫(yī)學(xué)、高能物理、地球科學(xué)、海洋科學(xué)很多都是以信息科學(xué)為支撐的基礎(chǔ)研究領(lǐng)域,如果數(shù)據(jù)觀測處理能力不高,它們的進(jìn)展是非常困難的。生命科學(xué)中,蛋白質(zhì)怎么預(yù)測出來,不是生命科學(xué)自身的原創(chuàng)性發(fā)現(xiàn),而是數(shù)字技術(shù)應(yīng)用帶來的結(jié)果,其中的原理早就知道,但就是算不出來?,F(xiàn)在,世界進(jìn)入數(shù)字時代,數(shù)字技術(shù)迅速發(fā)展和海量數(shù)據(jù)的產(chǎn)生不僅顯著影響經(jīng)濟社會運行方式,而且推動著科研范式的深刻變革。這種變革不是原來創(chuàng)新范式內(nèi)部因素和結(jié)構(gòu)的調(diào)整,而是“數(shù)據(jù)”這個新要素和數(shù)據(jù)復(fù)雜交互形成的“數(shù)據(jù)關(guān)系”這些新變量加入所引發(fā)的創(chuàng)新要素、創(chuàng)新主體和創(chuàng)新組織的深刻變革。
我們現(xiàn)在講到數(shù)據(jù)和數(shù)據(jù)關(guān)系,不光是數(shù)據(jù)量多少,主要是數(shù)據(jù)關(guān)系影響了創(chuàng)新的重要維度。我們現(xiàn)在 AI 發(fā)展相對滯后有很多原因,能夠共享的信息的數(shù)量和質(zhì)量比較差,是影響下一步人工智能非常重要的因素。數(shù)據(jù)和算力決定誰來創(chuàng)新,包括很重要的原始創(chuàng)新。大模型的訓(xùn)練和調(diào)整需要極其巨大的數(shù)據(jù)、算力和算法的投入,Transformer 架構(gòu)進(jìn)入主流以后,AI 算力每兩年增長 275 倍,在計算機本身有革命性的變革之前,只能靠擴量來增強算法的能力,所以目前只有大科技企業(yè)有雄厚的財力足以吸引大批頂尖的 AI 人才,從而以算力、算法和數(shù)據(jù)的最佳結(jié)合來推動人工智能前沿的突破,這就是最領(lǐng)先的 AI 大模型的變化。
如下圖,2014 年是一個轉(zhuǎn)折點,AI 系統(tǒng)不是高校研發(fā)后的產(chǎn)業(yè)轉(zhuǎn)化,而是從最基本的數(shù)學(xué)算法開始,都由產(chǎn)業(yè)界來做,2023 年 32 個重要的機器學(xué)習(xí)模型都誕生在產(chǎn)業(yè)界。我們現(xiàn)在也經(jīng)常講國家創(chuàng)新體系,集中力量辦大事,這方面也要考慮到數(shù)字時代的這種產(chǎn)業(yè)創(chuàng)新范式變革。這種海量的算力、數(shù)據(jù)以及人才迅速決策的能力、技術(shù)迭代的速度,完全是另外一種創(chuàng)新的組織架構(gòu),其中的變化是非常重要的。
關(guān)于數(shù)據(jù)市場
看待數(shù)據(jù)市場,需要研究市場的規(guī)則、行為和結(jié)構(gòu),特別是 AI 出現(xiàn)以后的“小規(guī)模企業(yè)+巨大市場”是非常具有挑戰(zhàn)的問題,對規(guī)模遞增下的競爭和壟斷的分析也是我們的一個困惑。我們不能簡單地認(rèn)為市場從長期看會解決這個問題的,然后完全交給市場去處理。規(guī)模遞增并不是數(shù)據(jù)市場的獨有特點,軟件業(yè)也有這個特點,但開源模式限制了規(guī)模遞增導(dǎo)致的大者愈大,因此壟斷問題沒有走向極端。雖然領(lǐng)先者有規(guī)模遞增的能力,但是開源之后,更多的開發(fā)者和應(yīng)用市場出現(xiàn),目前沒有導(dǎo)致規(guī)模遞增一定會致使大者越大、強者越強的局面出現(xiàn)。
對于大模型,我們能期待這個趨勢出現(xiàn)嗎?仍是未知。如果理論不能有預(yù)測性的話,就沒有價值。現(xiàn)在我們的知識能夠想到 OpenAI 在 AI 時代,其產(chǎn)業(yè)組織、競爭壟斷的格局最后會不會避免走向極端?也是未知。所以這個問題對我們是一個很大的新挑戰(zhàn)。
關(guān)于公共數(shù)據(jù)
公共數(shù)據(jù)的性質(zhì)有很多討論,有觀點認(rèn)為數(shù)據(jù)本身具有公共品性質(zhì),公共數(shù)據(jù)又是政府掌握的數(shù)據(jù),應(yīng)該對社會開放。公共數(shù)據(jù)對公眾開放是國際共識。開放數(shù)據(jù)的定義是“公眾可獲取的、能夠被用戶完整觀測和使用的數(shù)據(jù)”。2009 年,美國的奧巴馬政府頒布了《開放政府指令》(US Open Government Directive);2018 年 12 月 24 日,美國國會通過《開放政府?dāng)?shù)據(jù)法案》,要求聯(lián)邦機構(gòu)必須以“機器可讀”格式,即以方便公眾在智能手機或電腦上閱讀的數(shù)據(jù)格式,發(fā)布任何不涉及公眾隱私或國家安全的“非敏感”信息。例如,紐約市的政府及分支機構(gòu)所擁有的數(shù)據(jù)必須對公眾實施開放,市民們使用這些信息不需要經(jīng)過任何注冊、審批的繁瑣程序,使用數(shù)據(jù)也不受限制。2011 年,巴西、印尼、墨西哥、挪威、南非、菲律賓、英國和美國簽署了《開放數(shù)據(jù)聲明》,公共數(shù)據(jù)開放也是 2011 年成立的“開放政府合作伙伴”。迄今為止,全球已經(jīng)有 75 個國家加入這一計劃。國內(nèi)政府?dāng)?shù)據(jù)開放發(fā)展至今,發(fā)展和應(yīng)用最好的主要還是地理位置信息的開放、公共設(shè)施的數(shù)據(jù)開放(圖書館、教育機構(gòu)、公共wifi等)、涉及健康安全的數(shù)據(jù)開放(比如河流洪水水位、交通擁堵狀況、空氣指數(shù)等)、市場監(jiān)管數(shù)據(jù)開放(企業(yè)信息查詢、行政處罰查詢等)。這些信息現(xiàn)已可以通過多種途徑獲得。政府?dāng)?shù)據(jù)開放意義重大,但多年下來動力不夠是普遍問題。作為數(shù)據(jù)提供者的政府機構(gòu)并不能從中直接得到經(jīng)濟回報,相反承擔(dān)著泄露商業(yè)秘密和個人隱私的巨大風(fēng)險,即便對數(shù)據(jù)采取“脫敏”處理也無法完全消除隱患。從道理上看,允許對數(shù)據(jù)開放并有一些收費也有合理性,例如有些原始數(shù)據(jù)不能直接開放共享,要做成數(shù)據(jù)產(chǎn)品;再如有些公共數(shù)據(jù)并不被廣大公民和市場主體所需要,是某些企業(yè)的運營需要。公共品是為廣大公民和市場主體服務(wù)的,對少數(shù)人服務(wù)“用者付費”這是公共品的基本原則。今后,要尋求免費開放(開放共享)與收費開放(開發(fā)利用)的平衡。“數(shù)據(jù)二十條”里的提法是:“推動用于公共治理、公益事業(yè)的公共數(shù)據(jù)有條件無償使用,探索用于產(chǎn)業(yè)發(fā)展、行業(yè)發(fā)展的公共數(shù)據(jù)有條件有償使用”。目前看,對公共數(shù)據(jù)有償開發(fā)開了一個口子以后,政府和相關(guān)公共企事業(yè)單位動力更強勁,行動更迅速。各地政府紛紛成立國有數(shù)據(jù)運營公司開展政府?dāng)?shù)據(jù)的授權(quán)運營,還可以搞二級合作商,獲取合理的收入,這是一個非常普遍的趨勢。政府大規(guī)模出售公共數(shù)據(jù),公共品性質(zhì)的數(shù)據(jù)轉(zhuǎn)化為商業(yè)化數(shù)據(jù),需要學(xué)術(shù)理論給予分析和解釋,至少對公共品理論的發(fā)展提出了要求??偟膩碇v,中國是一個數(shù)據(jù)生產(chǎn)大國和使用大國,我們是首先提出數(shù)據(jù)要素概念的國家,其中的實踐探索多元而豐富,期待學(xué)術(shù)界同仁共同努力,構(gòu)建符合學(xué)術(shù)理論規(guī)范、包含數(shù)據(jù)實踐主要問題、體現(xiàn)中國數(shù)據(jù)發(fā)展特色的學(xué)術(shù)體系。文章來源:清華大學(xué)互聯(lián)網(wǎng)產(chǎn)業(yè)研究院