隨著5G、語言智能和物聯(lián)網(wǎng)的快速發(fā)展,人類社會正在發(fā)生劃時代的變化。人類的認識也應(yīng)隨著時代進步而不斷更新,重新審視已然,及時預(yù)判將然。語言究竟是一種什么現(xiàn)象?語言學(xué)究竟如何發(fā)展?就是需要審視、需要預(yù)判的。

  1. 語言數(shù)據(jù)是生產(chǎn)要素

  生產(chǎn)要素與生產(chǎn)力發(fā)展水平和經(jīng)濟制度密切相關(guān)。數(shù)據(jù)具有生產(chǎn)要素性質(zhì),只有信息化發(fā)展到一定階段才能成為現(xiàn)實,才能被人認識。

  早在2017年12月8日,習(xí)近平總書記就提出“要構(gòu)建以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟”。之后,在2018年4月“首屆數(shù)字中國建設(shè)峰會”(福州)、2018年5月中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會、2018年9月江蘇互聯(lián)網(wǎng)大會,以及2019年12月第六屆中國國際大數(shù)據(jù)大會上,都突出了“數(shù)據(jù)是數(shù)字經(jīng)濟關(guān)鍵要素”的話題。特別是在2018江蘇互聯(lián)網(wǎng)大會上,工業(yè)和信息化部總經(jīng)濟師王新哲強調(diào),“以數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素的數(shù)字經(jīng)濟正在成為繼農(nóng)業(yè)經(jīng)濟、工業(yè)經(jīng)濟之后的新型經(jīng)濟形態(tài)”。至此,人們獲得了兩個基本認識:1.數(shù)字經(jīng)濟是繼農(nóng)業(yè)經(jīng)濟、工業(yè)經(jīng)濟之后的新型經(jīng)濟形態(tài);2.數(shù)字經(jīng)濟的關(guān)鍵生產(chǎn)要素是數(shù)據(jù)。

  黨的十九屆四中全會提出,“健全勞動、資本、土地、知識、技術(shù)、管理、數(shù)據(jù)等生產(chǎn)要素由市場評價貢獻、按貢獻決定報酬的機制。”這是對數(shù)據(jù)具有生產(chǎn)要素性質(zhì)這一認識的總結(jié),把數(shù)據(jù)與勞動、資本、土地、知識、技術(shù)、管理并列為第七大生產(chǎn)要素,可以通過市場按貢獻取酬。這是重大的理論創(chuàng)新,體現(xiàn)著對信息化社會的本質(zhì)認識,是在數(shù)字經(jīng)濟快速發(fā)展背景下經(jīng)濟制度的與時俱進。

  一般認為,數(shù)據(jù)是信息的表現(xiàn)形式和載體。隨著科技與社會的進步,數(shù)據(jù)的內(nèi)涵和外延都可能會發(fā)生變化。但有一點現(xiàn)在是可以肯定的,那就是多數(shù)數(shù)據(jù)都是“語言數(shù)據(jù)”。其一,語言(包括文字)是人類信息最為重要的載體,大約80%的信息是用語言負載的。沒有用語言負載的信息,也常常需要語言來幫助闡釋,比如圖畫、雕塑、音樂、服裝、建筑等藝術(shù)。其二,語言資源本身也是語言數(shù)據(jù)。語言數(shù)據(jù)是最為重要的數(shù)據(jù),應(yīng)當屬于“生產(chǎn)要素”范疇。

  語言數(shù)據(jù)是信息時代的生產(chǎn)要素,如同土地之于農(nóng)民,機器之于工人,計算機通過對語言數(shù)據(jù)的加工學(xué)習(xí)可以獲得知識與智能,從而去創(chuàng)造人類的新生活。隨著語言智能的發(fā)展,語言數(shù)據(jù)的生產(chǎn)要素屬性定會越來越清晰。

  2.語言數(shù)據(jù)納入數(shù)字經(jīng)濟視野

  20世紀50年代,人類就開始進行機器翻譯的嘗試,訓(xùn)練機器進行語言信息處理的進程由此開始。中文信息處理經(jīng)過字處理、詞處理階段的艱難行進,已順利步入話語處理階段,努力讓計算機具有語言智能。信息檢索、自動翻譯、機器寫作、人機對話等領(lǐng)域的快速進展,得益于語言大數(shù)據(jù)的集聚與應(yīng)用。

  語言是人類獨有的符號系統(tǒng),這是語言學(xué)的經(jīng)典認識。但是隨著語言智能的發(fā)展,語言將為人類和機器這兩個“物種”共同享有。如今重要的語言交際,多數(shù)都是“人-機-機-人”的交際,是“人-機”“機-機”“機-人”的合成,疫情期間的云端會議、線上課程、網(wǎng)絡(luò)購物、網(wǎng)上就醫(yī)等,都屬于這種交際模式。如果與“人形機器人”對話,機器擁有語言這一現(xiàn)象,就會看得更為明顯。隨著物聯(lián)網(wǎng)的發(fā)展,只要在需要驅(qū)動的目的物上植入“語言感應(yīng)器”,人就可以通過具有語言智能的機器與萬物關(guān)聯(lián),與萬物對話,使萬物具有“語言智能”。

  2018年12月召開的中央經(jīng)濟工作會議重新定義了基礎(chǔ)設(shè)施建設(shè),把5G、人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)定義為“新型基礎(chǔ)設(shè)施建設(shè)”,簡稱“新基建”。一年多來,新基建的內(nèi)容不斷豐富,面貌逐漸清晰。新基建不僅是信息網(wǎng)絡(luò)等的基礎(chǔ)設(shè)施建設(shè),還讓基建物具有“智能”,特別是語言智能,以便實現(xiàn)人與萬物的關(guān)聯(lián)對話。

  與信息相關(guān)的產(chǎn)業(yè),有許多是語言產(chǎn)業(yè)。在較高的工業(yè)化時代,據(jù)瑞士語言經(jīng)濟學(xué)家的研究,語言產(chǎn)業(yè)為社會GDP的貢獻接近10%。信息化時代,數(shù)據(jù)可以成為生產(chǎn)要素的時代,語言產(chǎn)業(yè)的經(jīng)濟能量會大幅提升,可以預(yù)測,沒有語言產(chǎn)業(yè)的繁榮,發(fā)展不出繁榮的數(shù)字經(jīng)濟。

  未來,也許是不久的未來,語言數(shù)據(jù)將成為重要的生產(chǎn)要素,語言將進入重要的生產(chǎn)力范疇。集聚、管理語言數(shù)據(jù)并使其發(fā)揮最大作用,將成為發(fā)展生產(chǎn)的重要任務(wù),語言產(chǎn)業(yè)、語言職業(yè)將成為數(shù)字經(jīng)濟的一方重要支柱。

  3. 語言與物理、社會、信息“三元空間”

  人類形成之前,世界就是自然界,只是一個“物理空間”。人類的形成與發(fā)展,便在物理空間中生長出一個“社會空間”。語言與社會空間一起成長,大約距今3到5萬年前的舊石器時代,人類已有較成熟的口頭語言,口語的載體是聲波。大約距今5000至5500年前,文字在兩河流域產(chǎn)生,語言有了新載體光波。20世紀20年代,廣播、電視相繼出現(xiàn),有聲媒體使語言有了第三大載體電波。20世紀末,互聯(lián)網(wǎng)商業(yè)化,語言信息處理也快速進步,人類開始建構(gòu)一個新空間——“信息空間”,也就是常說的“虛擬空間”“網(wǎng)絡(luò)空間”。潘云鶴院士2019年在題為《人工智能2.0與數(shù)字經(jīng)濟》的報告中,敏銳指出人類正由傳統(tǒng)的“物理空間”“人類社會”二元空間,逐步進入了“物理空間”“人類社會”“信息空間”所構(gòu)成的三元空間。

  信息空間是一個正在發(fā)展的空間,其結(jié)構(gòu)和運行機理還在被逐步認識、逐漸完善中。但有一點相對明確,那就是信息空間主要是被數(shù)字化了的語言空間。語言過去是在社會空間中使用,如今是在社會空間、信息空間這兩個空間中使用。隨著物聯(lián)網(wǎng)、語言智能的發(fā)展和智能化新基建的實施,語言將跨入物理空間,在人類的三元空間中運用。語言在人類生產(chǎn)活動的作用將更為顯著。

  語言已經(jīng)不僅僅是人文現(xiàn)象,它是“具有聲光電三大媒介、為人類與機器兩個‘物種’共享、將應(yīng)用在社會、信息、物理三元空間中”的事物。語言學(xué)作為“研究語言及其相關(guān)問題”的科學(xué),也不能局限于“語言文學(xué)”,而應(yīng)當是橫跨文理工的綜合學(xué)科。

  2017年10月,美國希拉姆學(xué)院提出“新文科”的教育理念,對其29個專業(yè)重組,把新技術(shù)融入哲學(xué)、文學(xué)、語言等課程中。這反映了學(xué)科交叉融合的時代大趨勢。我國也在積極推進“新工科、新醫(yī)科、新農(nóng)科、新文科”建設(shè)。根據(jù)語言的性質(zhì),就應(yīng)當依照“新文科”的思路發(fā)展語言學(xué)。綜合、交叉、融入新技術(shù)的語言學(xué),才能夠適應(yīng)“數(shù)據(jù)是數(shù)字經(jīng)濟的關(guān)鍵生產(chǎn)要素”的時代命題和經(jīng)濟制度,促進知識經(jīng)濟的發(fā)展,推進智能化新基建的發(fā)展。當然,新基建和知識經(jīng)濟的謀劃者,也應(yīng)當充分重視語言和語言學(xué),獲取語言學(xué)的科學(xué)紅利。