習(xí)近平總書記在文化傳承發(fā)展座談會上強調(diào):“只有全面深入了解中華文明的歷史,才能更有效地推動中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展,更有力地推進(jìn)中國特色社會主義文化建設(shè),建設(shè)中華民族現(xiàn)代文明。”這一重要論述意蘊深遠(yuǎn),內(nèi)涵深刻。
要想全面深入了解中華文明的歷史,20萬種傳世古籍是一筆寶貴的財富。它們是源遠(yuǎn)流長、博大精深的中華文明信息與中國文化基因的載體,是中華民族思想的表達(dá)、精神的追求、智慧的結(jié)晶。傳世古籍這筆財富要利用好,首先要研究好;要研究好,首先要整理、保護(hù)和傳承好。我國古籍整理的歷史與古籍一樣悠久,孔子就整理過六經(jīng),人們稱他為思想家、教育家,也稱他為文獻(xiàn)學(xué)家。兩千多年來,古籍的整理和研究不僅是歷代學(xué)人孜孜矻矻的名山事業(yè),也是中華優(yōu)秀傳統(tǒng)文化傳承和傳播的前提與基礎(chǔ)。
黨中央歷來重視古籍的整理與傳承,早在1981年,就以中共中央文件的名義下發(fā)過《關(guān)于整理我國古籍的指示》。習(xí)近平總書記在此次座談會前,也專程前往中國國家版本館中央總館考察,并指示要千方百計保護(hù)好留存下來的這些瑰寶,將古籍整理和傳承的重要性提到“把我們這個世界上唯一沒有中斷的文明繼續(xù)傳承下去”的位置。
計算機科學(xué)的發(fā)展使得大數(shù)據(jù)時代不期而至,針對古籍工作,黨和國家從時代發(fā)展和文化建設(shè)需要出發(fā),及時頒布了相關(guān)的政策和文件。2022年4月,中共中央辦公廳、國務(wù)院辦公廳印發(fā)《關(guān)于推進(jìn)新時代古籍工作的意見》,明確提出“推進(jìn)古籍?dāng)?shù)字化”。
中國古籍?dāng)?shù)字化已有至少40年的歷史,但相對于20萬種古籍來說,得到數(shù)字化的尚屬很小一部分,《意見》提出“建立健全國家古籍?dāng)?shù)字化工作指導(dǎo)協(xié)調(diào)機制,統(tǒng)籌實施國家古籍?dāng)?shù)字化工程”,正當(dāng)其時,非常重要。
但更重要的是,技術(shù)的發(fā)展倒逼著我們提出更高和更激蕩人心的目標(biāo)。隨著計算機深度學(xué)習(xí)能力、文本挖掘等大數(shù)據(jù)技術(shù)和人工智能的快速發(fā)展,古籍在繼續(xù)數(shù)字化的同時,應(yīng)該開始向知識化轉(zhuǎn)變。“積極開展古籍文本結(jié)構(gòu)化、知識體系化、利用智能化的研究和實踐,加速推動古籍整理利用轉(zhuǎn)型升級”,《意見》中的這段表述,充分體現(xiàn)了國家對于古籍?dāng)?shù)字化領(lǐng)域發(fā)展前沿的深刻把握,對于利用現(xiàn)代科技手段促進(jìn)古籍整理與研究的高度關(guān)切,具有重要的前瞻性和方向性,更值得重視。
數(shù)字化和知識化的最大區(qū)別,就是前者僅可提供簡單的字符串檢索,后者是基于所有存世古籍的關(guān)系性、結(jié)構(gòu)化、知識再生型的超大數(shù)據(jù)庫,簡單地講,就是使用大數(shù)據(jù)、人工智能、自然語言處理等相應(yīng)技術(shù)手段,開發(fā)適合不同古籍類型的文本分析模型和工具,借助過往一切古典學(xué)的研究成果,周密地設(shè)定主題詞表,專業(yè)地提取各種實體,多維度地構(gòu)建不同實體間的關(guān)系,對文獻(xiàn)進(jìn)行深層組織和知識管理,形成體系化的“中國古典知識庫”。這是一個基于全部存世古籍、關(guān)乎中國古典知識整體的宏大構(gòu)想,它的建設(shè),意義重大。
首先,將促進(jìn)古籍整理和利用的轉(zhuǎn)型升級。大數(shù)據(jù)技術(shù)帶來文獻(xiàn)生產(chǎn)方式的創(chuàng)革、文本形態(tài)的新變和文獻(xiàn)獲取方式的拓展,使得抄印本和電子化時代被日漸窮盡的文獻(xiàn),因為數(shù)據(jù)化、知識化而重新變得不可窮盡。同時,將以往被分裂和隔絕的事物重新連接,可以最大程度地促進(jìn)文獻(xiàn)的關(guān)聯(lián)與知識的發(fā)現(xiàn),改變我們對文獻(xiàn)、知識的認(rèn)識路徑和把握尺度,催生一種新型的文獻(xiàn)學(xué)。
其次,將促進(jìn)學(xué)術(shù)研究、知識生產(chǎn)的迭代更新。傳統(tǒng)的文獻(xiàn)獲取方式和閱讀條件下的眾多學(xué)術(shù)工作,比如文本校箋、年譜編纂、資料匯輯、史實考據(jù)等,每一種都需要耗費學(xué)者的大量心血乃至平生精力,今后在知識庫作為學(xué)術(shù)研究平臺的環(huán)境下,將會變得輕而易舉從而退出學(xué)術(shù)主流,代之而起的是層出不窮的更大尺度、更小粒度和更多維度的知識生產(chǎn)、文化創(chuàng)造和隨之呈現(xiàn)的新視野、新觀點以及新方法。
再次,將促進(jìn)人文學(xué)科思維和范式的發(fā)展變化。機器學(xué)習(xí)與人工智能、數(shù)據(jù)與文本挖掘、社會網(wǎng)絡(luò)與地理信息系統(tǒng)、統(tǒng)計學(xué)習(xí)與主題模型等數(shù)字工具革新和技術(shù)應(yīng)用,“數(shù)據(jù)驅(qū)動、實證優(yōu)先”的大數(shù)據(jù)思維,必然促成人文學(xué)術(shù)從片面性到整體性、從因果性到相關(guān)性、從解釋性到求是性的重心偏向,給人文學(xué)者帶來認(rèn)知方式、學(xué)術(shù)理念和研究范式的發(fā)展變化,其意義就遠(yuǎn)不限于古籍學(xué)術(shù)一隅,而是輻射至以歷史文化為對象的整體人文學(xué)術(shù)研究了。
在西方國家,數(shù)字人文的概念產(chǎn)生得比較早,數(shù)據(jù)庫和知識庫的建設(shè)也進(jìn)展得比較快。進(jìn)入人工智能時代,群智創(chuàng)新將為人文學(xué)科帶來新的發(fā)展活力,知識語料庫構(gòu)建更成為一種創(chuàng)新潮流,人文學(xué)科的創(chuàng)新模式和創(chuàng)新中心將隨之發(fā)生改變和轉(zhuǎn)移。值得重視的是,海外也在關(guān)注中國基本文獻(xiàn)數(shù)據(jù)庫和中華傳統(tǒng)文化大模型的建設(shè),這不僅涉及古籍整理研究和中國傳統(tǒng)文化研究的自主推進(jìn),也關(guān)乎文化自信和文化安全。
可喜的是,近年來國內(nèi)數(shù)字人文的發(fā)展也正呈加速之勢,從事數(shù)字人文工作的學(xué)者尤其是年輕學(xué)者日多,多家高校和研究機構(gòu)成立數(shù)字人文中心,學(xué)術(shù)交流頻繁,學(xué)術(shù)成果遞增。2020年1月,大陸第一家《數(shù)字人文》雜志由清華大學(xué)與中華書局聯(lián)合創(chuàng)刊,第一個數(shù)字人文門戶網(wǎng)站在清華大學(xué)建成。2023年4月,“數(shù)字人文”進(jìn)入教育部最新版“普通高等學(xué)校本科專業(yè)目錄”。與此同時,與古籍整理研究相關(guān)的歷史人文智慧數(shù)據(jù)平臺、知識服務(wù)平臺正在涌現(xiàn),中國的數(shù)字人文正在形成自己的體系特色。
在今天,文化的傳承和創(chuàng)新離不開突飛猛進(jìn)的科學(xué)技術(shù)。大數(shù)據(jù)時代,數(shù)字人文的快速發(fā)展給悠久而輝煌的傳統(tǒng)古籍整理研究提供了突破性變革的巨大機遇。用數(shù)字化的技術(shù)手段、方法和與之相應(yīng)的理念整理古籍,發(fā)揚學(xué)術(shù),傳承文化,賡續(xù)文脈,成為時代交付我們這一代人的歷史使命。我們要趁勢而為,進(jìn)一步拓展視野、提高站位,在推動中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展的實踐中,在以中國式現(xiàn)代化全面推進(jìn)中華民族偉大復(fù)興的進(jìn)程中,為建設(shè)中華民族現(xiàn)代文明作出應(yīng)有的貢獻(xiàn)。
(作者系全國古籍整理出版規(guī)劃領(lǐng)導(dǎo)小組成員、清華大學(xué)人文學(xué)院教授)
已有0人發(fā)表了評論