習近平總書記在文化傳承發(fā)展座談會上強調(diào):“只有全面深入了解中華文明的歷史,才能更有效地推動中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉化、創(chuàng)新性發(fā)展,更有力地推進中國特色社會主義文化建設,建設中華民族現(xiàn)代文明。”這一重要論述意蘊深遠,內(nèi)涵深刻。
要想全面深入了解中華文明的歷史,20萬種傳世古籍是一筆寶貴的財富。它們是源遠流長、博大精深的中華文明信息與中國文化基因的載體,是中華民族思想的表達、精神的追求、智慧的結晶。傳世古籍這筆財富要利用好,首先要研究好;要研究好,首先要整理、保護和傳承好。我國古籍整理的歷史與古籍一樣悠久,孔子就整理過六經(jīng),人們稱他為思想家、教育家,也稱他為文獻學家。兩千多年來,古籍的整理和研究不僅是歷代學人孜孜矻矻的名山事業(yè),也是中華優(yōu)秀傳統(tǒng)文化傳承和傳播的前提與基礎。
黨中央歷來重視古籍的整理與傳承,早在1981年,就以中共中央文件的名義下發(fā)過《關于整理我國古籍的指示》。習近平總書記在此次座談會前,也專程前往中國國家版本館中央總館考察,并指示要千方百計保護好留存下來的這些瑰寶,將古籍整理和傳承的重要性提到“把我們這個世界上唯一沒有中斷的文明繼續(xù)傳承下去”的位置。
計算機科學的發(fā)展使得大數(shù)據(jù)時代不期而至,針對古籍工作,黨和國家從時代發(fā)展和文化建設需要出發(fā),及時頒布了相關的政策和文件。2022年4月,中共中央辦公廳、國務院辦公廳印發(fā)《關于推進新時代古籍工作的意見》,明確提出“推進古籍數(shù)字化”。
中國古籍數(shù)字化已有至少40年的歷史,但相對于20萬種古籍來說,得到數(shù)字化的尚屬很小一部分,《意見》提出“建立健全國家古籍數(shù)字化工作指導協(xié)調(diào)機制,統(tǒng)籌實施國家古籍數(shù)字化工程”,正當其時,非常重要。
但更重要的是,技術的發(fā)展倒逼著我們提出更高和更激蕩人心的目標。隨著計算機深度學習能力、文本挖掘等大數(shù)據(jù)技術和人工智能的快速發(fā)展,古籍在繼續(xù)數(shù)字化的同時,應該開始向知識化轉變。“積極開展古籍文本結構化、知識體系化、利用智能化的研究和實踐,加速推動古籍整理利用轉型升級”,《意見》中的這段表述,充分體現(xiàn)了國家對于古籍數(shù)字化領域發(fā)展前沿的深刻把握,對于利用現(xiàn)代科技手段促進古籍整理與研究的高度關切,具有重要的前瞻性和方向性,更值得重視。
數(shù)字化和知識化的最大區(qū)別,就是前者僅可提供簡單的字符串檢索,后者是基于所有存世古籍的關系性、結構化、知識再生型的超大數(shù)據(jù)庫,簡單地講,就是使用大數(shù)據(jù)、人工智能、自然語言處理等相應技術手段,開發(fā)適合不同古籍類型的文本分析模型和工具,借助過往一切古典學的研究成果,周密地設定主題詞表,專業(yè)地提取各種實體,多維度地構建不同實體間的關系,對文獻進行深層組織和知識管理,形成體系化的“中國古典知識庫”。這是一個基于全部存世古籍、關乎中國古典知識整體的宏大構想,它的建設,意義重大。
首先,將促進古籍整理和利用的轉型升級。大數(shù)據(jù)技術帶來文獻生產(chǎn)方式的創(chuàng)革、文本形態(tài)的新變和文獻獲取方式的拓展,使得抄印本和電子化時代被日漸窮盡的文獻,因為數(shù)據(jù)化、知識化而重新變得不可窮盡。同時,將以往被分裂和隔絕的事物重新連接,可以最大程度地促進文獻的關聯(lián)與知識的發(fā)現(xiàn),改變我們對文獻、知識的認識路徑和把握尺度,催生一種新型的文獻學。
其次,將促進學術研究、知識生產(chǎn)的迭代更新。傳統(tǒng)的文獻獲取方式和閱讀條件下的眾多學術工作,比如文本校箋、年譜編纂、資料匯輯、史實考據(jù)等,每一種都需要耗費學者的大量心血乃至平生精力,今后在知識庫作為學術研究平臺的環(huán)境下,將會變得輕而易舉從而退出學術主流,代之而起的是層出不窮的更大尺度、更小粒度和更多維度的知識生產(chǎn)、文化創(chuàng)造和隨之呈現(xiàn)的新視野、新觀點以及新方法。
再次,將促進人文學科思維和范式的發(fā)展變化。機器學習與人工智能、數(shù)據(jù)與文本挖掘、社會網(wǎng)絡與地理信息系統(tǒng)、統(tǒng)計學習與主題模型等數(shù)字工具革新和技術應用,“數(shù)據(jù)驅動、實證優(yōu)先”的大數(shù)據(jù)思維,必然促成人文學術從片面性到整體性、從因果性到相關性、從解釋性到求是性的重心偏向,給人文學者帶來認知方式、學術理念和研究范式的發(fā)展變化,其意義就遠不限于古籍學術一隅,而是輻射至以歷史文化為對象的整體人文學術研究了。
在西方國家,數(shù)字人文的概念產(chǎn)生得比較早,數(shù)據(jù)庫和知識庫的建設也進展得比較快。進入人工智能時代,群智創(chuàng)新將為人文學科帶來新的發(fā)展活力,知識語料庫構建更成為一種創(chuàng)新潮流,人文學科的創(chuàng)新模式和創(chuàng)新中心將隨之發(fā)生改變和轉移。值得重視的是,海外也在關注中國基本文獻數(shù)據(jù)庫和中華傳統(tǒng)文化大模型的建設,這不僅涉及古籍整理研究和中國傳統(tǒng)文化研究的自主推進,也關乎文化自信和文化安全。
可喜的是,近年來國內(nèi)數(shù)字人文的發(fā)展也正呈加速之勢,從事數(shù)字人文工作的學者尤其是年輕學者日多,多家高校和研究機構成立數(shù)字人文中心,學術交流頻繁,學術成果遞增。2020年1月,大陸第一家《數(shù)字人文》雜志由清華大學與中華書局聯(lián)合創(chuàng)刊,第一個數(shù)字人文門戶網(wǎng)站在清華大學建成。2023年4月,“數(shù)字人文”進入教育部最新版“普通高等學校本科專業(yè)目錄”。與此同時,與古籍整理研究相關的歷史人文智慧數(shù)據(jù)平臺、知識服務平臺正在涌現(xiàn),中國的數(shù)字人文正在形成自己的體系特色。
在今天,文化的傳承和創(chuàng)新離不開突飛猛進的科學技術。大數(shù)據(jù)時代,數(shù)字人文的快速發(fā)展給悠久而輝煌的傳統(tǒng)古籍整理研究提供了突破性變革的巨大機遇。用數(shù)字化的技術手段、方法和與之相應的理念整理古籍,發(fā)揚學術,傳承文化,賡續(xù)文脈,成為時代交付我們這一代人的歷史使命。我們要趁勢而為,進一步拓展視野、提高站位,在推動中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉化、創(chuàng)新性發(fā)展的實踐中,在以中國式現(xiàn)代化全面推進中華民族偉大復興的進程中,為建設中華民族現(xiàn)代文明作出應有的貢獻。
(作者系全國古籍整理出版規(guī)劃領導小組成員、清華大學人文學院教授)
已有0人發(fā)表了評論