2022年,我國頒布《關于推進實施國家文化數字化戰略的意見》,提出到“十四五”時期末要基本建成文化數字化基礎設施和服務平臺;到2035年要建成國家文化大數據體系,展示中華文化全景,讓中華文化數字化成果全民共享。2023年2月27日,最新發布的《數字中國建設整體布局規劃》則進一步強調要夯實數字基礎設施和數據資源體系“兩大基礎”,推進數字技術與經濟、政治、文化、社會、生態文明建設“五位一體”深度融合,強化數字技術創新體系和數字安全屏障“兩大能力”,優化數字化發展國內國際“兩個環境”。
其中,國學傳統典籍作為承載著優秀文化精華的重要文化遺產,其電子化及智能化已引起國內外的廣泛關注,但相比之下,已被眾多國內外譯者以節譯、選譯、摘譯、改寫、全譯等多種方式介紹、傳播到世界各地的典籍外譯本,其電子化及智能化建設卻相對薄弱,需要在數字人文視域下進一步得到應有的重視和實際的研發,尤其是對典籍外譯書目進行整理和可視化研究,使從業者、教師、學生、專業研究者、典籍外譯愛好者等有綱可依、彰往察來。應當指出的是,與傳統的文獻數據庫不同,當前建設的目標應該是能被電腦直接分析的量化數據庫,應該致力于實現從“文字的閱讀”到“數據化的分析”的跨越,以更好地應對數字時代的挑戰和機遇。
一、如何集成——典籍外譯版本目錄集成路徑
典籍外譯版本目錄的整理、匯總和標準化處理至關重要,這是構建典籍外譯目錄數據資源庫、實現典籍外譯版本目錄集成與可視化的關鍵。該資源庫應包含典籍名稱、作者、譯者、外譯版本、外譯目錄、翻譯者、出版、社出版時間、典籍類型等詳細信息,以方便學者進行檢索、查詢、開展相關學術研究。
首先可基于已有的漢語典籍外譯的文獻目錄研究專著,如《漢學書目》(考狄,1878~1921)、《西文漢學書目》(袁同禮,1958)、《中國文獻西譯書目》(王爾敏,1975)和《20世紀中國古代文化經典在域外的傳播與影響研究書系》(張西平,2018b)等專著,提取譯者、版本、出版社、出版時間等結構化信息,幫助研究者全面、系統地搭建起典籍外譯書目體系的整體框架、流變網絡,縱覽典籍外譯的歷時發展,再結合下述方式查證、輔助補全缺失信息。
其次,基于翻譯史類著作如《漢籍外譯史》(馬祖毅、任榮珍,1997)、《中國翻譯史》(馬祖毅,2004)、《西方翻譯簡史》(譚載喜,2004)、《中西翻譯簡史》(2009,謝天振)、翻譯思想史類、翻譯理論類專著如《翻譯論集》(羅新璋、陳應年,2009)、《西方翻譯理論通史》(劉軍平,2009)等進行查漏補缺。此外,還有不少典籍外譯研究成果如專著、論文中也整理了典籍外譯本的基本信息,如潘文國所著的《中籍英譯通論》(2021)、王宏、沈潔、王翠、劉性峰等著的《典籍英譯新發展研究》(2021)等專著就是杰出代表。因此,有必要加快整理典籍外譯專著、博碩論文等出版和傳播,進一步加大中國優秀傳統文化的影響力。
第三,以古籍版本目錄學整理出的傳統國學典籍書目電子化成果為綱,查找、整理對應的典籍外譯本目錄。以北京大學數字人文團隊的典籍電子化成果為例,該團隊通過對八種官修目錄的數據處理及集成,利用統計分析及可視化等方法,為全類別的古典文獻目錄研究和知識演變分析構建了交互式可視化分析系統,充分展示古代知識在生產、組織和結構方面的變化。因此我們可在此類成果的基礎上進一步對照底本查找譯本的現存信息,按圖索驥、剝繭抽絲,通過針對性查找,不斷探索和發掘有關典籍外譯的信息。
第四,通過圖書館檢索現存的典籍外譯版本目錄,查漏補缺以獲取更為全面、準確的外譯版版本資料,包括但不限于利用OCLC、國內外各大高校、地方等各大圖書館的檢索系統,還可以建立相應的圖書館外譯版本目錄數據庫,便于研究人員進行檢索和利用。通過此種方法,研究人員不僅可以查漏補缺外譯版本目錄,還能夠獲得更多相關的文獻資料,從而獲得更為豐富和準確的信息。
第五,以各出版物的典籍外譯出版信息作為補充,并不斷更新最新信息。這些出版物包括各專業出版社、國內外高校出版社及其所推出的各系列叢書,如大中華文庫系列英譯本、東方圣書(The Sacred Books of the East)、特魯伯納東方叢書(Trubners Oriental Series)、佛教圣典叢書(Sacred Books of the Buddhists)等等。此類出版物可提供更詳實的典籍外譯出版信息,而不斷更新的最新信息可進一步提高研究的完整性和準確性。
第六,充分核對、運用典籍外譯愛好者、漢學愛好者所創建、維護的相關材料,如網絡上的佛教資料、佛教網站專欄下的西文佛經目錄等等,例如中華佛典寶庫(www.fodian.net)、互聯網神圣文本檔案館(www.sacred-texts.com)等非常具有代表性的網站。此類材料可為研究者提供更全面的典籍外譯目錄信息,幫助我們更好地開展研究工作。
第七,在典籍外譯目錄數據資源庫、網站中設計眾包欄目板塊,以志愿者眾包方式整理、集合散落、珍藏在各地的典籍外譯本。隨著數字化技術的發展,獲取數字資源已成為重要的信息獲取途徑,其中包括大量的典籍數字化材料。但由于時間、空間和技術等因素,許多珍貴的典籍外譯本分散在各地的圖書館、檔案館等不同的文獻資源機構,缺乏集中管理和使用,也無法為廣大讀者提供方便的使用和查詢方式。在網站的功能設計中加入眾包板塊可有效解決此類問題,整合分散的文獻資源,提高文獻利用率,方便廣大讀者查閱和研究。通過建立完善的管理機制、激勵機制、技術支撐和法律保障等方面保障志愿者眾包的順利推行,可整理、匯集珍藏在全國各地散布的典籍的外譯本,并激發廣大讀者、愛好者的參與熱情,推動數字資源共建共享、知識共享和文化交流。
二、如何可視化——典籍外譯版本目錄可視化路徑
數字人文,即用數字技術解決人文問題,涉及數據庫、文本處理、自然語言處理、圖像識別、知識圖譜、數據挖掘以及在線眾包等諸多技術,在典籍外譯研究時對“人”(譯者、作者、傳播主體)、“物”(原作、譯作、相關研究成果)、“地”(譯者生平行跡、出版社、譯本流通路徑)、“時”(歷時、共時)、“事”(譯者、譯事等)、“因”(譯作中的思想、策略、學術思想)、“果”(譯作思想、策略對其他作者、譯者、作品、術語翻譯與演變的影響)等方面都具有得天獨厚的優勢。
首先,在版本目錄可視化中,按電腦預處理、志愿者核對、專家審查相結合的流程,對數據進行降噪、拆分、補全,并對不同目錄中的題名和作者信息進行規范化處理。通過典籍外譯版本目錄可視化,充分展示中國文化在對外傳播、溝通、交流時,譯者、機構、組織者、贊助者的偏好與變化,并能通過古籍書目呈現古代知識生產、組織和結構等方面的變化。
其次,典籍外譯目錄可視化處理除了強調典籍歷版的變遷外,還有必要進一步厘清譯者所選底本和譯本之間更加錯綜復雜的對應關系。同時,由于典籍中儒、道、法家等占據主流,許多譯者也集中在儒學外譯等領域,在翻譯作品分類、主題領域選擇等方面存在失衡情況,多個譯者翻譯一個譯本、一個譯者翻譯多個譯本、譯者重譯等情況也屢見不鮮。因此亟需對當前典籍外譯本目錄的可視化基礎上進一步精細化整理、分析,這也是典籍外譯研究的魅力所在。
雖然譯者、譯作、底本、出版社等諸多節點關系網絡有著極強的復雜化特征,但互聯網的重要特點是互聯、互動,能夠實現最后的呈現效果。因此典籍外譯版本目錄可視化數據庫的構建與研究也應重視數據庫自身信息的內連接和數據庫之間信息的外連接,盡可能地實現數據追蹤,從而體現出電子數據的優勢,推動新技術環境下史學研究地深化與發展。具體而言,內連接含義有兩層:一是指納入多來源史料中可以相互匹配的信息進行連接以擴充數據庫內容;二是指應注意數據庫中信息的相互連接,從而拉長研究的時段、代際甚至空間范圍等。外連接則主要指主題各異但內容相關的數據庫,在相互開放的前提下,實現各數據庫之間、相應數據信息的連接、跳轉,從而突破單獨數據庫的時空、內容、范圍與主題局限,在數據庫建設與研究層面實現共享與共贏,并造福社會。
三、如何應用——典籍外譯版本目錄集成與可視化的應用
弗朗哥·莫萊蒂(Franco Moretti)指出,數字人文研究應通過遠讀聚焦比文本小很多或大很多的單位(例如詞語、句子、風格、文體等內容的量化分析)理解整個體系。文本標記和挖掘是數字人文遠讀的重要手段,可揭示傳統閱讀方式難以發現的問題。在古典文學與文獻學領域,相關研究已如火如荼。而對于典籍外譯版本目錄集成與可視化研究,應包括但不限于以下內容:
首先,將目錄中的典籍外譯名稱按照內在層級結構組織起來,形成樹形結構,并以各色圖標標示典籍類型、時代等屬性,清晰呈現不同典籍之間的關系、脈絡、特征及影響。作為一種系統性的典籍編目方法,該方法在典籍學研究中具有廣泛應用,可幫助讀者深入理解典籍內容,把握其歷史背景、文化意蘊及學術價值等方面的特征。在該方法中,典籍被視為一個具有內在層級結構的體系,其包含了不同的篇章、章節、段落、句子等層次結構。按照這種層級結構,可以將典籍分成不同的部分,再進一步分成章、節、段等小部分。在樹形結構中,這些部分被表示為樹的節點,節點之間的關系和層級結構則用樹的分支來表示。
而為了更好地表示典籍的類型、時代等屬性,采用可視化技術展示典籍外譯目錄,如將典籍外譯目錄轉換成詞云、散點圖、條形圖等形式進行展示,并用不同顏色或圖標來進行標示。例如用黃色標示儒家經典,藍色標示佛家經典,紅色標示印度教經典等等,這種標示方式可以幫助讀者更加清晰地理解典籍的類型、歷史背景和學術價值,從而更好地把握不同典籍之間、典籍和譯本之間、譯本和譯本之間的關系、脈絡、特征及影響,并使學者通過視覺化的方式更好地理解典籍之間、典籍與外譯本之間、譯本之間的主題、內容和關聯。通過將不同時期的典籍外譯版本的關鍵詞進行比較,為研究者提供更深入的思考和探索空間,快速抓取典籍的研究方向和重點、縱覽各時期典籍外譯主題的變化走勢并感知未來趨勢,為典籍外譯研究提供更多借鑒和參考。
其次,將典籍外譯按照出版地點進行標注,在地圖上進行可視化展示,直觀呈現典籍外譯的分布情況、地域特色。這種方法在典籍研究中被廣泛應用,因為它可以幫助研究者從地理角度把握典籍研究的方向和發展趨勢。在這種方法中,出版地點被視為反映典籍外譯分布情況和地域特色的重要指標。通過將典籍外譯按照出版地點進行標注,并利用地圖工具將其展示出來,可以清晰地展示典籍外譯的分布情況和地域特色??梢员容^不同地域的典籍外譯分布情況、揭示地域文化的差異和典籍研究的地域特色,為研究者提供更深入的思考和探索空間。
此外,對典籍外譯目錄進行內容分析。利用文本挖掘和自然語言處理技術,對典籍的外譯目錄進行內容分析、跨文化比較研究,探究翻譯者在翻譯過程中所采用的翻譯策略和技巧,以及翻譯結果中的差異和特點,這對于深入了解典籍翻譯的歷史和文化背景有重要意義,也有利于探究不同翻譯文化中對于典籍翻譯的理解和實踐,以及典籍的跨文化傳播對于翻譯的影響和啟示。
綜上所述,依靠量化翻譯史數據庫、尤其是典籍外譯目錄的集成和可視化研究,將輔助翻譯研究者對大量系統數據材料進行統計分析,幫助翻譯學研究者發現隱藏在海量史料中無法依靠傳統閱讀發現的新知識、新現象,更可以幫助研究者深入了解典籍外譯的歷史和文化背景,為翻譯教育和翻譯實踐提供有益的啟示和借鑒,促進中華文化的傳播和跨文化交流。
(作者為復旦大學外國語言文學學院博士生)