王汎森(中央研究院院士暨副院長)
一、前言
在44 年前(1968),法國史家勒.華.拉杜里(Emmanuel Le Roy Ladurie)發表了一篇震動一時,卻只有薄薄數頁的短文〈史家與電腦〉。在這篇文章的末尾,他宣稱最遲到80年代,史學家如果想要生存,他或她必須同時是一個電腦程式設計者。我們細看他所列舉非使用資訊技術便無法研究的領域,大致集中在人口史、物價史、家庭史等高度需要計量的史學類別;批評者們則認為這與重視歷史解釋、重視歷史敘述、重視意義發掘的史學互相排斥。但是近十多年的發展,證明拉杜里反而把電腦的功能想得太窄了,電腦不只能計量,它還有許多功能。作為一個歷史學者,我個人完全了解過度依賴數位工具的危險,並且始終相信,對於文本細密而又富想像力地解讀,是研究人文學的首要條件,然而數位技術仍可以發揮畫龍點睛的輔助作用。電腦和史學的傳統技藝不一定互斥,甚至可以尋找到一個新的接榫點。
在下文中,筆者將試圖從一個觀察者的角度,以曾任國家型計畫「數位典藏與數位學習國家型科技計畫」推動者,以及作為歷史研究者的切身經驗,討論數位工具和史家之間的種種可能與限制。本文認為數位技術和歷史研究者之間,應該形成一種夥伴的關係;數位技術不應取代人們對史料的閱讀,而是幫助研究者處理浩如煙海的史料,如同SPSS(Statistical Product and Service Solutions)、SAS(StatisticsAnalysis System)等軟體成為社會學研究者所信任與倚賴的工具。在一般的想像中,往往認為數位領域和人文領域兩者在研究取向上隱藏著不可解的衝突和張力,然而正好相反,兩者應是相輔相成的,數位技術將有助於拓展人文研究的豐富性。只要人文學者善待數位技術這個新的夥伴,與之對話,開發合作的新可能,數位技術將可成為開啟人文研究新天地的重要關鍵與途徑。
二、數位技術應用於人文研究的優勢
一如大家所熟知的,數位技術的優勢在於處理大量資料,前輩史家呂思勉(1884-1957)曾經通讀二十四史,依他的經驗,他從十五、六歲時開始閱讀,至二十三歲始將二十四史通讀一遍。但因正史頗為零碎,匆匆閱覽,真正需要使用時,仍不得不重讀。偉大的史家呂思勉尚且如此,更遑論一般研究者,要在二十四史查找所需資料,是多麼困難與耗費時間。但今日只要在各種電子資料庫裡按下搜尋,便能迅速得到結果。這是過去歷史研究者所無法想像的便利。這並不表示說研究者可以不用閱讀原典,而是數位技術提供的便利,已成為史家在研究過程中重要的幫手和夥伴;我們可以將數位技術的優點,歸結如下。
1. 典藏上的優勢
將實物或文獻資料數位化後,進行典藏的優勢。一是打破儲存空間上的限制,要存放實體的物品或書籍,需要大量的空間,一旦數位化後,只需硬碟便能加以儲存;對個人使用者而言,只要連線至資料庫即可使用,並能將資料儲存至個人電腦或筆記型電腦中,大幅降低存放的限制,也更方便查找和整理。典藏上的另一優勢,在於資料流通的便利,通過網際網路,過去許多要親赴特定館藏地才能接觸、閱讀的資料,在數位化與公開化之後,現在研究者只需一臺能上網的電腦,即可加以使用,大幅增加一手資料取得的便利。很多過去百尋不得、難有機會閱讀的書籍,透過網路的開放和篩選,在今日都很容易取得。經由網路傳遞和篩取的機制,數位技術可以騰清看不見的史料倉庫,將過去被遺忘、不被重視的資料,一振而出,讓被埋沒的舊文獻成為新出的史料。
2. 速度上的優勢
針對檢索的速度而言,數位化拉進了研究者和一手資料的距離。隨著綜合型資料庫的出現,研究者可以同時用特定關鍵字檢索、搜尋多種不同的資料來源,並迅速獲得結果,有些資料庫甚至提供了全文的影像和文字檔,帶給研究者莫大的便利。在這裡要舉一個例子:我因研究清代政治壓力對文化活動的影響,曾經對「一髮千鈞」這個一語雙關的詞(一根毛髮有千鈞之重)是否能在髮禁嚴明的清代使用感到好奇,透過資料庫檢索很快得到結果,該詞在清代果然極少使用。如果單憑人力搜索,這可能要數年以上的時間。
3. 數量上的優勢
利用電腦處理巨量資料(big data)的優勢。如第二點提及的迅速搜尋,以人力閱讀要花費數日、數週,甚至數月的資料量,以電腦進行文字檢索或文字探勘可能在幾分鐘內便可完成。資料量越大,數位技術的優勢越明顯。除了資料量,對資料內部數量的統計,數位技術也有十足的威力,可以就資料中的內容或關鍵字,加以統計,做出量化的分析,可以讓研究者迅速掌握某些字詞背後觀念和現象的發展趨勢,此即由「定量」到「定性」的過程。諸如觀察某些詞彙在特定時代的出現或消失,可以看到時代觀念的變化。過去這個工作非常艱難,而且不容易做出合適的判斷。中研院故院士屈萬里(1907-1979)曾提醒研究者千萬不要輕易做出「沒有」的判斷,因為這是十分危險的。在數位資料庫的協助下,當然還是不能斷言「沒有」,但卻可以指出某些詞彙或現象是相當稀少或近乎於零,數量多寡本身便可以成為歷史解釋的參考或依據。
4. 交流上的優勢
打造一個交流的平臺。提供研究成果發表的管道,諸如網路刊物、電子書、個人部落格、社群網站……,都可以讓研究者發表個人研究或意見,並促成社群的對話。我所服務的史語所,過去曾針對敦煌文書解讀上的一些困難,透過網路廣徵國際專家的意見,很快便得到解答。這並不是說研究者就不用與人接觸;和人交談討論是重要的,胡適考證《紅樓夢》的過程中有一個重要突破,是來自於他在圖書館中偶然與張中孚先生的對話,知道敦敏、敦誠兄弟與曹雪芹的關係,使得他的紅樓研究向前推進一大步。舉此一例可以知道面對面的交流非常必要,但虛擬世界的交流也在不斷擴大其影響,帶來新的對話可能。
5. 教育上的優勢
透過多媒體或如地理資訊系統(Geographic Information System,GIS)等特定軟體,人文研究的成果可以擺脫過去偏重文字呈現的方式,將圖像、影音帶入其中,擴充各種展示的可能。不受限於文字的呈現,不單有助於研究的表達,對於人文教學的貢獻更大,今日的人文教學,圖像、影片、聲音等等不同的表達形式,都已包含在教學者的選項中。譬如「蘭嶼原住民資料庫」裡面記錄了年長婦女教導族人編織的情形。蘭嶼傳統的織布方法正在消失中,過去利用文字描寫要花費極大的篇幅,卻只能收到很有限的成效,現在透過影片紀錄和數位的典藏、傳播,可以很快的收到傳習效果。又或者像3D掃描和印刷技術的發展,對古器物學、美術史、建築史的學習會帶來巨大的改觀。
除了上述五項優點,以下還要進一步申論:在數位時代,史家和史料、史家和歷史解釋、史家和歷史意義的建構和發掘,其間的關係正在巧妙的變化中。如前述的定量到定性,便是很值得注意的例子。郭沫若(1892-1978)在〈金文所無考〉一文,提出「古文獻中有習見之事物而為金文所絕無者,此可為判別典籍之真偽及時代先後之標準。」的主張,並列舉了許多例子,這種從史料所缺之處進行思考,是十分有創意的研究。可是在過去想斷言某樣事物不存在於歷史紀錄中,或非常稀有罕見是十分困難的,如今藉助數位技術處理大規模史料的優勢,人們比較可以有信心地討論史料中所無或所缺少的部分。換句話說,歷史的「空白」處有了重要意義,沒有證據即是一個重要的證據,這是以前不容易辦到的事。雖然我們不敢單憑資料庫就判定有無,但史料分布的稀少和眾多,都將提供研究者各種解釋的可能。
史學研究者總有一種先天的恐懼,想像有些未知的史料藏在不知名的某處,研究者永遠無法知曉其深淺,深怕自己做出推論的依據,只是史料之海的一些片面,擔心還有另一批可以反駁自己的關鍵史料,像潛水艇般潛伏於汪洋的深處,無聲無息,隨時準備偷襲自己。透過資訊科技,研究者和史料間的關係,正逐漸改變,如果史料數位化到一個程度,則史家可以對資料的分布有個大致的了解,知道約略的梗概,就像替史家的武器配上新的準星,以應付龐大史料所構成的「無知之幕」。
書籍資訊——