網路數字化文獻資源

瀚典台灣中央研究院漢籍電子全文檢索系統,可檢索《二十五史》、《十三經》、《清經世文編》、《清續經世文編》等等。檢索非常方便,並能夠馬上轉換成編輯文本。

超星圖書館:目前中國最大的數字化圖書館。2000年1月由北京時代超星公司與廣東中山圖書館合作開通,現已成為一個由全國各大圖書館支持的龐大數字圖書展示推廣平台,並已將其數字化方案成功應用於中央檔案館、中山圖書館、深圳圖書館、解放軍醫學圖書館、溫州圖書館、美國加州大學聖地亞哥分校圖書館等國內外500多家單位。其「館藏」古籍,集中於「專題圖書館」中的「北大圖書館古籍」,以及「古代文獻圖書館」、「國家檔案文獻庫」、「地方志圖書館」等圖書館數量之多,可以在很大程度上滿足專業研究者的閱讀需求。此外,超星公司目前還在開發自己的e_Book。

書同文數字化技術有限公司大陸最大的致力於古籍數字化的公司,現有《四庫全書》、《四部叢刊》、《康熙字典》的電子版。此外還有《中華文化通志》、《漢語大詞典》、《中華古漢語詞典》等產品。目前在製作《永樂大典》全文檢索版。

內閣大庫檔案查詢:台灣中央研究院開發,提供內閣大庫檔案的資料目錄查詢,對研究明清史者非常有用。

中研院近史所藏內務府奏銷檔案目錄

中研院近史所藏漢文黃冊檔案目錄

中研院近史所藏俸餉冊提要目錄  

史語所簡帛金石資料庫台灣中央研究院歷史語言研究所文物圖像資料室開發收集了大陸、台灣和日本的40余種資料,包括了已經整理出版的先秦至魏晉的簡牘、帛書、碑刻、官印、鏡銘等,還收錄了相關的書目、索引等。

文獻資料: 北京大學中文繫上載於網絡上的古籍資料,有《十三經》、《前四史》、先秦諸子等。

唐人文化:文物、拍賣、收藏及IT行業人士發起並組建的北京藍籌文化傳播有限公司建設。實行會員制。網站上有《明清狀元名錄》、《中國藝術家姓名、字號索引》。會員另外享受《明清進士題名》在線查詢。

中華電子佛典線上藏經閣大正藏全文檢索

寒泉資料庫:台灣陳郁夫先生主持開發。含《十三經》、《宋元學案》、《明儒學案》、《白沙全集》、《四庫總目》、《朱子語類》、《資治通鑒》、《續通鑒》等。

漢學研究中心典藏目錄及數據庫(台灣):包含典藏國際漢學博士論文摘要資料庫明人文集聯合目錄及篇目索引資料庫兩漢諸子研究論著目錄資料庫經學研究論著目錄資料庫敦煌學研究論著目錄資料庫外文期刊漢學論著目次資料庫(尚未提供檢索)、國際漢學資源機構錄資料庫,可進行資料庫整合查詢

網路展書讀台灣元智大學羅鳳珠先生主持開發,包括詩經唐宋文史資料(含《全唐詩》、《唐宋詞》、《新唐書》、《宋史》等)、紅樓夢三國演義水滸傳等的全文檢索。

香港中文大學中國文化研究所「華夏文庫」及「古文獻資料庫

北京中醫藥大學開發的中藥方劑數據庫: 收錄公元960年至今的24種古籍中的全部方劑),可通過網絡進行有償檢索.


一些開發中的文獻資源 

1.北京大學劉俊文先生主持的「中國基本古籍庫」 光盤工程(http://www.cn-classics.com/)。目前進行中的最大的古籍數字化工程。該工程1998年正式啟動,全套光盤庫共500張,分哲學、史地、藝文、綜合4個子庫20個大類,範圍涉及先秦至民國的重要典籍1萬餘種並提供多重檢索功能,每種典籍有1個通行版本的全文信息,另附12個珍貴版本的圖像數據,預計全文20億字,版本圖像2千萬頁。這個項目具有很好的前瞻性,一旦開發成功,將基本上可以滿足文史和其他方面研究者的研究需求(可惜價格實在太貴,恐怕不是學者書齋可備之物)。目前已有部分產品面世,演示版下載地址:http://www.cn-classics.com/down/dowmnindex.htm

2.漢文化資訊聯盟的「漢文化資料庫」(http://www.hanculture.com/),內容涵蓋歷代重要古籍,按經、史、子、集分類,精選底本勘校、標點而成,與《四庫全書》等未加整理的全文檢索不同。資料庫中包含「漢文化考證檢索系統」,極富特色。

3.中國中醫藥文獻數字化。國家科技部基礎工作項目。由中國中醫研究院中國醫史文獻研究所(http://www.cintcm.ac.cn/catcm/ys/yssjj.htm)承擔,山東中醫藥大學、南京中醫藥大學、上海中醫藥大學以及浙江省中醫研究院、天津中醫研究院等十四家中醫藥教育、科研單位協作。

4《歷代石刻史料彙編》全文檢索。北京書同文數字化有限公司開發,預計不久即可見成果。

5.中國數字圖書館工程(http://www.nlc.gov.cn/dloff/)。該工程由中國國家國家圖書館倡議於1998年,200110月正式國務院批准立項。目前已成立了「中國數字圖書館聯盟」,聯絡了41家公共圖書館、30家高校圖書館、8家科研機構圖書館、7家其他類型的圖書館和14家技術公司。該工程的總體目標是在寬帶IP網上形成超大規模的、高質量的中文資源群,支持國家整體創新體系的形成與發展,通過國家骨幹通信網絡系統向全國乃至全球提供服務。其工程的重要內容之一,就是發掘歷史遺產。工程進展緩慢,各種規則一大堆,沒見多少可以直接提供給用戶的成果出來。

6.「中國教育科技數字圖書館」(China Education and Research Digital Library,簡稱CERDLIB)工程。該項目由美國卡內基-梅隆大學教授Dr. Raj Reddy和西蒙學院陳劉欽智博士、中國科學院研究生院常務副院長高文博士共同發起,旨在建設面向教育和科研的包含100萬冊(中、英文書籍各50萬冊)圖書的數字圖書館,由教育部「211」工程建設辦公室歸口管理,浙江大學和中國科學院研究生院等單位共同承擔建設任務和運行管理。計劃通過4年的時間,建成2個數字圖書館技術中心(浙江大學,中國科學院研究生院)12個數字資源中心(北京大學、清華大學、吉林大學、武漢大學、西安交通大學、中國科學院研究生院、浙江大學、復旦大學、南京大學、中山大學、四川大學、上海交通大學),開發出30個左右的大型特色數字資源庫。項目中包含了古籍數字化的內容。進展情況不詳。

7.台灣典藏數位化計劃。2001年啟動,參加機構有台灣中央研究院、台灣故宮博物院、台灣歷史博物館、台灣大學等。

8.中國歷史地理信息系統(CHGIS)。復旦大學歷史地理研究中心(http://yugong.fudan.edu.cn/chinesegb.asp#)、美國哈佛大學、哈佛燕京學社、澳大利亞格林菲斯大學亞洲空間數據中心等機構合作開發,主要資助單位是美國羅斯基金GIS數據的基礎平台。這是一種研究性、工具實用性都很強的開發項目,與單純的把古籍轉化成圖片或檢索文本的數字化不同,也顯示出古籍數字化的另外的發展方向。

9.「國際敦煌學項目」(The International Dunhuang Project,簡稱IDPhttp://idp.bl.uk)。英國圖書館開發,開始於1993年。項目中包括了英國(並計劃擴展到世界範圍內)的敦煌文獻數字化。目前可線上查看英國圖書館收藏的3萬餘件中亞寫本和印本文件,以及15000余件殘卷的高質量彩色圖片(http://idp.bl.uk/IDP/idpdatabase.html)。

10. 「古籐堡計劃」(Project Gutenberg,簡稱PG)(http://promo.net/pg/),美國伊林諾斯大學文理學院米歇爾•哈特(Michael S. Hart ;http://promo.net/hart/)倡始於1971年。計劃對世界上的一些經典古籍進行數字化,其中包含了中國經典、文學、歷史和地圖等方面書籍和資料(主要為英文),如《論語》、《桃花源記》、《三國演義》等。現可在網上進行目錄檢索(可使用中文,http://promo.net/cgi-promo/pg/t9.cgi)。相關信息可通過北京大學哲學系網站下載(ftp://elib.phil.pku.edu.cn/pub/gutenberg/),另外它還設立了一個限中國境內訪問的鏡像站(ftp://ftpbook.dhs.org/mirrors/gutenberg/)。


常見電子圖書格式

從文件格式上來看,目前的數字化古籍除常見的txt、doc、html式外,還有exe、pdf、wdl、pdg、ebk、edb等。

1exe格式。所見有秦昌榮(秦堤居士)「家庭百寶箱」系列(含諸子百家、二十五史、資治通鑒三種)(中華文史軟件網http://www.jtbbx.com/)。另外,北京天安億友公司(http://www.eyousoft.com/html/index.htm)出品的《二十五史》、《資治通鑒》也包含了這種格式,詳見2688阿里巴巴網站(http://www.2688.com/product/zmkmdefault.asp)的「芝麻開門」圖書系列。

2pdf格式。所見有紅旗出版社(http://5051.peoplespace.net/)的「家庭藏書集錦」所包含的部分古籍。博庫(http://www.bookoo.com.cn/default.asp)圖書也採用了這種格式。需要pdf格式文件專用瀏覽器,如Adobe公司的Adobe Reader、北大方正的Apabi Reader

3wdl格式。北京華康信息技術有限公司(http://www.dynalab.com.cn)開發的電子讀物文件格式。所見有博庫圖書採用了這種格式。它保留了原來的版面設計,可以在線閱讀,也可以將下載到本地機閱讀。需要該公司的專用閱讀器DynaDoc Free Reader

4ebk格式。所見有深圳市百博電子商務網絡技術有限公司的「百博書城」(http://www.bbook.net/gb/default.asp)圖書使用。書籍可在線閱讀,也可下載到本地。需要百博專用的圖書閱讀器。

5edb格式。北京天安億友公司開發的圖書格式(Eyousoft Digital Book)。

6oeb格式(OpeneBook)。所見有遼寧省出版集團開發的掌上書房(http://www.cnbook.com.cn/bottom/aboutus.htm)使用,有專用閱讀器,也可使用北大方正的Apabi Reader閱讀器閱讀。

7sepifr格式。由書生之家(http://www.21dmedia.net.cn/zhtsw.asp)開發的電子圖書格式,需要其專用閱讀器來閱讀。

8xeb格式。以oebOpene Book)為基礎,以xml(eXtensible Markup Language,可擴展標記語言)技術為核心的中文電子圖書格式。北大方正的Apabi Reader等瀏覽器支持閱讀。

9pdg格式。超星公司(http://www.ssreader.com/)開發的圖書格式。需通過超星專用的圖書瀏覽器閱讀。

10nlc格式。中國數字圖書館(http://www.d-library.com.cn/index.php)採用的圖書格式,需要其專用瀏覽器NLC Reader閱讀。

11.基於unicode(通用多於8位編碼字符集)、倉頡碼、Big5碼或其他字符集,以htmlxmlsgml等為核心的全方位電子文獻全文檢索格式。這是目前勢頭最盛、也顯然是更有發展前途、更具實用價值的一種古籍數字化形式。台灣中央研究院的《漢籍電子文獻資料庫》(http://www.sinica.edu.tw/ftms-bin/ftmsw3)、香港迪志文化出版公司與上海人民出版社等合作開發的《四庫全書》標題檢索版和全文檢索版(http://www.sikuquanshu.com/ http://www.skqs.com)、北京書同文數字化技術有限公司(http://www.unihan.com.cn/html/index.htm)開發的《四部叢刊》等全文檢索版均屬於這種形式。漢文化聯盟開發的《漢文化資料庫》和目前北京大學正在開發的《中國古籍基本庫》也應屬於這種形式。

此外還有位圖形式和多媒體格式的數字化古籍。前者如濟南開發區匯文科技開發中心研製、武漢大學出版社出版發行的《四庫全書》原文電子版。後者如方圓電子出版社出版的《中國古典文學精品書庫》(見阿里巴巴網站http://www.2688.com/product/zmkmdefault.asp的「芝麻開門」圖書系列),包含了《紅樓夢》、《三國演義》、《西遊記》、《初刻拍案驚奇》、《二刻後案驚奇》、《儒林外史》、《醒世名言》、《喻世通言》及《警世恆言》10部古典名著全文,還包含由北京廣播電台的播音員配音的唐詩三百首和中小學語文教材中的古詩文,帶聯機字典及語音。另外,人民郵電出版社出版(http://www.ptpress.com.cn)的《二十五史多媒體全文檢索閱讀系統》也利用了多媒體形式,該產品除收錄百衲本二十四史和關外二次本《清史稿》的全部內容外,還配置了簡繁字異體字對照表、古代年表等,附錄了《歷代輿地圖》近2000幅大比例歷史地圖和張元濟校輯百衲本二十四史時所撰《校史隨筆》以及《左傳》、《戰國策》等多部史學名著、清至當代學者的部分輯佚與校勘成果。

本段文字,曾因見一些網友不識電子圖書格式而在國內某大網站之論壇中以本人網名(平生喜歡聶政、荊軻之俠道,故網名中帶「俠」字,有見此貼者可驗之)貼出(後被該論壇收入精華版),恐涉於不謹而列名竊賊(自來「文人無行」,況於今剽竊風行,稍有不慎,即遭眾譴。而三人成虎,曾母猶且投杼,若三學者咻之,則已不得為人矣),在下實不敢冒此風險,特此說明。唯在下頗喜於網絡世界「仗義行俠」(惜每枘鑿於現實,頗不能將網絡行俠之心得用於實際,實為憾事,此網絡之所以誤人也),雖不能救人水火,亦盡己所能傾心助之,決無邪意。然不欲好事者藉機生事,故不欲於此洩漏網名全稱,識者諒之。眨眼笑臉2002.9.10一介書生識於不逍不遙自娛自樂齋。