高校古籍 香港高校古籍特征库建造及同享现状查询与启示
钟伶
摘要:挑选香港8所公立大学,经过网络拜访、文献调研的方法查询高校古籍特征资源建造与同享现状,总结香港高校特征数据库建造与同享方面的特征,以期为往后古籍特征库建造及同享供给主张。
要害词:古籍特征库;香港;高校图书馆;同享
中图分类号:R2-5 文献标识码:A 文章编号:2095-5707(2016)03-0006-05
古籍是研讨古代政治、文明、经济的一手材料,极具保藏与学术研讨价值。据2003年《香港所藏古籍书目》记载,香港中文大学、香港大学、香港浸会大学、香港科技大学、香港城市大学、香港理工大学等11家高校图书馆所保藏的1911年(含1911年)曾经写、抄、刻、印之各类中文古籍有7368种,丛书子目达18718种。为扩展宝贵古籍的运用,各高校先后开端了古籍数字化作业,树立了一批古籍的特征资源库,并在建造与同享方面有着自己的特征。
本研讨挑选香港8所公立大学,经过网络长途拜访各所高校的图书馆或古籍研讨机构的网站,搜集、收拾各高校树立的古籍特征库目录、可拜访及同享情况、特征库内容,以及各个特征库的建造与展开进程:一起经过文献调研方法,搜集并参阅有关香港高校古籍特征库建造方面的各类文献,包含图书、期刊论文、会议论文、会议演示文档、新闻报道等,对古籍特征资源建造与同享现状进行调研,以期为往后古籍特征库建造及同享供给主张。
1.8所高校古籍特征库建造现状
本研讨中的香港8所公立大学包含香港城市大学、香港浸会大学、岭南大学、香港中文大学、香港教育学院、香港理工大学、香港科技大学、香港大学。除香港教育学院、香港理工大学以外,其他6所高校均对古籍进行了数字化,并逐渐树立古籍特征库。其间以香港中文大学、香港科技大学、香港大学等建造的古籍特征库最为丰厚,见表1。
2.香港高校古籍特征库特征剖析
2.1统筹规划,有方案进行
古籍的特征库建造是一项长时刻而艰巨的工程,包含古籍的清查、整序、数字化、研讨与开发等许多内容。香港几所高校的古籍数字化作业大大都没有国家或政府层面的统筹规划,每个高校的研讨机构或图书馆根据单位古籍藏书情况,将古籍特征库建造作为一项长时刻的、有方案的项目来进行,对作业进行长时刻规划,分阶段拟定具体的作业方案,发布详尽的作业流程与规范,并及时将工程发展、取得作用对外发布。
如香港科技大学图书馆“About Rare&SpecialeZone”(http://lbezone.ust.hk/rse/about)就是对正在进行与现已完结的古籍特征库项目树立的专门介绍网页,介绍古籍特征库的由来、典藏的规模与内容,以及项目发展情况等。
2.2古籍规模广泛
在我国大陆区域,古籍是指1911年曾经(含1911年)在我国书写或印刷的书本。而香港因为前史原因,受西方影响较大,在古籍时刻约束上没有1911年这个时刻节点的约束,一般以时刻超越100年的资源就作为古籍来处理。香港高校搜集古籍的规模除了我国传统古籍外,一起也搜集了西方出书的一些古典作品,以及日本、韩国的古籍。如香港城市大学图书馆树立了“英国法令特藏”书库(http://www.cityu.edu.hk/lib/collect/law/englaw/chinese sc.htm.),以录入1900年曾经出书的英国法令珍本书为主,一起也录入北美、英联邦国家与法令相关的哲学、社会科学、言语、文学等古籍。香港大学冯平山图书馆保藏的古籍以中文古籍善本、日文古籍为主,是国际闻名的东亚文明研讨中心。在古籍的类型方面,大陆区域以书为主,而在香港区域的古籍规模相对广泛,类型包含多样,如线装书、卷轴、甲骨、舆图、竹简等,乃至是现代文献中常见的图书、期刊、图片等。
2.3经费来历多元化
古籍特征库的建造与维护需求花费很多的人力、物力与财力,故经费问题是特征数据库建造傍边不得不考虑的问题。与内地高校特征保藏数字化经费首要来历于政府部门或专门机构等不同,香港高校古籍特征保藏的数字化与特征库的树立经费来历途径更为丰厚,首要有以下3个来历。
2.3.1自筹 自筹经费是香港高校古籍特征库建造资金的首要来历,也可见香港各高校正古籍数字化十分注重。如香港浸会大学的“基督教古籍数据库”,由香港浸会大学图书馆与香港浸会大学校牧处协作树立。
2.3.2政府或行政部门赞助 如香港中文大学我国文明研讨所树立的“汉达文库”(http:llwww.cuhk.edu.hk/ics/rccat/database.html)包含多个子库,不同的子库其赞助来历不同。比方,1994年取得“大学及理工拨款委员会”赞助,树立了“竹简、帛书出土文献数据库”;1996年取得“香港大学拨款委员会”赞助,展开“甲骨文全文数据库”研讨方案;1999年又得到“香港研讨赞助局”拨款赞助,展开“金文全文数据库”建造;2000年得到“香港研讨赞助局”拨款,树立我国古代类书计算机化数据库。
2.3.3个人赞助 例如香港科技大学古籍系列特征库的首要经费来历于意得集团有限公司高佩璇博士300万港币捐款,捐款首要用于建筑一个敞开的图书馆特藏与大学档案展览厅,别的一部分是用于3年内把特藏扫描成高分辨率的数字文档。
2.4数字化水平高
香港高校正古籍的收拾早于20世纪90年代初,但数字化的作业大多在21世纪才开端进行。此刻古籍的数字化现已到达必定水平,因而,香港各高校的古籍数字化可学习的阅历以及技能比较多,古籍数字化起点较高。各高校树立的古籍特征库除了阅览的功用外,大多能够进行检索,并且古籍页面明晰,辨识度高,有利于教育与研讨。如香港中文大学我国文明研讨所与图书馆协作开发的“汉达文库”,从1989年创立至今,阅历了20多年,尚在不断完善傍边。其间“甲骨文材料库”是将7种甲骨要籍中所录入的甲骨文字从头描摹,并加校勘、释文,在窗口体系上,可一起显现甲骨文字原字形及隶定释文(隶定古文的意图是让后人知道和读懂古文,其做法是以隶书或楷书的笔法来写古文的字形,或以己释的部分结构来组合古文整字。它是古文字考释的前期进程。隶定古文有时以“释文”的身份出现,但它与古文并不能一一对应);“金文材料库”以《殷周金文集成》为材料,分设汉字部首和原形部首2种检索法,释文分A、B两种方法显现:释文A根据铭文原本方位,以隶定字对应显现,便利读者了解铭文原貌;释文B以隶定字次序显现,并加句读;供给金文原形字和释文点击对应显现;附有金文的年代、出土、现藏、著录等材料。
2.5元数据规范
自建特征库最杰出的问题之一就是元数据的规范化问题,元数据的规范化、规范化有利于材料特别是数字化古籍材料的沟通、整合,以到达最大规模的共建同享。为了完成文献资源的共建同享,1967年树立的香港高校图书馆咨询委员会(JULAC)发起了“中文称号规范协作方案”与“中文材料编目同享项目”对中文材料编目进行规范化处理。“中文称号规范协作方案”树立了人名、集体称号、会议称号、一致落款及丛编落款的一致规范,以及多语种、多脚本的一致数据库。“中文材料编目同享项目”则树立了CNMARC、CMMARC、LC CJK MARC三者整合的元数据库,在不改动各成员馆编目习气的根底上,完成编目数据的共建与同享。一起8所高校运用相同的图书办理体系innopac,使馆际之间的协作更为便利与简略。
2.6注重共建同享
香港各大学在古籍特征库建造方面注重与大陆、台湾、澳门等区域的协作。如联合目录建造方面,香港中文大学冯平山图书馆与香港中文大学图书馆均参加了台湾国立图书馆牵头树立的“中文古籍书目材料库”的建造。香港中文大学从2007年开端,参加了“中美百万册书数字图书馆协作方案”(即高等学校中英文图书数字化国际协作方案,CADAL),将1923年曾经出书的超越3000本西方言语书本进行数字化,还能同享超越65万册民国时期出书的书刊。在全文同享方面,香港城市大学的“汉古籍特藏”、香港浸会大学的“基督教古籍数据库”等都可从网络上免费检索与阅览全文。不只如此,香港高校的古籍特征库活跃在国际各敞开获取常识库中注册,以便更大规模的同享。如香港中文大学的“我国古籍库”(http://udi.1ib.cuhk.edu.hk/p rojects/chinese-rare-bookdigital-collection/open-access?language=zh-hans)分别在BASE、Directory of Open Access Repositories(OpenDOAR)、OCLC WorldCat OAIster、OpenArchives Initiative、Registry of Open Access Repositories等敞开获取渠道中注册,供全国际古籍爱好者阅览与研讨。
2.7注重版权问题
关于能够在网络免费运用的古籍特征库,香港高校图书馆都对资源运用时的版权作了不同程度的声明,奉告读者应恪守的相应规矩。如香港城市大学图书馆在读者运用特征库之前,将其有必要恪守的运用条款先出现出来,读者只要在承受相关条款后方可运用相关的特征库,在运用条款中明确规矩了运用规范、版权、撤回方针、声明、联络方法等相关内容。香港科技大学图书馆对古籍特征库的运用条款中则明确规矩,古籍特征库的运用不得用于商业意图或衍生物性作业,假如超出该规模,需事前提交请求,以便合理合法运用古籍特征库资源。
3.香港高校古籍特征库建造与同享的启示
3.1立足于本馆保藏,注重办理与运用
跟着人们对古籍文明价值与经济价值的了解,古籍作为一种稀有资源,获取越来越困难,与其花费很多的资金在购买古籍上,不如根据现有保藏,注重其办理与运用,发挥古籍应有的价值。香港各高校的古籍特征库资源多来历于本馆已有的保藏,后期的古籍首要来历于私家捐献或交流,各高校大大都设立了特藏部,担任保管与数字化处理古籍等特征保藏,以期最大程度使古籍被读者查询与运用。相比之下,大陆虽然有不少高校具有丰厚的古籍,但整体来说,数字化程度不高,大大都只能供给书目或概要信息查询效劳,大都不能进行全文阅览或全文阅览受限,更不能进行全文检索;还有一些高校的古籍置之不理,或仅供少数人运用。因而古籍的办理与运用是应该注重的方向。
3.2注重古籍研讨及专业人员培育
古籍的数字化与古籍特征库的树立不是简略的扫描与电子化进程,而是在研讨的根底上,对古文献的从头提取与收拾。古籍选用文字竖版摆放,且无句读,在录入与辨认时需求古籍处理人员有必定古文献的常识,才干保存古籍的原貌。别的,古籍对现代人来说内容不流畅难明,缺漏字现象一般存在,古籍版别很多,在数字化进程中均需求古籍特征库建造者对古籍有必定的研讨根底,才干精确反映原作者的思维,保存作品原本风格。因而古籍特征库的树立需求融入研讨作用,才干真实树立起超卓的数据库。香港中文大学的“汉达文库”“走马楼三国吴简,嘉禾吏民田家莉材料库”等均树立在研讨的根底上,汇集了多方的研讨作用,这样的古籍特征库使读者不只能看到古籍的原文,并且一起能参阅研讨者的研讨作用,更好地了解古籍、学习古籍、运用古籍。别的,古籍特征库的建造亦要注重专业人员的培育,特别是古籍研讨人员与古籍数字化专业人员的培育,使真实懂古籍的专业人员来树立专业的古籍特征库。
3.3留意古籍特征库规范建造与运用
古籍特征库的规范问题一直是困扰古籍共建同享的要害根底性问题。现在,在古籍字符方面,有ISO/IEC 10646规范能够参阅,以满意简体字、繁体字、异形字及难字的编码问题;在计算机处理方面有Unicode供给支撑,完成计算机跨言语、跨渠道的文本转化及处理;在元数据方面,国内现已有由我国高等教育文献保证体系(China Academic Library&Information System,CALIS)拟定的《我国数字图书馆规范规范专门数字目标描绘元数据规范》,针对具有我国文明特征的文献材料类型如古籍、拓片、舆图等,树立元数据格局及其扩展和互操作规矩等;在特征数据库建造方面,CALIS也发布了一系列的规范规范。但在国内高校中遵从以上规范者仅限于CALIS赞助下的系列专题特征库,其他古籍特征库建造者无论是著录格局仍是其他方面仍然选用各自的规范。别的,在文档格局、分辨率、文件巨细等方面均无一致规范;特征库建造与办理渠道建造多种多样。以上问题均可形成古籍特征库在共建同享中的壁垒,因而需求如CALLS乃至更大规模、更高标准的统筹与规划渠道,加强古籍特征库建造的规划与办理,为共建同享供给技能层面的保证。
3.4逐渐开发,完成全文检索
从实践运用动身,全文检索是古籍数字化的核心技能,因为现代人关于古籍的检索需求大于体系的全书阅览方法,故强壮的全文检索体系关于古籍特征库是有必要的。而全文检索的完成,对特征库的建造者来说是十分艰巨的应战。全文检索首要选用逐字标引的方法完成,而古籍的繁体字、异体字、通假字、避忌字等方法的存在,无疑使得检索作用大打折扣。别的,运用扫描仪录入原文也有必要把文字图画转化成计算机可读的字符,检索功用才干得以发挥,而Unicode界说的汉字也并不能包含现有古籍中的悉数字符,使得全文检索的完成愈加难上加难。除此之外,古籍版别很多,同名异书、同书异名等现象一般存在,地名、人名等也存在这种情况。如南京,前史上先后称为冶城、越城、金陵、建业、建康、应天等;而唐代诗人杜甫,又被称之为诗圣、杜工部、杜少陵、杜拾遗等。因而,古籍特征库全文检索的完成,既要坚持古籍原貌的完好,又要完成全文检索,应该先易后难,逐渐开发。别的,加强古籍通用常识支撑体系的树立,如人名、地名、朝代等通用常识,关于完成古籍全文检索也很重要。
3.5考虑敞开荻取
古籍资源是一种不行再生资源,并跟着时刻变迁,变得越来越稀疏。古籍存在的含义并不是置之不理或供少数人运用,最大规模地被人们运用,使陈旧的文明勃发新的生命力,才是古籍最好的归宿。要扩展古籍的运用,敞开获取是当今公认最佳的方法之一。因为联机目录的广泛运用,查询到古籍的书目信息现已不是困难的工作,但全文获取仍有困难。可喜的是,已有部分高校或研讨机构意识到敞开获取对古籍维护与运用的价值,纷繁将保藏古籍树立成古籍特征库,并在敞开获取注册渠道上注册,供全国际古籍研讨者和爱好者运用,闻名的如“哈佛大学哈佛燕京图书保藏中文善本古籍特藏”“东京大学东瀛文明研讨所汉籍印象数据库”等。往后国内高校古籍特征库的树立,也应考虑资源的敞开获取,以利于古籍能发挥出更大的价值。
