中医古籍数据库 2004—2014年中医古籍数据库建造研究进展
漆胜兰
摘要:中医古籍是中华民族几千年防病治病的智慧结晶,是我国传统文化的名贵财富。本文归纳了2004-2014年中医古籍数据库的开展情况,提出存在的问题,并对未来研讨思路进行了论说。
关键词:中医古籍:数据库:建造:总述
中医古籍是中华民族几千年防病治病的智慧结晶,是我国传统文化的名贵财富。古籍数字化是指运用现代技能将古籍中的文字或图画信息转化为能被计算机辨认的数字符号,构成书目数据库、全文数据库和常识库,然后完结古籍收拾、存储、检索、阅读、传输等意图,到达维护、运用和发掘古籍常识的成效。经过数字化处理,既能够完结对名贵古籍的保存,又可完结资源同享,传承中华文明。古籍数据库建造是古籍数字化的一种办法,本文对2004-2014年间国内外中医古籍数据库的建造进行总述。
1 中医古籍数据库现状
1.1 中医古籍数据库的建造办法及现状
陈力以为我国大陆古籍成规划的数字化作业根本上是由教育和研讨机构、图书馆、商业机构这3个类型的部分完结。从现在的数字化效果来看,中医古籍数字化建造办法首要有书目型数据库、全文型数据库、全图画型数据库、图文型数据库、古籍常识库。
1.1.1 中医古籍书目型数据库书目型数据库是将古籍书名、著者、版别、卷次、摘要、出书年等信息输入计算机而构成的数据库,读者能够经过书名、著者等检索到某古籍的相关信息。该类型的代表是我国中医科学院中医药信息研讨所的“全国中医药珍善本古籍档案管理系统”、“海外古籍书目数据库”,及我国中医科学院图书馆的“收藏中医古籍目录数据库”。
现在国内有必定中医药古籍藏书规划的医学院校、科研机构、图书馆也都相继进行了书目数据库的建造,如北京中医药大学图书馆的“中医药古籍书目数据库”、上海图书馆的“古籍书目数据库”和“中医古籍善本书目概要”、大连图书馆的“特征收藏古籍线装书目库”、北京大学及多家图书馆的“CALIS(我国高等教育文献保障系统)古籍联合目录”、上海中医药大学图书馆的“善本书目概要数据库”、浙江中医药大学图书馆的“收藏古籍目录数据库”、山西中医药大学图书馆的“古籍书目数据库”、山东中医药大学图书馆的“占籍书目数据库”等等。但因国内没有一致的建库规范,各种书目数据库提醒的深度不一样。
1.1.2 中医古籍全文型数据库全文型数据库是将古籍全文手艺录入,构成电子文本,供用户查询。这种数据库存储空间小,便于检索和阅读,可是没有坚持古籍原貌,且文字录入有难度,简略犯错。中医药古籍含有穴道、图谱等信息,数字化的困难更大。台湾高雄市立中医院的“中医古籍文献全文检索系统”和由湖南电子音像出书社出书的光盘版《中华医典》就是典型的全文型数据库。
1.1.3 中医古籍全图画型数据库 全图画型数据库是将古籍直接以图画格局扫描存储,参加简略标题和分类,能保存古籍原貌,有助于专业研讨,可是这种数据库存储空间大且不便利检索。如武汉大学出书社开宣布的《四库全书》光盘版就是以文渊阁本《四库全书》为蓝本,扫描全书,手艺录入总目。
1.1.4 中医古籍图文型数据库 图文型数据库是运用图画处理技能与超链接技能结合构成的数据库,即在古籍册页图画化的根底上,将书中具有检索含义的信息转化为电脑可辨认的文字,并加以适宜的软件东西,为用户供给便利有用的检索、计算、收拾和修改功用。这种数据库能再现古籍原貌、便利检索,是现在古籍数字化的最佳办法。我国中医科学院中医药信息研讨所的“中医药珍善本占籍多媒体数据库”和由北京大学刘俊文教授总策划、总编纂的《我国根本古籍库》(医书集成)可为此类代表。
1.1.5 古籍常识库 古籍常识库是人工智能和数据库结合的产品,它以一致的办法存储常识。常识库的常识是高度结构化的符号数据,用户能够进行深层次的常识发掘,完结由书目到全文等多个常识点的相关检索,也能够由一个作者检索到其他相关作者等。我国中医科学院我国医史文献研讨所中医古籍数字化研讨室的“中医药古文献常识库”是其代表。该常识库构建了我国第一个中医古籍常识库系统,现在现已建成中医古籍本草常识库、中医古籍丹方常识库,以及张仲景、陈士铎、新安医学、妇科、医案、蒙医药等6个中医古籍专题常识库。
1.1.6 国外中医古籍数据库 国内的中医古籍数字化取得了一些效果,国外中医古籍数据库也在建造中。虽然在建造规划和包含资源上与国内有些距离,可是也具有特殊的含义和价值。例如日本的全文数据库“全国汉籍数据库逐个子部医家类”“数字化善本书——医学”“民族药物资料馆——证类本草”,加拿大的“中医在线图书馆”以及美国的全印象数据库“YiJing: The mlrror of medicine”等等。
1.2 中医古籍摄生数据库的现状
古今来往,健康长寿是人类的美好愿望,摄生保健是人们永久的论题和社会重视的热门。特别是近年来,跟着科学的开展和生活水平的进步,人们自我保健认识和摄生要求逐步进步,中医摄生学显示出强壮的生命力,我国数千年堆集的摄生法备受国际喜爱。我国摄生学内容广泛,办法很多,摄生论著卷帙浩繁,有的是摄生专著,有的则是部分章节论说摄生,更多的是散见于各类作品中,如道教、释教、史学典籍等,未构成一个全面、系统的学科。中医古籍数据库的建造方兴未已,取得了必定效果,如《中华医典》以及“我国中医药数据库”“我国古籍资源数据库”“龙语瀚堂典籍数据库”都录入了很多中医古籍,可是关于摄生类的专题数据库开展还比较缓慢。如现在中医古籍数据库傍边录入最全、规模最广的电子资源文献库“龙语瀚堂典籍数据库”所录入的中医药文献达700多部近10000册,只在中医药类录入摄生类古籍35种。巨型数字古籍丛书《我国根本古籍库》录入了上自先秦、下至民国的历代典籍10000余种,其间休闲摄生目录入28部,功夫技击目录入14部,气功健身目录入11部。现在,南京中医药大学的“气功根本古籍概要库”是以专门的气功、扶引、摄生作品为首要内容的数据库,归于气功摄生的专题库。我国中医科学院中医药信息研讨所建造开发的“中医古籍摄生数据库”录入摄生古籍110种,并可阅读全文图片。
2 中医古籍数据库建造存在的问题
2.1 中医古籍书目搜集及录入
中医古籍数量大,版别多,全面搜集版别优秀的古籍是古籍数字化中的一大课题。古籍图书印刷格局多样,出书办法随意,多处标有正落款且遍地书名不尽相同,编目人员需求对各种书名信息进行剖析、考虑,方能精确而规范地著录正落款。别的,摘要由编目人员编写,编目人员的责任心和相关专业常识,如对古籍中同药异名、异药同名,古籍中的病证和现代病名等常识的把握,也直接影响书目数据的质量。
2.2 中医古籍用字
古籍数字化建造难度大,其间面对最多的问题是有关用字的问题。据查,《康熙字典》收字就达49 030个。汉字在绵长的演化过程中发生的繁简字、异体字、古今字、通假字就更不计其数了。中医古籍数字化现在面对着无古籍大字库、古籍生僻字录入、古籍光学字符辨认系统(Optical Character Recognition,OCR)辨认、古籍排版等几个难题。陈进等以为发生这些现象的原因首要是对字体的认知妨碍和技能妨碍。高晶晶以为能够经过私用区造字法、图片替代法、自然语言描绘法、动态组字法等办法在必定规模内处理古籍阅读和检索用字的问题。
2.3 中医古籍数字化规范没有树立
协作与同享是中医古籍数字化开展的趋势,文献规范化是文献资源同享的条件和根底。古籍数字化,需求规范的著录法令、数据库格局、编目软件运用字库,还要一致的古籍分类法。可是中医古籍数字化规范没有树立,国内至今未构成一致的古籍分类法。曾燕以为应以《四库法》(即按经、史、子、集分类)为根底,拟定完善的古籍分类法。刘文波等以为《全国中医图书联合目录》的分类系统,根本上包含了现存中医古籍的首要品种,比较契合读者“以类求书”的运用习气。李兵以为中医古籍数据库内容、检索功用、辅佐功用和效劳功用这4个要素能够作为中医古籍数据库的点评要素和一级方针。
2.4 中医古籍数字化的开发深度
符永驰等以为中医古籍数字化不该只是满足于对古籍的阅读和查询。刘毅以为在数据库和网络遍及的年代,运用现代技能手段,发掘中医古籍的内在常识很重要,可是现在因为各种因素的影响,数据库不具备古籍常识深度发掘的功用,从这方面来说,专业的中医古籍数据库尚处于初级阶段。古代中医药文献是一个常识宝库,在数字化的根底上发掘古籍中的名贵常识财富,完结常识发现和常识拓宽,更好地为中医药工作的开展和人类健康效劳是中医古籍数字化的最高方针。
除上述内容以外,技能手段落后、经费限制等等也是中医古籍数据库建造中存在的问题。
3 总结与展望
中医古籍数字化现已取得了必定效果,树立了不同类型的数据库,在很大程度上完结了维护和运用中医古籍的意图。可是数据库建造中的用字问题、数据库建造规范及数据库常识的深度发掘问题依然有待研讨。一起,摄生学作为中医的一个重要学科,其数据库建造仍有待加强,构建数量多、版别完全、信息包含量大的古籍摄生数据库有侧重要的现实含义和学术研讨含义,对中医摄生学科的内在外延的界定具有促进作用。在树立信息包含量大的古籍摄生数据库的根底上,从小处着眼,侧重研讨新安医籍中的摄生古籍,树立数据库,研讨其与前人、同年代及后世之间的学术承继、学习和影响,可操作性强。作为中医古籍数据库建造的一部分,摄生类古籍文献的收拾与数据库开发有待进一步拓宽与深化。总归,在计算机及网络技能不断兴旺的今日,中医古籍数据库的建造会有更大的开展前景,会为中医传承做出更大的奉献。