首页

浅谈铁路环境:浅谈大数据环境下的数字图书馆建造

点击:0时间:2018-10-28 15:31:32

董鹏 梁晨 葛红梅

[摘要] 跟着大数据技能的飞速开展,数字图书馆所面对的机会更大于应战。有了许多数字资源的沉积、堆集,将大数据及其技能运用于数字图书馆建造与效劳更是瓜熟蒂落。大数据为数字图书馆的开展打开了一扇新的大门。收藏信息资源运用大数据技能进行办理,可以进步检索功率与读者的效劳体会,全新的数字图书馆效劳形式逐步明晰。本文主要是对大数据环境下的数字图书馆建造的一些考虑。

[关键词] 数字图书馆;大数据环境;特征资源;信息安全

[中图分类号] G507.6 [文献标识码] A [文章编号] 1673-9701(2017)13-0160-05

[Abstract] With the development of Big Data technology, the Digital Library is facing more opportunities than the challenges. With the accumulation of a large number of digital resources, the uses of Big Data and its technology in the Digital Library resources construction and service is a matter of course. Big Data opens a new door for the development of Digital Library. Digital resources can be managed with Big Data technology, which can improve the retrieval efficiency and reader service experience, and the new Digital Library service model is gradually clear. This article is mainly about some thinking for the Digital Library construction under the Big Data environment.

[Key words] Digital library; Big data environment; Characteristic resources; Information safety

数字图书馆(digital library)不光是一项新的技能,也是社会效劳作业的立异,它起源于1993年的美国“数字图书馆开创工程(digital library initiative,简称DLI)[1]。国内,在1997年7月,“我国实验型数字式图书馆项目(CPDLP)”由国家计委同意立项,成为国家要点科技项目,由我国国家图书馆、上海图书馆、深圳图书馆、中山图书馆、辽宁省图书馆、南京图书馆、文明部文明科技开发中心一起承当,方针是树立多馆协作、互为弥补、联合共同的我国实验型数字式图书馆。该项意图施行是我国数字图书馆建造开端的标志,并由此掀开了数字图书馆建造的热潮[2]。跟着计算机技能、网络技能以及大数据的飞速开展和有机结合,数字图书馆正也在面对人物的改动:从载体多样化、结构多元化的数据集散中心到效劳多元化的特别文明场所改动。怎么有用运用收藏数据,为读者供给高效、高质量的信息咨询效劳,关键在于数字图书馆对大数据及相关技能的运用[3]。

1 大数据对数字图书馆的含义

什么是大数据?麦肯锡全球研讨所给出的界说是:一种规划大到在获取、存储、办理、剖析等方面大大超出了传统数据库软件东西才能规模的数据调集[4]。传统的数字图书馆,许多的收藏资源不光结构多元化,载体更是多样化,契合以上对大数据的界说。传统数字图书馆无法发挥大数据快速活动的特性,也不利于对大数据的发掘与常识发现。而大数据的呈现与急速开展,使传统数字图书馆在大数据及其技能的运用方面得到弥补:不光使收藏数据愈加有序化、活动更快捷,还可以运用语义、数据聚类等技能对收藏数据进行处理,既能推动收藏资源建造作业,也为读者也供给了更好的检索体会。因此,数字图书馆建造的要点应该在于数据资源的办理与运用,要跟紧大数据的开展方向,用大数据技能指导数字图书馆的建造作业[5-6]。

2 大数据环境下的数字图书馆建造

在大数据环境下,数字图书馆要长于运用网络数据,把自己融入到大数据的环境中去。一方面要整合收藏数据与网络数据,建造特征资源;另一方面要运用大数据相关技能对数字图书馆收藏数据进行处理,带动数据资源的高效运用。进步效劳质量的一起,要注重读者的运用体会,要让常识信息“行动起来”、自动找读者,而不再仅仅是人找常识。一起,也要注重数字图书馆日益凸显的信息安全问题。现在,国外如欧美等区域的数字图书馆对数字资源的整合和大数据及其技能的运用现已相对老练,而国内在此范畴的开展根本处于起步阶段,开展空间巨大[7-9]。

2.1 数字图书馆的特征资源建造

特征资源现在还没有清晰的概念,在笔者看来,数字图书馆的特征资源主要有两个方面:收藏资源的堆集和学科布景特征。数字图书馆要充分运用自己资源堆集的优势和学科优势,合理整合网络数据,构建出具有资源优势与学科专长的特征数据库,供给高层次的专业效劳。现在,网络信息供给商較多,产品同质化严峻。剧烈竞赛的一起也导致了资源糟蹋。所以,特征资源与效劳就成了数字图书馆在大数据环境下开展的方向。

图书馆特征资源建造要一手抓收藏特征资源的数字化,一手抓网络数据的收购,以收藏特征资源为主,以网络数据为辅,扩展本身优势。首要,图书馆没必要数字化悉数收藏,数字化作业要以收藏的特征资源为中心,结合本身收藏特征及学科优势,合理整合资源,构建具有明显学科特征及满意用户需求的特征数据库;其次,针对海量数据资源及用户需求的不断改动,网络数据的收购要挑选运用率高、学科开展快的相关资源;最终,还要注重收藏资源与网络数据资源的整合作业;别的还要考虑收藏情况、资金预算与网络资源的质量等问题[10]。

关于数字图书馆来说,数据资源的整合要受到注重,跟着理论和实践的不断深化,数据资源的整合机制也在不断地开展。国内关于数字图书馆的建造较晚,但开展迅速,在理论和实践中都取得了较为明显的效果,例如我国国家数字图书馆、我国高等教育文献保证体系(CALIS)、国家科技图书文献中心(NSTL)等成绩斐然。国外由于具有信息技能方面的优势,数字图书馆信息资源办理方面的效果对国内的研讨有很大的参阅含义。比方,英国长时间保存办理者数字化效劳(Conservation Manager Digitization Services)、加拿大政府敞开政府工程(Open government project in Canada)、欧洲数字档案文件和常识保存项目(European Archival Records and Knowledge Preservation)、加拿大图书馆和档案馆数字标识项目(LAC DOI)等[11]。

2.2 大数据相关技能

大数据技能不光在概率计算、趋势剖析、客户研讨等方面有着超卓的体现,在图情范畴也具有其它技能所无法比拟的优势[12]。在大数据环境下的数字图书馆建造中,数字资源的整合与运用是十分重要的作业,将大数据技能,例如数据发掘、语义技能、数据聚类等,运用于数字图书馆的建造中,既有利于数字资源的建造,又可以进步数字图书馆的效劳质量,是国内外一切数字图书馆建造的要点内容。

2.2.1 数据发掘 作为高新技能,数据发掘是数据库常识发现的重要进程,一般是指运用计算机经过算法从许多、杂乱、随机的数据中查找躲藏信息的进程,而常识发现可以理解为更广义的数据发掘。数字图书馆是数据库也是常识库,经过数据发掘技能,将数据运用从简略检索上升到剖析和研讨的高度,有用途理数字图书馆具有丰厚资源却运用率低下的情况。一起,数字图书馆中的数据发掘是对常识的有用重组,为数字图书馆的资源建造供给关键技能[13]。

作为当时国内外数字图书馆研讨的热门,日益老练、完善的数据发掘技能成为了数字图书馆建造的新东西,在理论研讨和实践方面受到了越来越多的注重,它可以有力的支撑数字图书馆领导层的决议计划、办理;一起,确保数字图书馆资源建造的科学性和合理性,对读者效劳和数字图书馆的开展有重要的效果。尽管数据发掘在数字图书馆范畴起步不久,有不少问题正在研讨、处理,但它在数据的安排剖析和常识发掘方面的开展势头和体现是令人必定的。数据发掘技能也是数字图书馆运用其他大数据技能的根底,应当对这门技能给予满意注重[14]。

现在,数据发掘技能现已用在数字图书馆的不少方面。例如,经过数据发掘、常识剖析和重组,可以进步检索功率和命中率。经过对出版物关键词的发掘、剖析,可以把握历年的研讨热门,以及相应学科的开展轨道,可以及时推送、推介给同范畴的读者。数据发掘可以用于读者信息,经过对读者的专业布景、研讨方向、借书记载、检索恳求等信息的收集、剖析、发掘、聚类等,首要可以得知得收藏资源的运用频率;其次可以作为文献质量评价、数据资源收购的参阅依据;最终也最重要的是,可以發现读者对常识点的需求情况,进而供给读者个性化效劳、供给学科信息咨询等特征效劳。这对数据资源的建造和布局极具指导含义[15]。

2.2.2 语义技能 对数据来说,语义就是指数据的含义。当数据被赋予含义后,数据就转化为可以被运用的信息。数字图书馆许多、杂乱的数据本身就包括各种常识和含义,十分合适用语义技能对这些数据进行安排、办理,对数据常识进行描绘、发现和提醒,然后精确、有用地表达数字图书馆资源,也是数字图书馆进行数据常识的发掘和运用的根底[16-17]。

数字图书馆要研讨运用语义技能,构建数据资源间的语义网络,然后促进数据资源的常识扩大和常识发掘。在数字图书馆中,图书分类法、主题词表等东西本身就由语义联系构建的。尽管运用这些东西构建了数据资源的语义联系,却没有触及收藏资源内部常识点语义网络的构建。可是大数据环境下的数字图书馆对这一点提出了要求。语义网络便利读者的检索,读者可以运用这张“大网”容易捕获所需常识[18-19]。

有查询研讨显现,国外对语义技能的研讨比较深化,欧美一些发达国家近年来在数字文明资源的语义相关数据模型构建、数据语义相相联系、语义相关技能等方面的研讨开展迅速,相关研讨现已进行体系研制,许多研讨效果也相继运用于实践并开宣布比较老练的依据语义技能的数字图书馆效劳体系,如Ex Libris公司的Vendors体系和欧洲数字图书馆所选用的相关数据模型等。而国内对语义技能的研讨处于起步阶段,研讨效果多是从理论层面讨论语义技能在数字图书馆中的详细运用,运用语义技能相关数据的实践经验不足[20]。

2.2.3 数据聚类 简略的说,数据的聚类就是指把数据目标分为性质、特征附近的若干类,别离聚合在一起的进程。大数据环境下,面对许多、杂乱、随机的数据,真正被有用运用的数据是较少的,而聚类技能为这小部分数据的高效运用供给很好的途径。运用于数字图书馆的数据聚类就是对常识语义的逻辑重组,效果于语义网络的树立、扩展、运用,也是数据发掘与常识发现的重要环节。经过依据语义的聚类,为数据的一致描绘与常识的聚合供给切入点,将会在信息效劳、数据常识发掘、发现中发挥效果。聚类技能经过不同的算法,如相关规矩、K-均值算法、FCM聚类算法等,可以进步检索命中率、查全率和用于高质量资源的发现等[19,16]。

大数据技能可以理解为一系列数据处理技能的总称,数据发掘、语义网络、数据聚类等技能在数字图书馆范畴运用较多,而且是相得益彰的。跟着数字图书馆建造作业的逐步深化和读者对效劳需求、水平的进步,更多的大数据技能会被运用于数字图书馆范畴,继续拓宽数字图书馆的收藏数据资源,提高数字图书馆的效劳水平,丰厚数字图书馆的产品与功用[19]。

2.3 数字图书馆的信息安全

由于数字图书馆具有数字化、网络化、敞开化等特征,所以在为读者供给便利快捷的效劳一起,不可避免的面对着信息安全问题,并跟着数字图书馆的开展日益严峻。依据信息安全办理国际标准ISO27000,可以对数字图书馆的数据信息安全进行界说:数字图书馆的数据信息安全,就是要确保数字图书馆各种数据的保密性、完整性和可用性,使得数字图书馆供给给读者的数据信息具有真实性、可核对性、抗狡赖和可靠性[21-22]。

数字图书馆的数据信息,是供给各种效劳的根底。不论是印本收藏、收购的网络数据、收藏特征资源、书目信息仍是读者借阅记载等,都是图书馆作业者多年的辛苦和支付,一旦由于天然要素、体系故障、设备损坏等原因此永久丢掉,不光图书馆作业和效劳陷入困境,更形成资源的巨大糟蹋。在进行数字图书馆安全办理时,不光要考虑天然要素、人为要素等的损坏,也要保护数据不会被偷盗和不合法运用;不光要确保读者运用时可以精确、迅速地获取所需数据信息,还要确保读者隐私安全而不被侵略;不光要保证网络安全,更要注重信息安全。数字图书馆的安全办理是项综合性的工程,应结合数字图书馆的运用、人员、办理、硬件、软件等多个环节进行考虑,提出综合性的处理方案[23-24]。

别的,信息安全意识也很重要。在2015年与2016年期间有查询标明,我国公民在网络信息安全技能方面尽管有所提高,可是网络信息安全意识依然单薄,所以培育数字图书馆读者的安全意识也应该引起注重[25-26]。

3 数字图书馆建造的其他问题

数字图书馆的建造是一个综合性的工程,意图在于为读者供给更好的效劳,数字资源建造仅仅数字图书馆建造的核心内容。从数字图书馆的建造全体考虑,笔者以为以下方面也要多规划。

3.1 合理规划印本资源建造

数字图书馆是由传统图书馆为根底开展而来,堆集的印本资源也是名贵的常识财富,可以加强数字图书馆对回溯数据的建造,并非现已全无用途。一起,做好印本资源建造不光可以满意传统读者(尤其是中老年读者)的需求,也能加强图书馆的战略资源保证含义,对“科教兴国”有重大含义。

3.2 数字图书馆实体空间的运用

跟着数字图书馆的建造,许多印本书本或数字化或被网络数据替代,所以印本书本许多下架并腾退许多实体空间。数字图书馆实体空间的布局要进行合理规划、立异安置,比方设置歇息室、读者沟通空间、宣扬教室、计算机室、自助打印机等。让数字图书馆既能供给长途智能效劳,也能供给实体阅览空间;既有当地安静的查阅材料,也有当地剧烈的沟通争辩。数字图书馆并不是一味的高科技加成,更需求多方面的相得益彰。

3.3 加强数字图书馆的形象建造

数字图书馆完全可以运用本身学科优势、人员优势、资源优势,定时举办学术讲座、检索训练、信息获取技巧、科学常识遍及等活动活跃宣扬自己的效劳与产品,面向目标不仅仅专业的科研人员,也面向人民大众。逐步改动数字图书馆是“上网查材料、上自习的好当地”的观念,在读者心目中树立起能读、能查、能沟通、能歇息、以人為本的“多元化文明广场”的数字图书馆新形象。

4 结语

跟着大数据年代的到来,大数据给数字图书馆带来的不仅是应战,更是一种机会,具有较高效劳水平与资源建造才能的数字图书馆会成为业界排头兵,带领数字图书馆的向前开展。许多、杂乱的数据检测着数字图书馆与时俱进的才能,不断更新的大数据技能为数字图书馆建造的有力支撑和保证,大数据环境下的数字化图书馆建造,有用促进了数据的同享,使海量信息更快、更好地传达;大数据技能关于数据的处理,可以优化和深化数字图书馆的效劳功能,满意读者对检索成果的更高要求,这既是本身建造的需求,又是信息技能潮流影响下的必然成果。可是,数字化图书馆的建造不光需求投入许多的人力、物力和专业技能,还要紧跟大数据技能前沿,这需求长时间而且继续的用大数据思想审视数字图书馆的建造,使未来数字图书馆在大数据环境下不断立异。

[参阅文献]

[1] 李更良,朱树金.数字图书馆的界说及构成要素剖析[J].晋图学刊,2003,(1):24-26.

[2] 数字图书馆;百度百科;2017年4月10日;[http://baike.baidu.com/linkurl=PvHCt5ciPOITbrukul4coAVboYIJJwYh A3CY_P7ApVAKG58bkoTo1F22hhWa89gMHQdfd0MygQ hT8iMo1oQgbmWeucaNNRSaFdQPbNimlIm3fEuo 9W-aV2 NnhnECrD9I0q2meaONDTETW1qbPxiXja]

[3] 孙一钢.交融、立异、引领——论信息技能在图书馆开展中的定位和效果[J].图书馆理论与实践,2015,(3):1-5.

[4] 张安法.大数据年代要有大数据思想;我国军网;2017年4月10日;http://www.81.cn/gfbmap/content/2015-06/25/content_114878.htm#.

[5] 余显红.试析大数据年代数字化图书馆的建造与开展[J].我国办理信息化,2016,19(13):193-194.

[6] 黎建辉,沈志宏,孟小峰.科学大数据办理:概念、技能与体系[J].计算机研讨与开展,2017,54(2):235-247.

[7] 刘炜.关于“下一代图书馆体系”的考虑[J].国家图书馆学刊,2015,24(5):7-10.

[8] 王曰芬,李冬琼,靳嘉林,等.近十年图书情报范畴的研讨情况及其大数据年代的研讨趋向[J].情报材料作业,2017,38(1):17-24.

[9] 杨海燕.大数据年代的图书馆效劳浅析[J].图书与情报,2012,(4):120-122.

[10] 张承宏.大数据年代数字化图书馆的建造[J].新媒体研讨,2015,1(20):74.

[11] 常广炎.数字图书馆信息资源整合根究[J].电脑编程技巧与保护,2017,(5):54-55,60.

[12] 谭影虹.从数字图书馆到数据图书馆——大数据年代的图书馆效劳范式改动[J].图书与情报,2016,(3):75-78.

[13] 王红.数据发掘在数字化图书馆中的运用研讨[J].农业图书情报学刊,2016,28(1):39-41.

[14] 鲁昉.依据数据发掘的数字图书馆检索技能研讨[J].信息技能与信息化,2015,(3):172-174.

[15] 舒予,张黎俐.依据数据发掘技能的数字图书馆个性化效劳[J].常识经济,2015,(5):24.

[16] 张建红.依据语义相关的海量数字资源常识聚合与效劳研讨[J].图书馆作业与研讨,2016,1(8):44-47.

[17] 贺德方.依据语义的数字图书馆效劳立异[J].情报学报,2012,31(10):1012-1017.

[18] 王露露,徐军华.语义网环境下的数字图书馆效劳立异[J].图书馆理论与实践,2016,(1):88-90.

[19] 苏新宁.大数据年代数字图书馆面对的机会和应战[J].我国图书馆学报,2015,41(6):4-12.

[20] 王萍,黄新平.依据相关敞开数据的数字文明资源语义交融办法研讨——欧洲数字图书馆事例剖析[J].图书情报作业,2016,60(12):29-37.

[21] 郑德俊,任妮,熊健,等.我国数字图书馆信息安全办理现状[J].现代图书情报技能,2010,26(Z1):27-32.

[22] 任妮,黃水清.新版ISO27000要求下的数字图书馆信息安全办理[J].图书与情报,2015,(6):38-46.

[23] 李广建.从办理视点根究数字图书馆信息安全的处理之道——《数字图书馆信息安全办理》评论[J].数字图书馆论坛,2012,(3):69-70.

[24] 李文渊.谈数字图书馆的网络信息安全[J].图书馆论坛,2003,23(1):54-56.

[25] 《我国信息安全》编辑部.我国发布首个《大众网络安全意识查询报告(2015)》[J].我国信息安全,2015,(6):77-80.

[26] 《网络传达》编辑部.当时大众的网络安全意识查询[J].网络传达,2016,(10):42-45.

(收稿日期:2017-02-06)

相关资讯
最新新闻
关闭