首页

山东省图书馆收藏 大数据年代图书馆收藏数字资源整合与存储战略剖析

点击:0时间:2024-04-20 10:35:19

王震宇 王宁

摘要:大数据年代图书馆收藏数字资源进行整合,是信息安排主动化、动态性、多形式的需求,也是信息安排的标准化、易用性的需求。图书馆收藏完成数字存储,可认为资源同享供给技能确保,便于文献资源的同享运用。文章提出了收藏数字资源整合战略,并规划了存储体系。

关键词:大数据年代;图书馆;收藏数字资源;资源整合;存储

中图分类号:G250.71 文献标识码:A 文章编号:2095-5707(2017)03-0035-04

Abstract: The integration of digital resources in the library collection in the era of big data is the need of automatic, dynamic and multi-mode information organization, and it is also the need of standardization and ease of use of information organization. The achievement of digital storage of library collection can provide technical support for resource sharing, and easy to sharing and use of literature resources. This article put forward to the strategies of digital resource integration and designed the storage system.

Key words: era of big data; libraries; digital resources of library collection; resource integration; storage

隨着新式的物联网技能、云核算技能以及交际软件的快速开展,衍生数据的增长速度惊人,网络中存有海量数据,这些都预示着大数据年代的降临。人们的出产、日子现已离不开数字化信息,而在海量数据中挑选出有用数据的相关技能现已成为专家学者要点重视的问题[1]。值得注意的是,作为传统图书信息资源供给者的图书馆也应与时俱进,测验获取更为精确、有用的数据信息,为用户供给高质量的效劳。显着,图书馆方面应该依托海量图书资源渠道,将大数据处理技能与图书馆效劳理念进行严密结合,活跃探求数据的获取、收拾以及存储等技能,为用户供给愈加有用和人性化的效劳。

基金项目:2016年度安徽省教育厅高校人文社会科学研讨要点项目(SK2016A0254)

榜首作者:王震宇,馆员,研讨方向为读者效劳。E-mail: Daisj80@163.com

为应对数据量不断增大的多类型信息资源,图书馆引进了数字资源存储和整合技能,以确保数据处理的优质、高效。

1 大数据年代图书馆收藏数字资源整合的必要性

1.1 数字资源整合是信息安排主动化、动态性、多形式的需求

传统图书馆收拾材料时是用人工方法,对各类书本材料进行标示、分类和收拾,并且检索的关键字都是需求繁琐的手工劳动进行收拾和录入。现在,网络上的许多数字资源(比方多媒体材料,文本材料)都具有很强的时效性,假如用人工方法进行收拾,必然会影响材料运用的效果,所以,数字资源的主动标示、主动分类和收拾,资源关键字的编制以及主动化办理等方面都是图书馆的要点研讨内容[2]。现在数字资源品种繁复,结构成分较为杂乱,信息化比重加大,都让以传统手工收拾方法为根底的图书馆的运用优势不再显着,数字资源的非结构化也让主动化提取资源特征的难度加大,非文本资源的收拾以及低成本化也是传统手工收拾方法难以完成的。

1.2 数字资源整合是信息安排的标准化、易用性的需求

因特网是一种将多个网络进行整合的互联网结构,网络中的数字资源是以杂乱无序的方法进行散布。信息网络是以信息为处理的根本单元,并针对信息进行存储、增加以及收拾的协作型的网络结构,网络之间的数据沟通需求各方面的支撑,因而整合网络资源的条件就是拟定一系列的信息收拾和加工的标准(比方拟定一致的数据格局、一致的索引和描绘言语)[3]。在互联网环境下,任何用户都能够轻松地运用手机、平板电脑及个人核算机等终端拜访数字图书馆渠道并进行操作。考虑到用户的软件操作水平良莠不齐,在规划渠道功用时要尽量做到简练有用,使普通用户能够十分方便地检索到所需的数字资源,进步渠道的运用效果。

2 大数据年代图书馆收藏数字存储的含义

2.1 为资源同享供给技能确保

在整合和办理图书馆收藏资源后,图书馆还需求凭借先进的信息处理技能来保护和存储图书文献资源,尤其是十分稀缺的光盘制品和微缩文献制品等。因为选用的存储技能具有运转稳定性高、技能老练、寿命长、运用面广及密度大等优势,所以能够测验将简易信息聚合(RSS)技能、标签技能以及Web2.0技能等运用在图书馆存储作业中,然后协助图书馆完成用户信息推送效劳、用户个性化定制效劳、扩展检索效劳、新书发送效劳及相关信息链接效劳等[4]。正是因为上述技能支撑供给的效劳,才使图书馆与用户的互动沟通存在有利环境,让用户有更多时机参加到信息沟经进程中,并依据个人的信息需求来获取相应的信息资源效劳。

2.2 便于文献资源的供给运用

许多历史文献资源极端宝贵,尤其是孤本,不可能满意用户的阅览需求,并且彼此传递阅览不可能完成,而将其数字化,则能够满意读者的阅览需求。别的,假如1本16开的书本有1000多页,经过数字化处理之后就能够运用6张微缩平片进行存储,并且这些平片能够直接进行传送阅览。当然,关于音像制品、微缩制品以及光盘的办理和存储技能则显得十分重要,假如没有有用的办理和存储技能,便会对资源办理和同享发生不良影响。

3 图书馆收藏数字资源的整合战略

3.1 图书馆资源整合计划

依据大数据的图书馆数字资源整合计划首要分为大数据资源模块、资源过滤和解析模块、资源整合模块、资源整合体系反应操控模块等部分(详见图1)。

3.1.1 大数据资源层 首要担任存储和办理数据、体系办理数据及客户办理数据,并且该模块还会参照数据的存储特色、数据的来历、数据的运用方向以及数据的运用频率等特色将搜集到的数据依照规矩存储到相应的办理数据库中,为整个信息效劳资源整合体系供给信息数据的根底办理效劳。

3.1.2 资源过滤与解析层 该部分是大数据资源的上层,承受基层的大数据资源供给的效劳。该部分首要担负着大数据特征的提取、类型和格局的判别、数据清洗(即挑选)及数据解析等作业,其意图在于不只过滤掉大数据存在的晦气噪音,还要标准数据的格局和类型,并且需求进一步进步数据的存储密度和运用价值。

3.1.3 资源整合层 为运用大数据读取和转化原则,将过滤后的数据进行转化并终究存储在主数据库中[5]。

3.1.4 资源整合反应与操控层 经过数据处理以及剖析技能针对大数据进行评价,并运用体系反应技能完成数据整合、资源调整及反应体系优化,然后全体进步数据的操作办理水平,进步数据的有用性和可控性。数字图书馆还会全程监管数据的整合进程,及时发现问题、纠正过错及完善办理,为用户供给安全、牢靠及快捷的数据效劳。体系反应操控能够影响资源整合操控战略,进一步影响整个图书馆收藏数字资源整合计划。

3.2 完成数据在搜集终端的过滤与整合战略

数字图书馆还会在供给优质数据效劳的一起活跃搜集和整合用户数据,比方能够运用终端的传感器、监控仪器、效劳器日志监控体系以及终端数据搜集器等设备,搜集和收拾体系运转信息以及用户运用的信息。需求着重的是,这些搜集数据的设备构建比较杂乱,数据量较大,因而在搜集数据时要掌握体系所需搜集数据量和网络传输的负载之间的平衡,在不影响硬件设备正常运转的根底上尽可能地搜集所需的信息数据[6]。因而在数据搜集方面选用何种的搜集、收拾以及过滤战略关于整个信息效劳资源整合体系的构建起到至关重要的效果,先进的搜集技能将会大大削减硬件设备的运载负荷,然后明显进步数据的收拾和剖析功率。数字图书馆应该重视针对很多原始数据的过滤和整合技能的研讨,下降大数据的噪音,有用去除数据的冗余信息,提炼有价值的信息数据并进行存储,全体上进步数据的时效性和运用率。

4 图书馆收藏数字资源存储体系规划

图书馆资源存储体系首要包含运用效劳层、渠道效劳层及根底设施效劳层等,这些都参照层次进行分类[7]。其间运用效劳部分首要供给详细的体系功用;渠道效劳部分首要供给体系监控功用、用户办理功用以及为运用效劳层供给专门接口等。图书馆资源存储体系就是一种云端类型的网络,该体系能够供给高并发的网络核算效劳以及网络功用效劳,运用散布式技能和虚拟化技能来扩展Web网络效劳器、运用效劳器、存储效劳器以及数据库效劳器,还可认为不同区域的数字图书馆之间供给多种检索、核算以及存储效劳等。

4.1 根底设施效劳层

根底设施效劳层即IaaS层,为图书馆资源存储体系全体架构的根底部分,支撑着全体结构的运作,其运用虚拟化技能将硬件资源和相应办理功用进行有机结合。该效劳层包含2个方面功用:⑴运用网络硬件设备、存储设备、主机进行虚拟化、抽象化及散布式处理,将数字图书馆中的各种硬件设备整合在一起,一起封装成为依据云存储根底效劳设施,用户只需将其当成一个全体即可,无需知道是哪部设备供给效劳,只用发布调用设备指令就能够获取所需的硬件和软件资源。⑵凭借虚拟化技能以及抽象化技能,根底设施效劳层为用户供给备份办理、核算效劳办理、数据存储办理及负载办理等效劳。

4.2 渠道效劳层

渠道效劳层即PaaS层,为图书馆资源存储体系全体架构的中心部分,又称为云中心件,它的效果是将体系的复用性软件和通用性软件进行整合,然后完成为区域数字图书馆供给PaaS层效劳。该效劳层首要供给以下6个方面功用:⑴供给体系信息办理接口功用,比方课题办理、专题办理、资源办理及简报办理等;⑵供给渠道中心效劳接口功用,比方行为剖析和计算、使命调度、资源整合及检索等;⑶供给信息发布接口效劳,比方供给用户定制、发布信息检索、体系资源导航及资源专题发布功用等;⑷供给信息规划接口功用,比方信息资源规划及资源体系规划等;⑸体系信息资源加工接口功用,比方信息出产的剖析和计算功用及信息内容编发功用等;⑹供给资源库的发布接口功用。

4.3 运用效劳层

运用效劳层即SaaS层,为图书馆资源存储体系全体架构的高层部分,可认为区域数字图书馆供给所需效劳和运用软件支撑。凭借SaaS层供给的软件功用,区域数字图书馆能够依据用户详细需求将体系功用以租借方法供给给用户或许其他安排。详细来讲,供给的效劳功用首要包含RSS信息效劳、信息订阅推送效劳、体系信息检索效劳、个性化用户信息效劳、体系公共信息效劳、企业竞赛监管效劳、用户参阅和咨询效劳、技術评价效劳及高新技能查新效劳等。

根底设施效劳层首要供给体系办理及事务支撑的相关功用,然后确保整个体系能够正常运转。终端是整个数字图书馆的最高层,不只为用户供给登录功用,并且还能够直接与效劳器进行交互,该层不再局限于个人核算机,只要是能够拜访云端的终端设备都能够登录客户端。

5 结语

资源同享形式是大数据年代图书馆开展的必然趋势。凭借资源整合技能,图书馆不只能够完成信息资源的规模化处理,还能够完成本图书馆与其他图书馆在同一渠道上用户和资源的一致办理,然后更大程度地完成资源同享意图。存储功用是凭借先进技能将文献资源依照必定的次第进行办理和存储处理,让相同或类似的文献资源严密相关,这就是依据文献资源的存储处理的中心地点。

参阅文献

[1] 樊伟红,李晨晖,张兴隆,等.图书馆需求怎样的“大数据”[J].图书馆杂志,2012,31(11):63-68,77.

[2] 刘芳,卢国强,刘宾娜,等.大数据年代的数字图书馆异构数据集成剖析[J].电子技能与软件工程,2015(22):193.

[3] 郑飒.大数据年代的图书馆效劳初探[J].黑龙江史志,2015(5):268.

[4] 韩翠峰.大数据带给图书馆的影响与应战[J].图书与情报,2012(5): 37-40.

[5] 温浩宇,李京京.大数据年代的数字图书馆异构数据集成研讨[J].情报杂志,2013,32(9):138-141.

[6] 席亚军.大数据年代下云技能在图书馆数据存储中的运用[J].农业图书情报学刊,2015,27(11):5-8.

[7] 黄燕.云存储在图书馆数字资源存储中的运用[J].现代情报,2011, 31(4):68-70.

(收稿日期:2017-03-27)

(修回日期:2017-05-12;修改:魏民)

相关资讯
最新新闻
关闭