【云计算在数字图书馆中的应用与瓶颈问题】 云计算集群的主要瓶颈

时间:2019-01-30 来源:东星资源网 本文已影响 手机版

  〔摘 要〕云计算技术作为一门新兴技术已经强势进入了图书馆领域,为图书馆的发展迎来了下一个春天。文章归纳了云计算在图书馆中的应用现状,并且从云计算的含义、特点、服务类型出发,讨论了云计算在数字图书馆中的主要应用,指出了数字图书馆应用云计算要考虑的一些瓶颈问题。
  〔关键词〕云计算;数字图书馆;云计算应用
  DOI:10.3969/j.issn.1008-0821.2012.02.037
  〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2012)02-0147-04
  The Application of Cloud Computing on Digital Library
  and Its Bottleneck ProblemsFan Min
  (Faculty of Computer and Information Science,Southwest University,Chongqing 400715,China)
  
  〔Abstract〕As a new techology, cloud computing has strongly entered into the library field and has welcomed the next spring of the library?s development.This paper summarized the cloud computing?s present situation of the application on the library field,and then from the cloud computing?s meaning,features and service type,discussed its main applications on digital library,pointed out some bottleneck problems on its application.
  〔Key words〕cloud computing;digital library;cloud computing applications
  
  1 引 言
  1.1 研究背景
  “云计算”这个概念自2007年正式提出来以后,一直受到IT界的广泛讨论,其来势之猛烈大有席卷全球的趋势,因此很多企业都将自己的业务与其联系起来,纷纷挂着一个“云”的称号。Google、亚马逊、IBM、甲骨文、微软等IT巨头都加入了云计算的行列,推出了一些云计算服务,如亚马逊的网络服务、Google的帮企业托管服务、微软的软件加服务、IBM的蓝云计划。数字图书馆与IT技术的发展有直接的联系,而云计算技术作为IT界的一种新兴技术,它在图书馆行业的发展现状是怎样的呢?它是怎样应用于数字图书馆的建设中的呢?图书馆应用云计算技术又存在着怎样的限制问题呢?伴随着云计算的发展,这些问题也逐渐受到了图书情报界学者的广泛关注,引起了学术界的另一次研究热潮。
  1.2 国内外研究现状
  基于云计算的服务是从2009年正式引入了图书馆的,目前,国外已经有很多图书馆在使用云计算技术进行图书馆管理与服务。
  2009年,迈克尔?斯蒂芬对云计算在图书馆的应用做了初步展望,不久又将云计算列入2009年图情十大技术之首[1];2009年4月23日,世界最大的联机图书馆服务供应商OCLC宣布即将推出基于WorldCat书目数据的“Web 级协作型图书馆管理服务”,被公认为是一项云计算服务,其目标是取代各类型图书馆的集成管理系统[2];俄亥俄州图书馆与信息合作网正在使用亚马逊的云计算服务托管一小部分数字公共资源;哥伦比亚区公共图书馆正在使用亚马逊的弹性计算云服务托管它们的网站,并且还在使用亚马逊的S3服务备份图书馆集成系统。
  在国内方面,对于云计算在数字图书馆中的研究还处于起步阶段,但也有一些理论研究成果和应用实例,并且受到了学术界的重视。从云计算引入到图书馆以来,“云书馆”、“云馆员”、“云服务”这样的术语就纷纷出现了。2009年,在华中科技大学举行了第六届数字环境下图书馆前沿问题研讨会,对云计算给予了高度关注;CALIS(中国高等教育文献保障系统)基于“十五”成果和三期建设目标,结合云计算、SaaS、Web2.0、SOA等技术,提出了CALIS云战略和相应的数字图书馆云服务平台模型[3]。
  在发表论文数量方面,笔者以CNKI为数据源,以“云计算”和“图书馆”为关键词,共检索出相关文献176篇,时间跨度为2009-2011年。其中,2009年只检索出1篇文献,其它均分布在2010年和2011年。可见,从2009年图书馆引进云计算的思想以来,云计算受到图书馆界的广泛关注。
  1.3 研究意义
  云计算作为信息时代的产物,是IT行业的新趋势,受到各行各业的关注。云计算的诞生给IT界带来了一次新的技术革命,同时也成功地引入到了图书馆界。云计算能够解决数字图书馆的建设过程中的许多问题,如海量信息的存储问题、数字资源建设和共享问题。本文主要是从云计算的概念和特点出发,对云计算在数字图书馆中的应用进行归纳,找出数字图书馆应用云计算过程中遇到的问题。
  2 云计算概述
  2.1 云计算的概念
  云计算出现的时间还不长,其定义到目前尚未统一,Matrix已经总结了云计算的20个定义。李开复将云计算定义为:以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务,让互联网这片‘云’成为每一个网民的数据中心和计算中心[1]。维基百科将云计算(Cloud Computing)定义为:云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备[4]。
  目前比较普遍的定义是,云计算是并行计算、分布式计算和风格计算的发展,或者说是这些计算机科学概念的商业实现,是虚拟化、效用计算、基础设施即服务、平台即服务、软件即服务等概念混合演进并跃升的结果[5]。在图书情报界一般引用这个概念。
  2012年2月第32卷第2期云计算在数字图书馆中的应用与瓶颈问题Feb.,2.2 云计算的特点
  云计算的特点可以归纳为以下几个方面:①硬件和软件都是资源,即把所有IT资源均当成服务来提供,包括应用程序、存储空间、计算能力、编程与运行环境、网络通信设施、协作工具平台等,可以认为这是SOA(以服务为导向)的高级阶段和具体实施(大多数SOA还只体现在设计阶段)[6];②云计算使用了数据多副本容错、计算节点同构可互换等措施来保障服务,存储数据安全可靠;③用户可以根据自己的需求定制或删减相应的服务,按实际使用量付费,并且用户可以使用各种终端获取应用服务;④云计算的资源可以根据应用和用户规模增长的需要随时进行动态扩展和配置,具有动态性;⑤云计算支持数据共享,符合权限的用户只要利用自己的电子设备连接上网,便可同时访问和使用同一份数据;⑤性价比很高[7]。
  2.3 云计算的服务类型
  云计算的服务有3个层次:应用层、平台层和基础设施层。根据不同的服务层次,可将云计算服务分为3类,即软件即服务(SaaS)、平台即服务(PaaS)、基础设施即服务(IaaS)[8]。
  2.3.1 软件即服务(SaaS)
  软件即服务,即把软件当作一种服务。用户无需购买和安装软件,而是通过浏览器将用户请求的软件传给用户。这样,用户就可以节省大量购买软件的成本,而服务器提供商也只需维护一个程序,降低了维护成本。应用的主要领域有人力资源管理程序和ERP等。
  2.3.2 平台即服务(PaaS)
  平台即服务,即将开发环境的平台作为一种服务,包括应用设计、应用开发、应用测试和应用托管,提供给用户。用户就可以在此基础上,开发自己所需要的应用服务。这种服务实际上是SaaS的一个变种,因此也具有SaaS节约成本和便于维护的优点。目前典型的实例有微软的Windows Azure平台、Google AppEngine等。
  2.3.3 基础设施即服务(IaaS)
  基础设施即服务,即是将IT的基础设施(虚拟服务器、存储、网络、?I/O设备整合成的虚拟资源池)作为一种服务,用户就可以从这些基础设施中获得应用所需要的存储和计算能力,而无需支付这些基础设施所付出的相应的原始成本。
  典型的实例是Amazon的AWS服务,包括Elastic Compute Cloud(EC2)提供的虚拟机租用服务,Simple Storage Service(S3)提供的存储租用服务等[9]。
  3 云计算技术在数字图书馆中的应用
  3.1 数字资源存储
  数字图书馆往往面对的是海量的信息,而对这些海量信息进行存储是数字图书馆必须要解决的一个问题。传统的数字图书馆常用的海量信息存储设备主要是光盘塔、磁带库、磁盘阵列,网络附加存储设备主要有DAS、NAS、SAN,而这些设备的寿命都是有限的,而且会花费大量的图书馆经费。从数字图书馆的角度来看,云计算为用户提供的基础设施即服务有望为数字图书馆解决海量信息存储和数字资源长期保存问题。
  云计算的虚拟存储技术能够把图书馆使用的DAS、NAS、SAN存储设备汇集成一个“虚拟存储池”,数字图书馆的音频、视频、图片、文字等各种格式的数据存放在这个“虚拟存储池”中,所有基于网络的RAID、分布式?I/O、数据冗余、硬盘组、逻辑卷、动态的多个路径、分层存储、在线的高速备份等有关的问题都由虚拟存储管理系统来处理,实现了无缝的存储和数据管理[10]。有了这样的存储系统为保障,就可以实现数据的安全存储,防止因系统故障而引起的数据损坏与丢失等现象。
  另外,还有一些学者从其它的角度对云计算在数字资源存储的应用进行了阐述。一些学者认为,各个机构独立开展数字资源保存研究和平台建设,往往会面临系统间互操作性差、异构应用的平台、缺乏共同的标准、非弹性计算能力等问题,而云计算所提供的服务,则有助于使各个图书馆共同协作努力,促使数字资源的保存形成必要的、节约型的数字管理经济规模[11]。
  3.2 数字资源建设
  我国的数字图书馆在资源建设方面还存在着诸多问题,如同一图书馆中数字资源不能和纸质资源进行相互补充,不同图书馆之间的数字资源相互独立、重复建设概率高[12]。部分数字图书馆下的成员馆内部缺乏统一的标准,系统兼容性差,一些成员馆则各自为政,对数字信息的建设和处理缺乏协调和合作,从而导致数字资源重复建设,造成了资源建设成本和维护成本的浪费。
  云计算技术的出现使数字图书馆在网络中以“信息超市”的形式出现。每个图书馆所有的数字化信息部分或者全部上传到云空间,由云来统一调度、组织这些海量数据,实现一种标准模式下的互补链接,使得整合后的信息更加有序[13]。这样就既可以巧妙地避免各个图书馆各自为政,造成数字资源的重复建设,又可以解决馆内缺乏统一标准而造成系统兼容性差的问题。另外,云计算技术使各个图书馆在数字信息资源建设上实现有效分工,节约出大量的人力、财力,从而可以提升数字图书馆的服务效益,使图书馆能够集中精力处理核心业务。
  3.3 资源共享
  3.3.1 硬件环境共享
  传统数字图书馆的硬件环境建设需要购置性能强劲且价格昂贵的大型机,并且需要一定区域内数字图书馆的各个成员馆重复购置硬件,这在一定的程度上会增加区域图书馆硬件资源环境建设的经济负担。而云计算提供的基础设施即服务,可以实现区域范围内的数字图书馆共享其提供的虚拟服务器、存储、网络等虚拟资源,即一定区域的数字图书馆通过采用大规模分布式任务处理技术和虚拟化技术,将地理位置不相邻的多个功能相同的设备虚拟化成一个个块服务器,多个块服务器构成一个逻辑上的服务器集群,对外提供简洁统一的资源服务访问方式。这种基于云计算的数字图书馆硬件共享方式可以使区域范围内的成员图书馆通过区域数字图书馆的主服务器来请求资源的调用,来实现硬件资源的共享。
  基于云计算的区域数字图书馆硬件环境建设具有以下的一些优点:①对硬件的性能要求低,它可以架构在大规模的廉价服务器集群之上;②支持硬件建设的共建共享,云计算支持数字图书馆对所需购置的硬件进行统一规划、共同搭建、统一管理,从而为系统内部提供可靠的IaaS服务;③减少资源闲置,提高了硬件服务的并发数量和可靠性;④硬件设备在逻辑上高度集中,方便了系统管理人员对硬件设备的使用和服务管理[14]。
  3.3.2 信息资源共享
  传统的数字图书馆的共享机制需要借助于文献传递来进行,这在一定的程度上会产生一定的延迟,给用户带来了诸多不便。在云计算的模式下,各个数字图书馆可以将自己的资源上传至云中的服务器,构建一个巨大的共享信息库。因此,各个数字图书馆既可以通过网络共享其它数字图书馆的信息,而不用管这个数字图书馆的具体位置,同时也可以同时获取许多网络中本身存在的大量有用信息,极大程度上满足了用户的信息需求。在这种情况下,用户只需要明确自己的信息需求,通过一个简单的网页搜索就可以获取所有加入云中的数字图书馆的信息,让用户感觉到好像只使用了一个数字图书馆。这种基于云计算的数字图书馆将异构分布环境下不同来源的海量数据资源进行统一整合,实现信息资源的智能共享,极大地提高数字图书馆资源的利用效率[15]。
  3.4 个性化信息服务
  云计算本身也就是一种服务,前面提到的几种云计算在数字图书馆中的应用实际上也就是云计算提供的各种服务。除了这些基础服务以外,云计算还能为用户提供个性化的信息服务。个性化的服务是一种用户驱动的、可定制的信息服务,它是根据用户的知识结构、信息需求、行为方式和心理倾向等,有的放矢地为具体用户创造符合个性需求和服务环境,为其提供定向化的预定信息与服务[16]。
  云计算的出现丰富了数字图书馆用户的个性化服务方式,真正可以实现“用户主导型”的服务,主要表现在以下几个方面:在终端的选择上,传统的数字图书馆只能通过计算机访问图书馆的资源,而云计算技术支持各种手持式设备,如掌上电脑、智能手机等终端访问图书馆,真正让用户感觉得到“图书馆无处不在”的体验;用户交互上,云计算能提供即时通讯和在线帮助或智能数字图书馆机器人的交互,同时可以开放多种Web2.0的服务方式,如维基百科、用户博客、威客等[17];可以采用多维数据分析挖掘技术,分析用户的信息行为,挖掘出用户感兴趣的话题,并主动向用户推送符合用户需求的信息资源,如RSS技术在图书馆中的应用,可以帮助读者订阅自己感兴趣的资源,并将这些信息的更新动态即时推送给读者。
  4 数字图书馆应用云计算的瓶颈问题
  云计算的理念和服务技术的快速发展,已经被用户广泛所接受,并且成为了数字图书馆发展的现实需要。然而,云计算还处于初级使用阶段,存在着许多的问题亟待解决。因此,在数字图书馆的建设过程中,图书馆员在利用云计算的便利的同时,还得从图书馆自身角度来考虑云计算的使用将会带来的瓶颈问题,如信息安全问题、资源的选择性整合问题、知识产权问题等。
  4.1 信息安全问题
  数字资源是数字图书馆的灵魂,因而这些数字信息的安全对于数字图书馆来说是至关重要的。每一个数字图书馆的用户对数字图书馆信息的完整性、可用性、真实性有较高的要求。虽然云计算提供了很强的数据备份能力,能够保证数字图书馆信息的物理形态的安全性,但对于信息的内容安全性方面还不能保证,仍存在着一些安全性问题:非法用户利用系统的漏洞得到一些信息后,会对数字图书馆中的其他用户的个人隐私、重要机密信息等造成威胁;一些非法的操作,可能导致数字资源的丢失;数字图书馆对本馆数据的存储位置并不明确,因而不知道如何对不同用户的私有数据进行有效隔离、保密,使得数字图书馆用户不能确定托管于云服务提供商的数据拥有的完全权限;对于涉密信息,如果得不到严格加密,数据丢失将会造成严重的损失[5,18]。因而对于数字图书馆来说,必须考虑到这些安全性因素,对于一些重要的信息最好能够利用自己的设备进行备份。
  4.2 资源选择性整合问题
  数字图书馆在将数字资源上传至云中构建云计算资源时,还得考虑数字资源的选择性整合问题,例如,是否将全部数字资源都上传至云服务器?如果不是全部上传,那又应该将哪些资源上传?在理论上,数字图书馆将资源上传至云中,可通过本地互联网进行使用。而实际上,数字图书馆往往不会将全部资源放在云中,而是将一些重要的私密性资源保存在本地计算机,或者在本地进行备份。这样,当云中服务器出现故障时,能够继续在本地处理事务和数据[19]。因此,云计算模式并不会完全推翻数字图书馆现在有部署模式,而是在保留原有模式的基础上,使现有的部署模式与云计算模式进行融合,作为现有部署模式的有效补充[20]。
  4.3 知识产权问题
  云计算加大了数字图书馆的信息共享的程度,同时也带来了版权纠纷问题。如OCLC在2008年11月推出“WordCat”记录使用与传递政策,试图取代20年前的“OCLC衍生记录使用与传递指南”时,受到很大的质疑,最终不得不在2009年5月宣布撤销,推倒重来[21]。
  数字图书馆要运用云计算技术,必须保证在将自己的资源交给云托管后,完全拥有被托管资源的知识产权,能够自主管理和控制这些资源,同时其它的用户没有权限对这些资源进行管理。然而,云计算企业往往会利用这些数据,并以数据整合、数据挖掘、知识服务的名义努力使用户数据利用合法化。因此,数字图书馆想要将云计算技术运用自如,就得针对这些版权纠纷,制定出切实可行的方案,完善相关的法律体系,从根本上解决版权问题。
  5 结 论
  综上所述,云计算技术作为IT行业的新兴发展领域,目前已经成功地引入到了图书馆领域,并且能够为数字图书馆解决一些现实问题和提供新的服务理念,如帮助数字图书馆解决海量信息的长期保存、信息资源建设等问题,同时能让数字图书馆共享云中的硬件环境,加大数字图书馆信息资源共享的程度,丰富数字图书馆的个性化用户服务方式。然而,数字图书馆在利用云计算的过程中,还有一些问题是不得不考虑的,如信息安全问题、资源选择性整合问题、知识产权问题等。虽然目前云计算技术在数字图书馆的应用还处于探索的阶段,相信随着云计算在其它领域发展的逐渐成熟,将来一定会为图书馆带来一次伟大的变革。
  
  参考文献
  [1]范并思.云计算与图书馆:为云计算研究辩护[J].图书情报工作,2009,(53):5-9.
  [2]吴雷,张淑芬,刘建生.云时代与数字图书馆.重庆图情研究[J],2010,(3):45-48.
  [3]王文清,陈凌.CALIS数字图书馆云服务平台模型[J].大学图书馆学报,2009,(4):13-18.
  [4]https:∥zh.省略/wiki/%E4%BA%91%E8%AE%A1%E7%AE%97[EB].
  [5]史庆艳.云计算对数字图书馆的影响[J].情报探索,2010,(8):19-21.
  [6]刘炜.图书馆需要一朵怎样的“云”[J].大学图书馆学报,2009,(4):2-6.
  [7]高晓燕.云计算在图书馆中的应用研究[J].大学图书情报学刊,2010,(28):60-62.
  [8]张鹏程,许晓鲁.云计算策略、服务与解决方案[J].软件产业与工程,2011,(2):40-45.
  [9]Amazon Web Services[EB].https:∥aws.amazon.corn/.
  [10]康健明.虚拟存储技术及其在数字图书馆中的应用[J].图书馆论坛,2007,(27):92-94.
  [11]陶新权,孙青,王亚,等.云计算在图书馆中的应用[J].大学图书馆学报,2010,(2):54-57.
  [12]卢晓娟.云计算与未来图书馆数字信息资源建设[J].四川图书馆学报,2009,(2):23-24.
  [13]王长宇.云计算环境下的数字图书馆信息资源建设的理性思考[J].中国科技信息,2010,(17):163-165.
  [14]汪晓囡.基于云计算的区域数字图书馆研究[J].数字图书馆论坛,2010,(11):63-70.
  [15]王平.云计算关键技术在数字图书馆中的应用研究[J].情报资料工作,2010,(5):52-56.
  [16]李惠琴.基于“云计算”的数字图书馆服务模式[J].图书馆论坛,2010,(31):209-210.
  [17]周舒,张岚岚.云计算改善数字图书馆用户体验初探[J].图书馆学研究,2009,(4):28-30.
  [18]孙文乾.浅析云计算的安全策略[J].电脑知识与技术,2010,(9):2145-2146.
  [19]饶少阳.向“云”计算靠拢[J].电信之窗,2008,(7):5-10.
  [20]蔡炳育,陈慧贤.云计算与数字资源存储问题分析[J].巢湖学院学报,2009,(6):27-30.
  [21]胡小菁,范并思.云计算给图书馆管理带来挑战[J].大学图书馆学报,2009,(4):7-12.

标签:瓶颈 数字图书馆 计算