网络营销策略案例分析 [网格计算及数字图书馆用户服务设计策略]

   1关于网格计算与数字图书馆的基本认知       1.1 网格的概念、特点    一个集成的计算与资源环境称为网格。基于网格的问题求解叫网格计算。[1]网格的特点:
  (1)分布性:分布性是网格的一个最主要的特点。网格上的各类资源通常类型复杂、规模较大、跨越地理范围较广。在分布式计算环境下,需要解决资源与任务的分配和调度问题,安全传输与通信问题,实时性保障问题,人与系统以及人与人之间的交互问题等。
   (2)异构性:网格可以包含多种异构资源,包括跨越地理分布的多个管理域。构成网格计算系统的超级计算机有多种类型,不同类型的超级计算机在体系结构、操作系统及应用软件等多个层次上可能具有不同结构。
   (3)可扩展性:网格可以从最初包含少数的资源发展到具有成千上万资源的大网格。由此可能带来的一个问题是随着网格资源的增加而引起的性能下降以及网格延迟,网格必须能适应规模的变化。
   (4)共享性:网格的根本特征是资源共享而不是它的规模。尽管网格资源是分布的,但是它们却是可以充分共享的。分布是网格硬件在物理上的特征,而共享是网格软件支持下实现的逻辑上的特征。
   (5)可适应性:在网格中,具有很多资源,资源发生故障的概率很高,网格的资源管理或应用必须能动态适应这些情况,调用网格中可用的资源和服务来取得最好的性能。与一般的局域网系统和单机的结构不同,网格系统由于地域分布和系统的复杂使其整体结构经常发生变化,网格系统的应用必须能适应这种不可预测的结构。
   (6)结构的不可预测性:动态和不可预测的系统行为。在传统的高性能计算系统中,计算资源是独占的,因此系统的行为是可预测的。而在网格系统中,由于资源的共享造成系统行为和系统性能经常变化。
   (7)多级管理域:由于构成网格系统的超级计算机等资源通常属于不同的机构或组织并且使用不同的安全机制,因此需要各个机构或组织共同参与解决多级管理域的问题。
  
   1.2网格计算与数字图书馆
  网格所关心的问题不再是文件交换,而是直接访问计算机、软件、数据和其他资源。这就要求网格具备解决资源与任务的分配和调度、安全传输与通信实时性保障、人与系统以及人与人之间的交互等能力。网格提供的资源是随时间动态变化的,原来拥有的资源或者功能,在下一时刻可能就会出现故障或者拒绝被使用,而原来没有的资源,可能随着时间的进展会不断加入进来。网格的根本特征就是资源共享,把整个网络整合成一台巨大的超级虚拟计算机,实现各种资源的全面共享。网格的三大虚拟技术分别是存储与数据、计算力、应用与服务。而数字图书馆综合了计算机、通讯、网络技术、高密度存储器、多媒体等技术,成为现代图书馆研究发展的热点。即数字技术改变图书馆的用户对象、开放时间,以及所提供的服务类型的可能性,使得数字图书馆服务的内容得到了相应的扩大[2]。数字图书馆提供的服务不仅包括传统图书馆服务在数字环境中的实现(如在线阅读与下载、电子文献传递离线阅读与打印),以及以网站服务形式提供的服务(如浏览、查询、最新信息报道服务等);还可以提供包括信息库、教育环境、参考服务、个性化服务等在内的服务平台数字图书馆的读者服务工作,包括网上学科导航系统的制作、网页制作与维护、数字化资源的宣传与推广、用户利用数字资源的培训、网上咨询工作、各种请求的处理和转换、可得数字资源的传递等。图书馆与用户之间通过网络实现远距离交流,各类图书馆之间也是通过联网实现远距离网上合作的[3]。资源的规范化构成数字图书馆服务核心,也是实现网格计算的基础,这种规范化至少有三个方面的含义:资源管理的规范化,资源访问的规范化,任务管理的规范化。 WSRF在Web技术基础上,提出有状态资源的概念。WSDM,定义了可管理资源,以Web服务规范分布资源的管理。
   国内外对资源服务化的实现技术做了很多研究。在设计资源包装的数字图书馆服务模型时,主要采用面向任务的资源管理策略。数字图书馆服务以批作业的形式接受计算请求,动态为每个请求分配合适的资源;在本次请求完成后自动释放所占用的资源。这种资源服务化策略有利于提高资源的使用率,也能够满足批作业类型问题和无循环的简单工作流类型问题的要求。数字图书馆属于复杂工作流类型的问题,需要以循环方式执行一组批作业,当数字图书馆以批作业为单位分配资源时,在批作业循环的两次执行之间,其中一些批作业需要的资源可能被其他用户抢占,从而导致整个应用问题无法执行、甚至失败。我们设计了一个面向用户的数字图书馆服务模型,用于计算网格中资源的包装。该模型将资源的分配与批作业的执行分隔开来,使得每个并发用户分别有一个独占、稳定的任务运行环境,可以执行任意数量的批作业任务。
  
  2 数字图书馆用户服务模型设计
  
   数字图书馆用户模型以WSDM和WSRF为基础,将资源的管理接口和功能接口分开,并采用实例模式规范资源的管理和访问。该策略的基本思想是:在使用数字图书馆技术进行资源包装时,从应用领域的需求出发对资源进行抽象,以用户为单位进行资源分配;将所分配的资源以专用运行环境(CEE:Customized Execution Environment)的形式呈现给用户。每个CEE对应一种应用需求,并以批作业的形式描述这种需求。它包含了完成该需求需要的CPU、磁盘空间、数据库或数据文件、一个或多个遗留程序及这些遗留程序运行需要的函数包和运行支持系统等全部资源;按照相关的应用领域专业知识和计算机系统管理的知识,对这些资源进行相应的组装和配置。用户一旦获得一个CEE后,可以把任意多个符合要求的批作业提交上去执行,也可以把这些批作业涉及的数据文件保存在该CEE的存储空间上。
  
   2.1 相关策略的设计[4]
   第一个策略以模板的形式表示应用领域的需求,每个模板对应一种应用需求。这些模板是应用领域的数据处理专家根据领域专业知识所定义的,用来规定应用需求的描述方法、实现方案对资源的要求、实现方案的评估方法。这种模板既独立于特定的应用问题,也与具体的资源无关,称作需求――资源模板(RRT:Request-ResourceTem-plate)。每个RRT包括四部分:任务管理接口、抽象资源模型、资源申请参数、性能评估因子。任务管理接口规定了应用需求的描述方法,由一组操作和属性组成,分别用来提交计算请求、传输异地文件数据、获知计算的执行状态和进度。每个操作完成一个批作业,涉及一个或多个遗留程序的运行。
   属性用来展示两方面的信息:批作业的执行进度和状态;批作业输入数据文件和输出数据文件在运行环境中使用的名称、存储路径。抽象资源模型规定为给任务管理接口中定义的各操作配置一个共同的运行环境,需要有哪些类别的资源、对每类资源的数量要求、对资源之间拓扑结构的要求以及根据应用领域算法逻辑确定的其他要求。资源申请参数规定在为具体计算任务创建CEE时需要提供的参数,这些参数是对计算任务具体特征的抽象,反映了计算任务的规模、资源访问模式以及针对这种模式所采取的优化策略等。例如,在一个CCE上需要执行多个批作业,这些批作业需要访问某个共同的异地文件,则可以以资源申请参数的形式规定在创建该CEE时,就将此异地文件传输到所创建CEE的存储空间上来,达到优化异地文件传输和访问效率的目的。性能评估因子规定了当多个CEE都能够满足当前需求时,对各个CEE进行评估的元数据,例如一个CEE所能占用的最大磁盘空间、CPU的性能等。另一个重要策略是以局域计算系统作为资源提供和管理的主体。每个局域计算系统由一组资源(计算机、应用软件、领域数据库、存储设备等)组成,并自主调度这些资源完成应用领域的数据处理要求。
  
   2.2数字图书馆用户服务的设计和组成结构
   数字图书馆用户服务是对一个局域计算系统中与某个应用需求相关的一组资源的抽象。可用一个四元组(host,rrt,A,B)表示,其中:host为被数字图书馆用户服务包装的资源所属的局域计算系统,也是用来部署数字图书馆用户服务的宿主机环境;rrt为领域专家定义的一个RRT,表示在host上能够完成的一种应用需求;A为CEE的集合,每个CEE都是从host提供的资源中选择一组合适的资源、并进行恰当的组装和配置而得到的,能够独立完成rrt任务管理接口中定义的全部操作;B为A中各个CEE所涉及资源的集合(见图1)。
  
   用于局域计算系统网格化的数字图书馆用户服务模型由四部分组成:有状态资源工厂(图书馆各类资源库)、工厂服务(Web服务)、有状态资源、实例服务(信息检索模块)。有状态资源工厂是一个符合WSDM的可管理资源,负责B中资源的监视和调度、A中CEE的创建和管理。它将rrt中定义的每个性能评估因子作为自己的一个属性,并依据资源监视的结果动态维护这些属性的值。工厂服务为有状态资源工厂实现一个Web访问界面。有状态资源按照WSRF规范抽象A中各CEE的状态和访问接口,由rrt任务管理接口中的操作和属性组成。每个有状态资源对应一个CEE,具体在该CEE上实现rrt任务管理接口中的各操作;根据该CEE上所运行批作业的进度和状态,自动维护属性的值。实例服务为各个有状态资源实现一个统一的Web界面。它与每个有状态资源分别构成一个有状态的Web服务资源,被动态分配给各个远程用户。远程用户获得Web服务资源后,可以请求执行任意多个符合规范的批作业。
  
  3 应用
  
   在计算网格协同平台Harmonia中,采用面向用户的数字图书馆服务模型进行资源服务化。服务主导型数字图书馆以用户为中心的服务体系主要由:统一信息访问平台、个性化定制平台、网上参考咨询平台和馆际信息服务协作平台构成。因此,信息服务类栏目设置应包括:跨库检索、定制服务、数字参考咨询、代查代检、网上文献传递、馆际互借等分栏,并建立相应的信息服务系统。
  
   3.1 跨库检索与统一信息访问平台建设
   建立一个利用统一检索界面解决数字图书馆众多异构数字资源统一检索的统一信息访问平台,是数字图书馆实现跨库检索的基础。当前在解决异构数据库统一检索方面,主要有以下几种方法[5]:(1)通过数据库接口软件与不同的数据库直接连接,如ODBC和JDBC等。(2)不同数据库间的格式转换。(3)运用元搜索引擎的基本原理,利用数据库的Web客户端进行统一检索。(4)基于OpenURL和SFX技术的异构数据库整合。不过,目前国内数据库尚不支持OpenURL协议,且引进的外文数据库在国内的镜像站点也不支持Open URL协议,因而,在国内利用基于Open URL和SFX技术的异构数据库整合技术来建立统一信息访问平台实现服务主导型数字图书馆各种异构数字资源的跨库检索的条件尚不成熟。
   运用元搜索引擎的基本原理,利用数据库的Web客户端进行统一检索的方法。网格中的元数据目录系统是数据密集型计算环境,在Web服务中占有重要地位。元数据的功能:(1)开放性定义。元数据定义本身可以公开获取、采用标准方法实现,其中内容能够以通用或标准的方式所识别和解释;(2)开放性语义。原始局元素可在标准或通用环境下来识别、验证和解析;(3)开放性交流。基于开放标准对元数据进行交换,对其中元素进行复用、继承和扩展;(4)机读性。能够利用计算机对元数据及其所标记的信息内容进行识别、理解,并能支持软件代理自动地解析元数据及其内容。目前国内外已经制订的元数据标准约有30种,有些属于通用型的,如都柏林核心集;有些属于专用型的,如描述数字图像的MOA2,描述教育资源的IEEE LOM;此外还有专用于描述博物馆藏品、地理资源、档案文献、音像资料、信息资源集合等多种类型元数据规范。其中都柏林元数据集业已成为互联网RFC2413和美国国家信息标准。它由资源标题、内容创作者、内容主题、资源类别、格式、语言、来源、关联等15个基本元素组成,各元素可以重复选用,除描述性信息外,还包含了电子资源的若干检索点和超文本链接信息,与XML扩展置标语言结合起来,将成为今后网络查询的重要渠道。
  
   3.2定制服务与个性化定制平台建设
   为了能够围绕用户信息活动和用户信息系统来组织、集成、嵌入数字信息资源和信息服务,适应用户信息检索与利用的个性化要求,解决统一检索界面带来的问题,构建以用户为中心的服务体系,个性化定制平台的建设已经成为服务主导型数字图书馆建设不可或缺的组成部分。由于个性化服务系统MyLibrary具有下列主要功能[6]:(1)用户可根据自己信息需求定制图书馆资源及其它Web资源并进行个人图书馆管理;(2)提供了与图书馆自动化系统OPAC的接口,可以直接查阅图书馆目录,甚至还可以查询用户的借阅记录;(3)个人链接收藏或叫书签功能;(4)最新资料通告功能;(5)同步更新功能。清华同方开发的PIS(Personalizedinformationsystem)可以作为服务主导型数字图书馆构建个性化定制平台的一个现实选择。PIS的客户端由五个功能模块组成。包括:首页、资源导航、数据库检索、我的工作区、系统功能。
  
   3.3数字参考咨询
   数字参考咨询是数字图书馆为解决用户在利用数字图书馆的各种资源、工具与服务过程中所遇到的疑难问题的一种基于网络的参考咨询服务。建立在数字化通信基础上,通过网络收发电子邮件、网页表单或者使用在线聊天软件、呼叫中心软件、即时视像软件等给远程用户提供方便、快捷的信息咨询服务。包括电子邮件咨询、BBS、FAQ信息自助咨询、实时参考咨询。
   还有其它用户服务,如文献传递。主要向用户提供电子全文,实行一定的收费标准。网上参考工具书、相关链接等。
  (作者单位:郑州师范高等专科学校图书馆)
  
  参考文献:
  [1] 赵 巍,庞 慧.网格计算及其应用综述[J].河北建筑工程学院学报,2006(2):95-98
  [2] 李培.数字图书馆原理及应用.北京:高等教育出版社,2004
  [3] 曲建峰,杨宗英,郑巧英,彭红星.基于网格的数字图书馆服务模式探讨[J].现代图书情报技术,2006(2):10-14
  [4] 余华山,鲁发凯,徐国市,王莉春.一种面向用户的Web服务设计策略[J]. 华 中 科 技 大 学 学 报(自然科学版)[J].2006(增刊):25-28
  [5] 李瑞芬. 从门户网站构建看服务主导型数字图书馆建设[J].情 报 科 学,2206(7):1009-1013
  [6] 马建铃,史 凤.国外图书馆Mylibrary个性化服务系统比较研究[J].现代图书情报技术,2004,(1):70-73

推荐访问:网格 用户服务 数字图书馆 策略