谈起物理带库大家都不陌生,但未必真正了解。她在备份领域它以终为始,时至今日QY球友会依然可以看到带库的踪影;但是随着云备份、对象存储产品和技术的普及,物理带库的市场将变得越来越小;正因为如此,QY球友会对物理带库技术和产品了解是比较有限的。我个人认为纵观备份历史,备份(一般用于离线备份)缺少物理带库似乎是不完整的,所以今天谈谈物理带库,也算是对我之前备份系列文章“一文深度全解备份解决方案知识”的完善和补充。
物理磁带库是一种存储设备,包含一个或多个驱动器、许多插槽、一个条形码阅读器以及一个用于装载磁带的自动机械臂。美国先进数字信息公司(ADIC被昆腾收购)的Scalar 系列产品是一款高性能、高可扩展能力的自动磁带库,此外,目前,市面上常见的物理磁带库品牌还有IBM、HP、SUN(StorageTek)等。
磁带机(Tape Drive)一般指单驱动器产品,通常由磁带驱动器和磁带构成,是一种经济、可靠、容量大、速度快的备份设备。采用高纠错能力编码技术和写后即读通道技术提高数据备份的可靠性。根据装带方式的不同,一般分为手动装带磁带机和自动装带磁带机。
磁带库是基于磁带的备份系统,像自动加载磁带机一样提供自动备份和数据恢复功能,可以实现连续备份、自动搜索磁带,也可以在驱动管理软件控制下实现智能恢复、实时监控和统计,整个数据存储备份过程完全摆脱了人工干涉。
在数据备份时,机械臂在物理磁带库中移动磁带到插槽或磁带机,备份软件通过智能管理机械臂来实现整个备份过程。如通过磁带驱动器可以从磁带上读取数据,也可以将数据写入磁带。通过邮槽或导入/导出插槽往物理磁带库中添加磁带或从磁带库中取出磁带,而无需打开物理磁带库的检修门。此外,物理磁带库的每个物理组件都各自有一个用于在物理磁带库中移动磁带时寻址的地址。
当开始备份时,机械臂会根据指示装载一盘磁带到一个磁带机中。磁带被挂载以后,还需要花一些时间用于磁头定位和报头信息验证。磁带机收到备份数据后会将数据首先存入它的内部缓存。然后数据会按块再写入磁带。物理磁带库通常还具有条形码标签的能力,条形码阅读器自动清点物理磁带库中的磁带,确认哪些磁带在哪些位置。条形码标签常常是磁带标签的一部分,信息记录于介质的开始部分,用于唯一识别磁带。
物理磁带库主要用于大容量数据存储和读取,是一种节约成本的解决方案。缺点是读取速度较慢,因为常常涉及到磁带的机械操作。因为物理带库慢速顺序访问和大容量特性,使得物理磁带库主要用于备份或最终用于数据归档。由于磁带库支持扩展槽位和驱动器可以让用户以非常低廉的成本扩充磁带库的容量和性能。
多通道带库还支持物理磁带库分区,物理磁带库分区就是将磁带库中的磁带驱动器和插槽分配给不同的应用平台,被分配的驱动器及插槽只能给被分配的主机使用。但机械臂可以控制所有的驱动器及插槽,并被所有的主机按照先来先控制的原则控制访问。
物理磁带库所需槽位(磁带)数量与备份的数据量密切相关,一般根据备份介质容量选择带库型号和磁带槽位数量;物理磁带库(磁带机只有一个驱动器)所需驱动器数量与备份时间窗口有关, 一个驱动器的备份速度是有限的,通常QY球友会需要根据备份数据量和备份窗口推算出备份速率,根据备份速率匹配带库的驱动器数量。磁带库驱动接口类型常见的有FC或SAS接口类型;物理磁带库也支持其它高级功能,如高级报表,磁带健康检查,链路冗余等等。另外需要说明一下磁带种类(数据磁带和清洁磁带)和配置原则,一般磁带数量等于槽位数量,清洁带数量等于驱动器数量。
从昆腾Scalar 系列规格可以看出,磁带槽位数量可选且不同产品支持的槽位数不尽相同;驱动器数量也是按需求可配置,Scalar i6000非压缩容量可达70+PB,压缩后的容量就会更大。
磁带库内部配置磁带机接口本身大多为光纤接口,通常情况下,QY球友会建议将机械手也连接至光纤交换机,然后交给备份服务器使用。无论机械手通过那种方式连接,对于目前业界主流的备份管理软件而言,其连接结构都是可以支持的,例如Veritas NetBackup、NetWorker等等。其工作原理简单描述如下:
1. 备份服务器按照策略执行某一备份任务。
2. 备份服务器通过以太网向该任务所对应的主机(业务主机)发出指令。
3. 主机收到指令回馈状态正常,可以执行备份任务,并告知备份服务器需要准备几盘磁带。
4. 备份服务器向磁带库机械手发出探询信息,确认有无对应可用磁带,同时探询闲置状态磁带机是否可用。
5. 磁带库按照要求装载可用磁带到磁带机(驱动器),并且反馈可用磁带以及磁带机足够信息给备份服务器。
6. 备份服务器将回馈信息告知主机,开始向磁带机中磁带直接写数据;此时,备份服务器标记对应磁带机为独占状态,禁止其他主机操作。
7. 写数据完毕之后,主机告知备份服务器,备份服务器写索引数据,并下指令将此盘磁带退出,释放出来磁带机以便其他主机使用。
传统的物理磁带库技术从最早的磁记录设备、磁带机设备,到今天的智能磁带库设备,磁带机技术的发展经历了几次革命。磁带技术经过了长时间的发展,主要有如下几种技术。
DAT(Digital Audio Tape)技术又可以称为数码音频磁带技术,也叫4mm磁带机技术,最初是由HP与索尼公司共同开发出来的。这种技术以螺旋扫描记录(Helical Scan Recording)为基础,将数据转化为数字后再存储下来,早期的DAT技术主要应用于声音的记录,后来随着这种技术的不断完善,又被应用在数据存储领域里。8mm技术由Exabyte(安百特)在1987年开发,采用螺旋扫描技术,其特点是磁带容量大,传输速率高,它在较高的价位上提供了相对较高容量的存储解决方案。
DLT(Digital Linear Tape)技术源于1/2英寸磁带机。1/2英寸磁带机技术出现很早,主要用于数据的实时采集,如程控交换机上话务信息的记录,地震设备的震动信号记录等等。DLT磁带由DEC和Quantum公司联合开发。由于磁带体积庞大,DLT磁带机全部是5.25英寸全高格式。DLT产品由于高容量,主要定位于中、高级的服务器市场与磁带库系统。
LTO(Linear Tape Open)技术,即线性磁带开放协议。是由HP、IBM、Seagate这三家厂商在1997年11月联合制定的,其结合了线性多通道、双向磁带格式的优点,基于服务系统、硬件数据压缩、优化的磁道面和高效率纠错技术,来提高磁带的能力和性能。LTO技术有两种存储格式,即高速开放磁带格式Ultrium和快速访问开放磁带格式Accelis,它们可分别满足不同用户对LTO存储系统的要求。
AIT技术(Advanced Intelligent Tape)具有螺旋扫描、金属蒸发带等先进技术,AIT的数据保护性能比较突出,AIT已经发展到目前的AIT-3,目前开发AIT技术的索尼公司和专注在AIT技术上开发产品的Spectra Logic公司都在大力的推广采用AIT的产品。AIT采用的是螺旋扫描方式进行记录,而LTO(Linear Tape Open)、DLT(Digital linear Tape)、SDLT(Super Digital linear Tape)都是线性记录,像录音机一样,磁头是固定不动的,磁带直线运动通过磁头。
VXA技术是由Exabyte(安百特)公司开发的磁带备份技术,VXA技术不依赖于精确的磁头和磁道位置来保证读写的可靠性,它不像流式磁带设备为定位磁道而需要昂贵的高精度的部件和精确的机械零件。VAX 以包的格式多些数据,对磁带上的数据记录区进行无空隙扫描,目前已经从VAX-1发展到VAX-2。
但面对云存储、云备份等技术和产品出现,磁带机技术的局限性日益显现。无论如何选用高速磁带机,其速度离人们理想的要求仍存在很大的距离,随着业务的飞跃式增长,备份设备所必需具有的物理磁带库机械手定位时间,磁带定位时间,使得人们的快速数据检索的愿望长期以来无法得以实现。
1.磁带失效率高,数据易丢失,恢复无法保证。数据备份的最终目的是在数据因人为或物理原因丢失时实现数据恢复,由于磁带库的磁带介质固有的非密封性,且物理磁带库对磁带没有容错保护机制,备份业务涉及到的磁带组中任意一盘磁带的卡带、磨损、霉点、粘连等,均会导致整个备份无法恢复。
2.磁带库属精密机械设备,故障率和维护成本高。因为物理磁带库是一个非密封的机械设备,其核心部件磁带驱动器,机械手,传送装置等各组成部分均为机械易损件,受灰尘、温度、潮湿等因素影响大。按照统计,物理磁带库的故障率依次为磁带机、磁带、机械手。而机械手故障不仅会终止所有备份,造成严重停机。
3.备份和恢复过程复杂冗长。虽然磁带本身的读写速度也在提高,但备份恢复时无法避免的抓取磁带、介质加载、机械定位等机械动作,等待时间长,同时备份和恢复时一般会涉及多带查找,应用系统***延长待机时间,使得业务系统长时间无法正常工作。
4.安装和日常维护极为复杂。尤其在搬迁时,严格的水平定位、大型物理磁带库需要的设备再连接,过程都极其复杂,同时,由于机械臂为灵敏机械部件,对包装,搬运要求较高,进一步增大了设备使用和维护的复杂性。
随着物理带库在备份速度、维护等方面的不足,虚拟带库技术也得到了长足的发展,目前主流的存储厂商都基本支持虚拟带库,下面QY球友会主要从数据备份性能、可靠性、安全、管理和兼容性等方面,对物理带库和虚拟带库进行简略的分析。
在数据读写性能方面,物理磁带库的整体性能有磁带驱动器数量及磁带驱动器支持的标准决定;虚拟磁带库由于采用虚拟化技术,虽然备份软件会发现虚拟磁带库中有若干磁带机,但是执行备份或者数据恢复的时候性能超过磁带机。因此虚拟磁带库的性能不是由仿真的磁带机标准决定而是由控制系统和后端的磁带系统决定。
在数据可靠性方面,物理磁带库采用磁带克隆的方式进行数据保护,否则由于磁带损坏会导致数据的丢失。虚拟机磁带库则可以采用后端存储RAID技术,磁盘损坏不影响储存的数据。
在保密性方面,物理磁带库采用专用数据格式储存数据,并且可以把磁带移出磁带库异地保存,因此具有更高的安全性;而虚拟机磁带库产品有两类,一类是真正虚拟磁带,一类是用文件系统(NFS或CIFS)中的文件来储存磁带格式的文件。对于第一类产品除了不能出库以外具有跟物理磁带库同样的安全性,第二类产品由于存在文件系统就可能被病毒或者认为破坏。
在数据可恢复性方面,物理磁带库由于磁带磁粉脱落、粘连、消磁、磁头沾污等原因会再需要恢复数据时无法获得数据;虚拟磁带库采用磁盘阵列存储数据具有很好的数据可恢复性。
在系统可靠性方面,物理磁带库中的大量的机械部件,并且要求机械运动精度相当的高,所以磁带库本身系统可靠性就不会很高;而虚拟磁带系统唯一有机械部件的就是磁盘,通过RAID技术使虚拟磁带库比物理磁带库的可靠性高。
在可管理方面,物理磁带库基本上都带有图形化管理界面,并且通过一个界面就可以管理整个磁带库系统,包括机械手,磁带机等;虚拟带库产品也可以通过唯一界面管理系统。
在软件兼容性方面,磁带库基本上各种备份软件都支持,并且很多备份软件的高级特点;虚拟磁带库一般采用黑盒子的管理方式,对于有些备份软件的功能支持不是太好。
在数据迁移方面,物理磁带库的数据迁移方式有两种:一种是通过备份软件的磁带复制或者归档功能将一个磁带库中的数据拷贝到另外一个磁带库中,这种拷贝与磁带格式无关。第二种就是将介质出库放到另外一个磁带库中。虚拟磁带库能够通过备份软件将虚拟磁带中的数据复制到物理磁带库的磁带介质上;也可以通过虚拟带库的复制功能进行数据复制、迁移,但只有通过备份软件的复制,才能够让备份软件指导数据从何处来到哪里去。
IBM 的TS和昆腾的Scalar支持LTFS(线性磁带文件系统),即通过LTFS可直接访问磁带上的文件。此外,大多数虚拟带库支持OpenStorage Tape(OST)技术,该技术是Symantec NetBackup的API,存储设备供应商提供存储,并提供安装在NetBackup Media/Master Server上的软件插件。
NetBackup Server使用该插件与智能存储设备通信。NetBackup使用该插件来查询存储设备。这些功能包括单实例存储、经过优化的脱离主机复制等。通过使用OpenStorage,NetBackup服务器(基于主机复制)能够在光纤通道网络上执行高速备份至智能硬盘设备。同时,由于VTL运用硬盘仿真物理磁带在NBU上给出新的硬盘视图。
OpenStorage提供共享存储能力,多台NetBackup服务器可以访问同一个虚拟带库。消除固定的磁带大小限制,平衡负载和性能,在NetBackup服务器和VTL服务器之间平衡存储利用率。对于每个备份作业,NetBackup都会选择可用空间最大的VTL设备存储。
在NetBackup Server上配置OpenStorage,创建逻辑存储单元(LSU),并将LSU添加到NetBackup Server,在NetBackup Server中创建存储单元、创建Disk Pool,实现在NetBackup Media间进行基于主机远程复制。