大型配置区域邮箱服务器 | 1,500 |
数据中心配置邮箱服务器 | 3,000 |
根据每种服务器配置的需求,存储设计各不相同。所有 Exchange 2000 邮箱服务器都支持 100 MB 邮箱。区域服务器配置使用直接相连的 SCSI 存储磁盘阵列,通过 100 Mbps LAN 进行备份。数据中心配置服务器使用三个 SAN 阵列,每个包含一个 SG。它们通过千兆位 LAN 进行备份。
OTG 在设计其初始 Exchange 服务器时以最大化服务器和存储硬件两者的系统性能和可用性为宗旨,使用了最佳实践指导原则。为了优化磁盘的输入/输出(I/O),SG 的每一卷都被指派了一个逻辑单元号(LUN)。因为每个 LUN 都分配了一个驱动器号,所以每个服务器(包含三个 SG,每个由三个 LUN 组成)使用九个驱动器号。
OTG 将每个 SG 配置为维护三个独立的 LUN。使用 24 个 18-GB 磁盘的邮箱数据 LUN 和使用 6 个 18-GB 磁盘的日志 LUN 都被设置为使用带状镜像配置,即通常所说的独立磁盘冗余阵列(RAID)-10。SAN 还维护一个使用 12 个 36-GB 磁盘的 RAID-5 配置的备份 LUN。此 LUN 用于支持两天的在线、磁盘到磁盘的备份保留时间。
每个 SG 支持五个数据库,每个数据库支持 200 个邮箱,这意味着它们最多能够支持每 SG 1,000 个邮箱和每服务器 3,000 个邮箱。
性能、可伸缩性和可支持性的挑战
Exchange 2000 是对前一版本的 Exchange 的一次重大升级。然而,即使 Exchange 2000 非常强大,OTG 仍必须解决某些限制。
需要管理的服务器数量太多
由于不具备有效地整合服务器和站点的能力,服务器站点数量的增长使得支持成本变得极高而且给消息环境增加了复杂性。一些与分布式环境相关的更常见的成本因素包括:
| %26#8226; | 更多系统需要备份 |
| %26#8226; | 额外维护大量站点上的备份系统 |
| %26#8226; | 向管理备份过程中添加更多员工 |
| %26#8226; | 额外站点需要更强劲的电力和冷却资源 |
| %26#8226; | 更多现场支持员工用于多个站点的硬件维护 |
从复杂性的角度来看,更大数量的系统意味着在一个复杂机器中有更多移动部件;即,即使只要求同样的成功率,也需要更多的备份任务,这意味着有更多数量的故障需要检查和解决。计划减少 90% 的服务器站点数量极大地降低了通信机器中移动部件的数量,从而减少了许多前端的故障率。
在服务等级协议(SLA)时间内恢复数据库的困难
即使是很小的整合工作也能够导致许多站点上的服务器获得的更高的可伸缩性。随着产品可伸缩性的提高,服务器上的邮箱数目也不断增加,而数据库大小也同样持续增长。更重要的是,由于倡导将最大邮箱容量从 100 MB 增加到 200 MB,数据库大小立即翻了一番。
因为 Exchange 2000 没有提供对新的恢复选项,如恢复存储组(RSG)功能或卷影复制服务(VSS)的支持,所以由 Exchange 2000 Server 的损坏所造成的数据库停机意味着数据库恢复过程将导致更长时间的停机。在许多站点中,备份是通过数据中心内的多台计算机处理的,这就导致备份和恢复需要通过 100 MB LAN 来进行,这种恢复的平均时间在最佳状态下也只有每小时 16 GB。初始的恢复 SLA 是在一小时内完全恢复数据库,这一目标很快就变得难以达到。
集群可伸缩性限制
Windows 2000 Advanced Server 支持两节点集群,而 Windows 2000 Datacenter Server 支持四节点集群。对于在 Windows 2000 Advanced Server 上运行的 Exchange 2000,在最佳配置下,OTG 需要有多个与每个 SG 相关联的驱动器号卷。还有其它的驱动器号用于服务器配置,例如简单邮件传输协议(SMTP)驱动器(一个专用的入站/出站队列设备)。结果,集群内的每个虚拟 Exchange server(在计算了全体SG 和 SMTP 驱动器后)使用十个扩展驱动器号。这其中没有将服务器节点自身使用的必需的、保留的驱动器号计算在内,例如用于软盘、操作系统卷、以及 CD 驱动器的驱动器号。在耗尽可以分配给磁盘卷的可用驱动器号之前,OTG 在一个集群内只能使用两个服务器。可用驱动器号的缺乏阻碍了 OTG 向集群环境中添加额外的 Exchange 服务器实例。
备份基础结构不灵活
OTG 对区域服务器使用一段式备份。区域服务器使用 100 Mbps LAN 执行直接的、磁盘到磁带的备份。在 Redmond,服务器执行两段式备份过程: 首先是 SAN 内的磁盘到磁盘备份,然后是磁盘到磁带备份。为了确保备份过程在非业务时间内完成,OTG 需要在每台 Exchange 服务器上部署千兆以太网络适配器,以确保它们能够获得将数据通过 LAN 传输到磁带上所必需的吞吐量。
数据恢复需要创建一个临时性的恢复服务器作为分段服务器从磁带中获取数据。OTG 了解,在此过程能够开始之前,除了恢复数据的时间之外,磁带驱动器还必须先读取并寻找特定数据库在磁带上的起始点。此过程在所有数据都确实传输到磁盘之前需要等待 90 分钟左右。在 OTG 100 Mbps 网络上,用于数据恢复的典型吞吐量(从数据开始流动算起)大约是每分钟 300-350 MB。对于一个 15 GB 的示例数据库的选择性恢复,完成恢复工作所需的总时间常常超过两小时 - 大大超过 SLA。
最后,OTG 将在分配的 SLA 时间窗口内满足备份和恢复工作的技术需求作为它构造整个 Exchange 2000 体系结构的基础。