1.
步骤1:现场勘查并做精确负载清单。列出服务器、存储、网络设备及未来扩容比例(例如当前+50%)。记录每台设备名称、额定功率(kW)、功率因数。
步骤2:确定目标可用性与冗余等级(常见:N+1、2N或2(N+1)),在SLA中量化停电恢复时间与最大容忍故障点。
步骤3:制定电力与制冷分区方案,划分独立电力回路与冷却回路,避免单点故障影响多个机柜。
2.
步骤1:按机柜与机组计算实际峰值(kW)并乘以容错系数(建议1.2)。得出总IT负载。
步骤2:选择UPS类型(在线双转换为主流)。确定UPS容量:UPS总kVA ≥ 总IT负载 / 机房功率因数,再按冗余策略(N+1 -> 选择能覆盖全部负载的N单元+1备份)。
步骤3:电池后备时间设计(常见5~15分钟用于冷启动发电机,或根据业务需求定制),按所需续航计算电池块数量和容量。
3.
步骤1:确定发电机容量:发电机kVA ≥ UPS输入最大总功率×1.1(冷启动和并列裕度),若采用并列发电机则按并列扩展计算。
步骤2:冗余策略:常用N+1或2N。推荐在新加坡采用至少N+1并配自动并列控制(当一台发电机检修时仍能供全负载)。
步骤3:ATS配置:为每个PDUs或电力总回路设置双电源ATS,ATS测试模式与切换延迟需在SLA内调整,并做定期切换测试记录。
4.
步骤1:每个机柜至少两路独立PDU供电(A/B供电),并将关键设备分散在A/B回路以避免单回路过载。
步骤2:PDU选择带分路测量与远程断电控制的智能PDU,按相序均衡分配负载,避免单相过载。
步骤3:布线要求:使用明确标识、不同颜色区分A/B路,按消防规范敷设并留出维护空间,记录线缆档案与图纸。
5.
步骤1:按机房热负荷(kW或BTU/h)选择制冷容量,整体制冷量 ≥ IT热负荷×1.2(含未来扩容)。
步骤2:采用模块化CRAC/冷水机组与N+1或2N冗余。关键是每个冷却回路可单独隔离维修且不影响冷却能力。
步骤3:配置双路供水/回水泵组和旁路阀门,确保一台泵检修时系统仍可循环,定期冲洗与补水并记录导热盐/水质参数。
6.
步骤1:实施热通道/冷通道对齐并封闭冷通道(使用挡板、机柜顶部/底部封堵),减少混合回风,提升CRAC效率。
步骤2:在机柜前后安装可调挡板并测量机柜入口温度,设定CRAC出口温度目标(常见18~27°C范围内根据ASHRAE指南调整)。
步骤3:采用测点网络(水冷/空调)+温湿度传感器+差压传感器,配置告警阈值并与NOC联动实现自动化调整。
7.
步骤1:部署集中监控系统(BMS/DCIM),监控UPS、发电机、PDU、CRAC、温湿度、电流、电压等,并设置短信/邮件/语音告警。
步骤2:制定并执行定期测试计划:发电机负载测试(每季度或半年)、UPS电池容量测试(每半年)、ATS切换测试(每月或每季度)。
步骤3:维护文档:创建检修记录、切换记录、负载增长日志并保留至少2年,定期审计冗余配置是否满足SLA。
8.
答:采用模块化冷却+热回收、优化冷冻水温、使用变频冷水机与变频风机,实施热/冷通道封闭并加装测点闭环控制。具体步骤包括设定冷冻水供应温度、调整CRAC出风温差、启用变频控制并按季节调整温控策略,结合BMS优化运行。
9.
答:制定SOP:通知相关业务与NOC→确认现场人员→模拟市电掉电(或使用ATS测试模式)→记录UPS承载情况与切换时延→启动发电机并观察并列/加载稳定性→恢复市电并记录ATS回切时间→分析日志并归档。每次测试后修正发现的问题并在维护记录中备注。
10.
答:清单包含每日(监控报警检查、机房温湿度)、每周(PDU/UPS基本运行检查、备用发电机燃油/冷却液位)、每月(ATS切换测试、滤网清洁)、每季度(发电机负载测试、UPS电池健康检查)。对应急检查,列出断电-切换-恢复三步流程并指定责任人与联系方式。