服务器为什么能够一年365天不间断的工作呢?当我们不论在一天的任何时间段去访问某些网站或者是APP的时候,都是能够顺利访问的,对于此,一些经常通宵打游戏的人应该是深有体会的,这背后的功劳应该就是一年365天不间断的工作的服务器了。
但是实际上,服务器也不是一年从不间断的,有时候也会出现宕机的情况,也就是我们常见的服务器故障。服务器的工作时间可以用MTBF(平均无故障时间)来衡量,当服务器的可靠值在99%的时候,每年的停机时间大约在87.6 小时左右;当服务器的可靠值在99.999%的时候,每年的停机时间大约在5分钟左右。
服务器一般是放在专业的机房内的。
专业的机房无尘,室内运行环境良好,温度控制在零上4到40度。通常电子信息设备的工作环境温度应在18℃~30℃之间,温度过高或过低将使计算机受到损害并加速其老化,从而影响服务器的使用寿命。因此,服务器一般都放在空气流动的地方,有24小时的空调为其服务。
专业的机房有稳定的可靠的电源。能够确保服务器使用的是适当功率的电源,服务器电源的电压一般为220V/50Hz。同时还有UPS保证,保证服务器在turnaround断电的情况下能够继续工作。一般来说,服务器使用的电源和我们常用的照明电源是不一样的。
服务器本身的设计在追求运行效率之余,最大的特点就是稳定。
服务器CPU内置多种容错纠错机制;内存使用带ECC校验芯片的内存,数据干扰出错风险比非ECC内存降低很多;服务器用的都是纯铜散热器、纯铜散热片,而且机箱风扇也都装到位了。
内置的集成显卡大多数时间不需要工作。主板都是6层以上PCB,硬盘设计寿命是普通硬盘的2倍等等,这些硬件的设计为服务器的稳定提供了进一步的支撑。
一些冗余设计可以在服务器工作的过程有效的规避掉一些故障以及风险或者是减少故障的时间,提高服务器的工作效率。
高端服务器产品中普遍采用双电源系统,这两个电源是负载均衡的,即在系统工作时它们都为系统提供电力,当一个电源出现故障时,另一个电源就承担所有的负载。有些服务器系统实现了DC的冗余,另一些服务器产品,如Micron公司的NetFRAME 9000实现了AC、DC的全冗余。
目前世界上还没有哪个公司的服务器是从来不会产生故障的,减少故障的方法就是专业人员的24小时维护,在服务器产生故障的时候及时维护。
服务器在设计的时候做了大量的备份冗余,在使用的时候运维在不停排除故障。专业的维护人员设计了hadoop、hdfs、lvs等等一系列的维护系统和灾后修复策略。超多的维护费用、电费、监控费、安保费等为服务器的稳定运行做出了后勤保障。
TOP