news center

广鹏产品案例社区
多个角度看布线|综合布线系统的运维管理(2)
目录
1.5 综合布线系统中经常被接触的部分(V.230204)1.6 跳线混乱的原因和后果(V.230205)1.7 人的记忆比不过系统的记录(V.230205)1.8 保存真实的记录(V.230205)

(本文转载自曾松鸣老师,文章连载/修订中)

1.5 综合布线系统中经常被接触的部分(V.230204)

       运行时经常被接触到的部分:跳线/插头、插座/光纤适配器、标签。

图1.5 数据中心内可能被接触到的布线产品(安装图)↑

1.6 跳线混乱的原因和后果(V.230205)

       在综合布线系统刚移交给甲方时,往往是跳线最整齐的时候,但在使用一年后,就有可能已经出现跳线混乱的现象。

图1.6A 运行一年后的机柜正面↑

  跳线一旦混乱,会引出许多麻烦:看不清LED、影响旁边的跳线、相互缠绕导致损坏。

       综合布线系统所在的机柜内除了综合布线系统外,往往还有网络设备/服务器等等各种IT设备,各种设备的运维人员都在不断的对自己的设备进行安装、调试、开通和检测,期间必不可少会用到综合布线系统。如果他们每一次使用综合布线系统后都对综合布线经过数月或数年的累计,机柜内外的跳线将会越来越乱。在某些数据中心中,每年专门会抽几天对综合布线系统进行跳线整理,使综合布线系统的机柜正面重新变得整洁。

        跳线混乱对于添加跳线的IT人员并没有太多的麻烦:选择一根长些的跳线,在跳线堆中找到自己所要的端口,插入跳线即可。这时,他解决了自己所需要的传输连接,他认为他的事情做完了。但是,这样插跳线的方式却给跳线的维护带来了许许多多的技术问题和麻烦。

       跳线混乱所带来的技术问题是:

       a. 设备端口旁的LED指示灯被遮盖,IT人员难以根据指示灯的显示状态直观的获知设备端口的运行信息;

       b. 插拔跳线的动作容易影响旁边的跳线,存在拉扯周边跳线的可能性,严重时会导致自己的跳线插好了(或拔出了),但旁边某个端口的跳线运行状态被破坏,引起不可预测的系统故障。即一波未平,一波又起,乱中出错。

       c. 跳线受重力影响会下垂,当遇到其他跳线时,会将自身重量“倚靠”在其他跳线上,导致其他跳线的端口上承载着附加的重量。一根两根的重量无所谓,但如果是机柜正面有数百根跳线,彼此缠绕着,就会出现最高处的某一根或几根跳线上承载着远超自身抗拉强度(指跳线插头的抗拉强度、插头座之间的锁扣抗拉强度)的重量,时间长了,就会出现这一根或几根跳线中的某一根被拉坏的现象,导致传输中断或备用传输线路失效的后果。由于这样的传输中断大多没有先兆,所以对IT系统运行会造成突发性的管理混乱(系统自动切换到备用线路),甚至传输故障(没有备用线路)。

       从美观角度看,机柜照片中出现了惨不忍睹的跳线混乱场景,会致使谁看谁摇头,最终令机房变成了对外不开放的空间。这与许多家庭在迎接客人之前,往往需要花几天时间进行整理是相通的。说穿了就是顾了里子,丢了面子。

       跳线混乱在海外同样存在,这是普遍现象,由人的心理因素所致:大多数IT人(包括布线运维人员)习惯于综合布线系统带来的稳定、高速和灵活、通用,对布线系统的认识仅仅在于插拔几根跳线,没有意识到跳线应整理整齐。

图1.6B 混乱的机柜正面↑

1.7 人的记忆比不过系统的记录(V.230205)

       在大学的数据中心和银行的数据中心,有些管理人员很自豪的说:布线系统全部藏在自己的脑子里,随时随地可调出信息。

      布线系统在设计时的性能往往会超过同期IT系统的传输要求,所以在运行时应充分挖潜,让布线系统的性能充分发挥出来。

       可一旦需要变更或维护,被忘却就是花时间的代名词。

1.8 保存真实的记录(V.230205)

       在管理工作中,所有的记录都必须使真实的,它包含着有效的、齐全的含义。试想一下,如果记录使无效的(如:拍脑袋想出来、编出来应景的),那记录再多也只是浪费空间而已。同样,如果记录有缺失,就无法反映事件的真实性和事件的各个方面。

       想要保存真实的记录,就意味着在事件发生前应该想好需要记录哪些信息以及什么时候采集记录。在事件发生时,应该如实的、及时的记录事先确定的记录项。这其中,有几种做法是需要验证的:

       其一,先装入自己的脑袋里,然后等有空了凭借回忆补写记录。由于人脑的记忆往往会出现张冠李戴、遗忘的现象,所以凭借记忆形成的记录有一定的出错概率,需要进行验证以确保期真实性。当事后凭记忆做的记录还需要进行验证是,所消耗的人力还不如事件发生是立即记录。

       其二,人工录入。人工录入是经常见到的记录方法,但因笔误所产生的出错率同样存在,例如在网文中,文字错误经常可见;在书籍出版时,规定有笔误概率……为此,当采用人工录入时,应换人进行笔误检查,发现错误后立即更正。

       其三,OCR识别录入。OCR本身就有识别错误概率,同样需要进行人工核实和纠错。

       对于综合布线系统而言,理想的录入方法有以下几种:

       (1) 竣工资料:由施工方移交,同时拥有纸质版和电子版。纸质版存档,电子版直接使用(有可视软件时)或自动转换成管理系统可识别的版本。

       (2) 跳线更改:采用可自动监测跳线两端的智能布线管理系统(也称“电子配线架”,英文为AIM),借助于自动监测功能自动形成跳线更新包含端口号和时间的自动记录,管理人员仅需对照更新前发出的工单,在显示终端上逐一进行确认即可。当跳线信息更新后,原有的跳线信息仍需保存,与其它相关信息一起作为历史记录存档。

       (3) 跳线追踪:采用可追踪跳线,利用跳线上的光电显示系统,在一端注入信号,在看到跳线另一端所发出的可视信号时,可以确认这根跳线的两端位置,以此形成记录(文字/照片等)。这一方法在跳线信息缺失时可以快速保全信息。但需要在设计时选用可追踪跳线,或在系统验收移交后立即将所有的跳线更换成可追踪跳线,因为常规的跳线不具备可追踪功能。

       保存真实的记录需要制度和管理予以保证

       真实的记录是运维管理规范化的基础,是超前管理的基础

       布线系统保存真实的记录方法之一是传感器自动录入,人工确认和添加注释。即使用智能布线管理系统。减少人工导致的失误和笔误

       常规的记录方法有:现场手书记录和电子记录、录音、录像、照片等等

       需要保存的记录分两类:

       (1)当前记录

       (2)历史记录

        所有的记录应进入文档管理系统长期保存,用于事后分析和统计分析

在繁忙的数据中心管理时,管理人员往往会被突发的事转移注意力,容易疏忽事件的记录,特别是周全的记录

       有些管理人员很自豪的说:“布线系统全部藏在自己的脑子里,随时随地可调出信息。”直接的后果是其他人因为不了解情况,无法参与管理或花费许多时间。而他自己则付出了巨大的代价:不能走。

       有些人喜欢忙完后凭记忆录入记录,结果是可能会记忆出错,只要有1%的记录出错,就意味着可能有10%或更多的记录出错,需要花费大量的时间去核实和修正。

       在记录时,还可能发生笔误,严重时记录失效。

       运维管理需要“真实的记录”,只有真实的记录能够帮助运维人员在全生命周期内了解现在和过去所发生的演变。而人的记忆、笔误、不完整的记录、虚构的记录都将使后续运维的工作量大幅度增加。

       真实的记录是现代化运维管理的基础

       记录对规范化管理的作用(举例):

       a.清晰的知道过去在哪里做过哪些的工作,结果如何

       b.布线产品(包括标签)的损坏数量、当前库存数量

       c.清晰了解网络设备等应用系统的接口,在更换设备前预备相应的布线产品

       记录对超前管理的作用(举例):

       a.根据产品损坏的变化趋势,提出采购申请报告

       b.根据网络设备等应用系统的接口需求变化趋势,必要时提出整改申请报告

       c.根据光纤连接器的插拔记录和损坏概率,安排维护计划

       d.根据运行和维护后的统计数据(效果、耗时),组织培训或改变运维策略