某证券公司,上午9:45,大户室中的一群声称遭受巨额无端损失的愤怒的股民们聚集在营业部计算中心的机房门前,质问为什么实时交易的动态信息显示屏幕出现大片空白,数据刷新和交易的速度都极慢,且经常中断,根本无法进行交易。扬言如果不立即恢复交易,将砸掉证券交易所的计算机。交易大厅的散户们也开始向机房云集,如果不及时处理,情绪激动的股民们很可能真的会将营业部计算中心的网络设备砸个稀巴烂。该网络的用户均为10M以太网链路,用户数为730个。交易系统从卫星上接收通过广播方式传输来的行情数据,并将股民的交易信息回传给交易中心。从卫星接收机的监测口观察,接收到的数据完全正常,故网管人员初步判定是证券公司的营业网络系统有问题。其实,这个故障现象两个月前就已经开始出现,当时就有传输数据出错的现象出现,有时行情的数据更新出现空白,有时数据更新速度偶尔会变慢,有时还会出现数据更新的断续现象。虽然做过详细的检查,并用网管系统和协议分析仪进行监测和分析,但因这种“症状”并不连续出现,且对网络的速度和股民的交易基本没有影响,故一直没有查找到真正的故障原因。网管人员一直心存侥幸,曾经试着启用备用的服务器和更换部分交换机、集线器等,但都没有解决问题。前天参加了“第二轮证券系统Y2K统一认证测试”,顺利通过。利用剩余时间网管人员对系统进行了检查,并对部分硬件设备进行了检测和维护。之后恢复系统,进行联网检查。网络表现正常。不料今天开市就出现严重问题。
用网络测试仪F683反接入网络任一端口,监测网络30秒,观察到对口网络流量为81%.监测其它端口和部分链路,发现也在81%左右(网管报告对应的端口为0.2%左右),错误帧97.6%.错误类型为Ghosts(占93%)、FCS错误(又称CRC错误)和Jabber,即幻象干扰、帧校验错误和超长帧,这表明网络中有大量的非法数据包存在。停止服务器和用户交易,监测的数据基本没有变化,说明错误的数据帧来源与应用或网络设备基本无关。怀疑是某个网络成员“捣乱”攻击网络的可能性应该不大,因为不会有如此均匀和数量巨大的错误帧,否则因为交换机的关系会将其拒之门外。此类症状一般以电磁干扰和接地回路方面的问题居多,干扰的通道不通过网络链路通道进入,而是从接地回路的通道串入到网络设备的每个端口。为了确定干扰源的准确位置,将大部分与工作站相连的集线器组电源关断,服务器继续工作,观察错误率降为87%,仍然很高。重新打开集线器组电源,用F43电源谐波测试仪观察,发现谐波含量严重超标(最高达1970mV)。该网络用一台大型UPS电源给所有网络设备供电,用电源谐波分析仪测试UPS输入电源谐波,约为输出电源谐波含量的30%,明显低于输出端的指标,断定为电源“内谐波”含量超标。启动小型备用UPS顶替部分网络设备尤其是服务器等主要设备的供电电源,网络立刻恢复正常工作(为减少负荷,故采用网络设备分批轮换接入的方法)。不过,继续用网络测试仪观测网络,其结果仍显示有错误存在,错误率(幻象干扰)下降为1.3%。再次关断集线器组和交换机等网络设备的电源,类型为“Ghosts”(幻象干扰)的错误率下降为0.8%,证实仍存在由接地回路串入的幻象干扰,且应该是从主通道进入。分段检查主数据通道的设备和零部件,当摇动卫星接收机的数据输出电缆时,发现幻象干扰时有时无。拔下电缆则干扰消失。网管人员据此回忆前日维护机器时曾动过该电缆,可能由此造成连接不良或芯线与屏蔽层“似接非接”。为使股民能继续交易,稳定其情绪,更换电缆后又将原UPS启动继续工作提供服务。收市后再更换大型UPS,故障彻底排除。

