物理层故障
物理层是0SI分层结构体系中最基础的一层。它建立在通信媒体的基础上,实现系统和通信媒体的物理接口,为数据链路实体之间进行透明传输,为建立、保持和拆除计算机和网络之间的物理连接提供服务。物理层涉及底层通信及相关网络设备,像中继器、集线器、多路复用器和网卡(NIC,即网络接口卡)等均运行在物理层上,物理介质的质量在很大程度上决定了网络的基础性能。故可从如下方面了解常见的物理层故障。
1.物理线路故障
◆线路物理连接错误导致不能正常通信,如在局域网中直通线与交叉线的错用。
◆电缆制作标准不统一,如双绞线的EIMA-568-A与EIA-568-B。
◆违反接线规则或布线规则,如以太网连接的543规则。
◆模块、跳线等物理故障。
2.网络设备端口设置问题
◆两端连接端口物理类型不匹配,如RS232与V.35之间的转换。
◆通信两端相关端口设置不正确,如速率、双工等。
◆通信端口人为关闭等。
3.集线器故障
(1)网络传输信号的质量和信号传输的状态有时可能与介质的性能和质量关系不大,而与设备本身的质量有关。可以经常定期地对集线器端口发出的数字基带信号的质量进行监测,比如,定期地看一看信号的强度、抖动、极性、前后延波形等是否符合要求。事实上会发现,一个工作了三年的集线器,可能有甚至高达5%-10%的端口存在老化问题,传输的信号质量大打折扣。
(2)连接距离超过线缆或相关技术要求。在局域网连接范围较远
网技术的要求。在传统10M以太网中最多可以通过集线器级连四级,使网络的最大传输距离可以达到600m,而当网络升级到快速以太网时,就只允许两个100M集线器级连了,而且两个集线器的连接距离不能超过5m,即在100M快速以太网中使用集线器时最大传输范围不能超过205m,否则就不能正常通信了,这就是由于所使用的以太网技术而限制的。
(3)电缆的连接方式错误。集线器之间级连时,所使用的端口不同,相应的电缆连接方式也不同,例如交换机集线器通过Uplink级连时使用直通线,而不通过Upl1ink口级联时必须使用交又线等。
(4)网站制作集线器端口故障。集线器端口由于经常拔插以及使用劣质水镜头,都可能导致端口故障或接触不良,这时可换个端口试试,或者关闭设备电源重新启动。
网络的分层诊断技术
为了降低设计的复杂性,增强通用性和兼容性,计算机网络互联都设计成层次结构,例如典型的应用性架构TCP/IP协议簇,它相应地也遵循OST的七层理论模型(所有网络架构组成的理论框架),这种分层体系能够使多种不同硬件系统和软件系统能够方便地连接到网络。正是基于这一网络结构特点,网络管理员在分析和排査网络故障时,可充分利用网络这种分层的特点,把网络故障层次化、简单化,快速准确地定位并排除故障。然而在实际故障排查过程中,这种分层方法往往被忽略,导致故障排査效率降低。
OSI的层次结构把每层功能及职责范围定义得非常清晰,为管理员分析和排查故障提供了非常好的组织方式。由于各层相对独立,按层排査能够有效地发现和隔离故障,因而一般使用逐层分析和排查的方法。通常有两种逐层排查方式,一种是从低层开始排査,适用于物理网络不够成熟稳定的情况,如组建新的网络、重新调整网络线缆、增加新的网络设备;另一种是从高层开始排查,适用于物理网络相对成熟稳定的情况,如硬件设备没有变动。无论哪种方式,最终都能达到目标,只是解决问题的效率有所差别,第一种方法较为普遍。
具体采用哪种方式,可根据具体情况来选择。例如,遇到某客户端不能访同Web服务的情,如果管理员首先去检查网络的连接线缆,就显得太悲观了,除非明确知道网络线路有所变动。比较好的选择是直接从应用层着手,可以这样来排查:首先检查客户端Web浏览器是否正确配置,可尝试使用浏览器访问另一个Web服务器:如果Web测览器没有问题,可在Web服务器上测试Web服务器是否正常运行:如果Web服务器没有问题,再测试网络的连通性。即使是Web服务器问题,
从底层开始逐层排查也能最终解决问题,只是花费的时间太多了。如果碰巧是线路问题,从高层开始逐层排查也要浪费时间。在实际应用中往往采用折中的方式,凡是涉及网络通信的应用出了问题,直接从位于中间的网络层开始排查,首先测试网络连通性,如果网络不能连通,再从物理层(测试线路)开始排查:如果网络能够连通,再从应用层(测试应用程序本身)开始排査。
据统计,网站建设网络故障有35%在物理层,25%在数据链路层,12%在网络层,10%在传输层,8%在对话层,7%在表示层,3%在应用层。由此可以看出网络故障通常发生在网络七层模型的下三层,即物理层、链路层和网络层,对应于实际的网络也就是我们使用的网线、连接模块、网卡、交换机、路由器等设备故障。这些故障可能因为产品的质量或性能、磨损老化、人为误操作、不正确的设置以及管理缺陷等原因而经常性地发生。其后果轻则影响单个站点的信息传送,重则可能造成网络重要设备:服务器、交换机和路由器的宕机,导致全网络的瘫痪。
确定解决方案
当确定了最终可能导致故障的原因之后,就可以方便地制出相关问题的解决方案,包括故障的诊断计划,在此同时,有两个方面要特别注意:一是可以考虑用一个最可能的故障原因进行诊断,来观察这种改变对故降的影响;二是要考虑解决方案能否破坏故障的基本现象,是否有办法把所做的改变恢复为原状。
在执行解决方案前,还需考虑以下几方面问题
所确定的原因是否真是故障原因,需要相应的诊断结果或报告作支撑。
◆是否可以对设定的解决方案进行预先的测试,并制定故障的诊断计划。
◆实现解决方案预定的结果是怎样的?
◆所制定的解决方案对于网络的其他部分有没有影响?
相应地,在实施某一项方案或计划之前,还必须做好相应的准备工作,因为实施解决方案可能导致笔试实施前更坏的情况,无论故障以及解决方案是否涉及整个网络还是个别的用户,都应该考虑怎么样把事件恢复到初始状态。所以在实施解决方案前必须完成以下相关的操作
◆保存全部的网络设备配置文件
的各段的置文件进行备份记录。
◆记录网络的基本拓扑结构,设备的物理位置以及各设备之间线路的连接关系、端口号等。
◆网站设计建立最终的基准,以便对新旧结果进行对比,同时在需要恢复时可以作为比较的依据。