能不能期望我们每一位设备管理软件员都能够解决网络运行中出现的所有问题呢?通过多年设备管理系统的总结我认为,如果预先采取一定的措施,并且使用正确的故障诊断方法,那么回答是肯定的。下面给出了一个较为完整的过程,敬请各位同行批评指正。 及时更新网络图首先应该绘制一个网络方框图。这个文档的作用是为从事故障诊断的人员提供一个关于网络布局和配置的全部信息的单一来源。网络图上包含的主要内容有:
*路由器的连接图;
*设备的序号、型号及端口情况;
*使用的路由协议(如RIP、OSPF等);
*IOS版本(用于具有何种性能查找和判别);
*已安装的模块;
*访问控制列表;
*地址(网络地址和序号,MAC地址更好);
*交换机(型号);
*集线器(Hub型号);
*所有配置的拷贝。
当网络使用发生变化时,要及时更新网络图。如果没有更新网络图,那么您的网络图的用处就要大打折扣,这将是非常危险的。如果出现这种情况,您必须马上绘制一幅新的网络图,而不是依赖那个不能反映实际情况的老的网络图。
当网络以通常方式运行时,必须符合网络性能的基线。基线用来记录网络在低、中和高使用量时的信息量。它建立了一个网络运行性能的记录,该记录可以用来进行比较,以确定是否出现问题。网络运行性能基线中包含以下主要内容:
*网络上运行了哪些协议;
*每个协议使用的带宽百分比;
*每个协议的峰值使用量和平均使用量;
*数据包的大小以及每种大小数据包的百分比;
*循环冗余校验(Cyclical Redundancy Check,CRC)发现的错误的峰值和平均值;
*网段每秒钟传输的信息帧的峰值和平均值;
*是否存在超长的数据包;
*冲突域每秒产生的冲突的峰值和平均值;
*网段运行的峰值和平均值。故障诊断方法与步骤正确地确定问题是解决问题的关键。下面我们按照顺序介绍故障诊断方法、步骤。应该注意的是这些步骤往往是相互重叠的,而且解决问题的方法实质上是循环式的。
⑴确定网络问题的性质;
⑵收集有关的情况并对问题进行分析;
⑶分析问题产生的原因;
⑷设计一个解决问题计划;
⑸实现这个解决问题计划;
⑹评估该解决问题计划产生的结果;
⑺重复上面的操作,直到问题得到解决;
⑻将解决方案记入文档资料。
确定网络问题的性质实际上就是要提出问题。即谁出了问题,是什么问题,何时产生和出现在何处这样的形式。这些问题可能会多次出现,您可以向用户、设备管理软件员、以及遇到或者了解问题的其他人详细提问:谁受到了问题的影响?是单个用户还是存在共性的一组用户,甚至是整个网络中的所有用户呢?
若是单个用户可能出现下列若干问题中之一:
*物理层问题,包括发生故障的网络电缆。可用Ping来测试;
*在特定主机上的硬件故障。用Ping 127.0.0.1或Ping本机地址来检测;
*软件加载不正确或者崩溃了,尤其是网络协议出了问题。可重装软件或删除网络协议后重新加载网络协议;
*主机地址或者子网掩码设置不正确。可修正主机地址和子网掩码;
*默认网关配置不正确。可用Tracert检测,重新修正默认网关。
拥有公共属性或者遇到问题的一组用户可能出现下列若干问题:
*网络设备(比如集线器或者交换机)发生了故障;
*路由器接口发生故障;
*服务器发生故障;
*访问列表设置错误;
*VLAN配置错误。
在我们知道谁出了问题后,就要集中精力解决:这个问题有何表现?是没有连接还是只有部分连接的问题,或者是根本没有连接的问题呢?如果是没有连接的问题,那它就属于:
*硬件故障;
*远程通信服务故障;
*路由协议故障。
如果是部分连接的问题,那它属于;
*访问列表问题;
*子网掩码不正确;
*路由协议不兼容。
这个问题何时发生呢?是间歇性出现还是经常发生的问题,或者是刚刚发生的问题呢?
如是间歇性发生的问题,其原因可能是:
*远程通信服务故障;
*信息拥挤;
*路由循环。
如是经常发生的问题,那么原因是信息拥挤。出现新问题的原因是:
*访问列表发生变化;
*新的硬件故障;
*路由协议发生变化;
*新增加的路由。
正确确定网络问题的性质,是我们判断是广域线路问题还是局域网中的问题的基础。
信息发布:广州名易软件有限公司 http://www.myidp.net
|