美章网 精品范文 计算机网络故障论文范文

计算机网络故障论文范文

前言:我们精心挑选了数篇优质计算机网络故障论文文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。

计算机网络故障论文

第1篇

[论文摘要]故障管理是计算机网络的管理最基本、最重要的功能。文中针对网络故障管理进行研究,并提出了网络故障管理智能化的方法,为网络故障智能化的进一步发展奠定了基础。

一个网络管理系统有五大功能域:故障管理、配置管理、性能管理、计费管理和安全管理其中,故障管理是最基本,也是最重要的功能。目的是保证网络能够连续可靠地运行。如果网络服务意外中止,将会对生产、生活造成很大影响,这就需要一套科学的故障管理策略,及时发现故障、排除故障。

现在一些网管软件趋向于将专家系统等人工智能技术引入到网络故障诊断和排除中。提高网络故障的智能水平有助于网络高效、可靠地运行。网络管理的智能化也是发展的必然趋势。为此本文针对网络故障智能化管理进行研究,并提出了建立事件知识库提高故障管理的智能水平的方法,为网络故障智能化的进一步发展奠定了基础。

1.计算机网络故障管理技术研究

(1)故障管理概述

故障是指软、硬件的缺陷;错误则是软硬件的不正确输出;失效是指所有和某故障有关的错误造成的网络的非正常运行。网络故障按生命周期可分为永久故障、暂时故障和瞬间故障三类;按故障对网络造成的空间失效范围的大小,可将失效分为四类:任务失效、基本网络部件失效、结点失效和子网失效。故障管理的主要任务是及时发现并排除网络故障。一般说来,故障管理包括以下几个内容:故障监测和捕获故障产生相关的事件和报警;定位分析故障、记录故障日志;如有可能排除故障等。

(2)故障管理的类型

故障类型指的是具有某种特征的故障的分类。通常我们可以根据故障发生来源的不同,将它们划分为两大类,即硬故障(harderrors)和软故障(softerrors)。

硬故障是指网络的硬件设备在工作过程中产生的各种错误。这些错误与该设备的作用有密切关系,网络系统的复杂性也正是由于设备的多样性而体现出来的。根据这网络设备的作用,我们也可以将故障简单分为以下三类:

①连接设备故障

这种故障的现象主要是网络的物理连接出现问题,也可以称为通路故障。造成故障的原因可能是电缆线断开、收发器断开或不能正常工作以及其它连接设备间的接口出问题等等。根据这类故障的来源不同,我们又可以将该类型的故障细分为线路故障、网络接口故障、收发器故障、路由器故障等等,该类故障是故障管理的最主要对象。

②共享设备故障

这种故障的表现是用于资源共享的设备出现问题,不能提供或享受所需的服务。同样,该类型的故障也可以细分为服务器故障(打印机故障、文件服务器故障等)、工作站故障等等。

③其它设备故障。包括电源故障、监控器故障、测试仪故障、分析仪故障等等。

软故障是指网络系统软件运行出错。软故障的发现和处理是在管理过程中逐渐被人们所认识的,因为软件属于一种无形的东西,问题的表现不如硬件那么直观。从这个意义上看,软故障的识别和诊断更加困难。故障管理中所处理的软故障主要针对与网络通讯和服务有关的系统软件,它可以直接根据网络软件来划分,包括通讯协议软件故障、网络文件系统(FNS)故障、文件传输软件故障、域名服务系统(DNS)等等,其中通讯协议软件故障是系统研究的重点。这种错误通常是在协议软件运行时遇到某个异常条件(如缓冲队列满)或协议软件本身未提供可靠机制而导致传输失败,报文丢失。

故障类型并不是一成不变的,随着网络在复杂性和规模上提高,网络故障管理的要求也在不断增加。新的技术、设备的应用使故障的类型、故障原因、故障源等各方面都发生了变化,这就要求故障管理系统必须增加新的内容。

(3)故障管理的功能

故障管理的根本目标在于排除网络中出现的各种故障,达到这一目标要求系统至少必须具备检测、隔离和纠正故障的能力。

故障检测(detection)是指对系统的性能和状态进行检查和测试,根据结果和一定的识别规则判断系统是否故障。故障检测要求管理系统监视网络的工作,考查网络的状态及其变化,一旦发现系统出现故障马上进行报警。

故障隔离(isolation)是指确定故障发生的位置,通俗地说就是指出谁发生了故障,如哪个子网、哪个设备或者设备的哪个部件,对于软故障则指明哪个系统出了问题。由于网络是一个复杂的系统,故障类型、原因、故障源多种多样,而且不同故障的表现可能完全相同,这就导致了故障隔离的复杂性。隔离系统应当尽可能地缩小故障源的范围。

故障纠正(correction)是指纠正所发生的错误,恢复系统的正常工作。故障纠正建立在前两者的基础之上,目前所采取的手段除了进行硬件维修、系统重启、一定程度的恢复外,还包括一些非技术性的活动,如人员的使用和技术培训以及设备生产厂商的支持等。

(4)影响故障管理的因素

与网络管理一样,故障管理也必须考虑三方面的因素:过程、设备和工具、人员。成功的故障管理策略是这三者的完整结合,而不仅仅是其中的某一个方面。

过程主要指为实现故障管理功能而进行的操作,下一节介绍的内容就属于故障管理的过程。了解管理的一般过程是开发一个实用的故障管理系统的基础。

设备和工具指的是进行故障管理的软硬件工具,包括故障检测设备、维修设备、实用的故障管理系统等。设备和工具在故障管理中起着非常重要的作用,它可以帮助管理员和工程师实施管理功能,排除故障,保障网络系统正常运转。下面介绍的就是几种专用的物理设备:

①时间域反射测量仪(TDR)。通过显示物理介质传输信号的波形表明设备或链路是否故障。

②网络监视器。监视网络上各结点的状态,得到网络的各种统计数字,以确定是否故障。

③网络分析仪。实时分析结点的收发报文,帮助管理者跟踪和隔离故障。管理人员在故障管理中的任务主要是维护管理系统和工具的运行,并在它们的帮助下完成故障排除和系统恢复工作。

2.智能化网络管理的概述

为了能够更有效地对各种大型复杂的网络进行管理,许多研究人员将人工智能技术应用到网络管理领域。虽然全面的智能化的网络管理距离实际应用还有相当长的一段路要走,但是在网络管理的特定领域实施智能化,尤其是基于专家系统技术的网络管理是可行的。

用于故障管理的专家系统由知识库、推理机、知识获取模块和解释接口四大主要部分组成。专家系统以其实时性、协作管理、层次性等特点,特别适合用在网络的故障管理领域。但同时专家系统也面临一些难题:

(1)动态的网络变化可能需要经常更新知识库。

(2)由于网络故障可能会相关到其它许多事件,很难确定与某一症状相关的时间的开始和结束,解释和综合消息复杂。

(3)可能需要大量的指令用以标识实际的网络状态,并且专家系统需要和它们接口。

(4)专家系统的知识获取一直以来是瓶颈所在,要想成功地获取网络故障知识,需要经验丰富的网络专家。

在实现智能化网络管理系统时,还必须把握系统复杂性与系统性能的关系。不仅要利用将较为成熟的人工智能技术,而且要考虑实现上的复杂度和引入人工智能技术对系统性能和稳定性的影响。

3.事件知识库的研究

在专家系统中,知识的表示有逻辑表示法、语义网络表示法、规则表示法、特性表示法、框架表示法和过程表示法。产生式表示法,即规则表示法,是最常见的一种表示法。其特点是模块性、一致性和自然。知识库是知识的集合,严格意义上的知识库包括概念、事实和规则只部分,缺一不可。

为了提高故障管理的智能水平,可以建立事件知识库(EKB,EventKnowledgeBase,

用于存储所有己知事件的类型、产生事件的原因和所造成的影响,以及应该采取什么样的措施等一些细节的静态描述。这个EKB并不是真正意义上的知识库,它的数据仅仅包含了属性值与元组,而属性值表示概念,元组表示事实。但研究EKB可以为今后建立完善的知识库奠定基础。

在EKB中存储了己经确定事件。最初,被确定的事件仅限于一些标准事件和措施。随着网络的运行和系统的反馈,EKB的内容将不断增加。

理想状态是能够确定所有的事件。

下面是EKB涉及到的只种基本的数据库表:

(1)事件类型表:该表中主要存储了事件的静态定义。

EKB中保存了己确定的事件可能涉及的相关知识,如事件类别(如:性能、系统、网络、应用事件或其它)、严重程度(如:严重、主要、次要、警告等)、产生事件的设备标识、指明设备的类型、事件造成什么影响(如:影响网速、单个用户不能访问等)、故障排除参考策略、上次更新的时期/时间、关于这个事件的备注信息、事件的详细描述等。

(2)实时事件表:描述了正在运行的网络中的实时事件。

实时事件表中提供可能用的一些字段,用于记录网络运行中发生的事件,如:设备的ID(从IP地址或查询设备表可以获得)、实时事件的状态(如:新增、确认、清除等)、根据故障票ID获得的相应的故障票信息等。

(3)设备信息表:存储了网络中设备的实际参数。

设备信息表主要记录了每个设备的相关参数。例如,设备ID号、IP地址、设备名称、厂商、类型、重要性级别等。

EKB中存储的相关事件的知识主要来源于专家。开发人员将获得的知识应用到与故障管理相关的系统中,根据不同系统的需要分配相应的知识,以提高系统性能。虽然EKB并不是严格意义上的知识库,但在开发过程中,可以通过不断地增加和修正EKB的内容,在一定程度上提高系统的智能水平。

4.结论

文中分析了网络故障的类型,提出将事件知识库用于计算机网络故障的智能管理。实验表明,计算机网络故障的智能管理提供了基于知识的决策手段,比传统的管理方式具有更高的决策水平,为专家系统技术在故障的检测和隔离方面更加广泛的应用,奠定了一定基础。

参考文献:

[1]赵志囡等.计算机网络中的服务[M].现代情报.2006.(11)

第2篇

一般情况下,可将计算机网络故障分为物理故障和逻辑故障两种。

1物理故障

物理故障又被称为硬件故障,出现这种网络故障的原因是当计算机网络设备或线路受到外界因素的作用时,发生了一定程度的损害或接口发生了松动等,或是因为人为因素而使得网络连接出现错误。其主要的表现方式是网络断开或网络状况不稳定,时断时续。另外,物理故障还可以分为以下几种:①接口故障。这主要是因为插头松动或者端口本身受到了一定程度上的物理损害。②线路故障。其故障发生的比例还是比较高的,一般是因为线路受到了损害或者干扰。③路由器或交换机发生了故障。在网络正常运行的过程中,有时可能会因为交换机或路由器本身受到了损害,使得计算机网络不能正常运行。④网卡故障。所谓“网卡”,就是经常说的网络适配器,通常情况下,网卡都是安装在计算机主机里的,有时候网卡会松动或者网卡自身受到了物理损害等。

2逻辑故障

逻辑故障又被称为软件故障,它是因为计算机内部所安装的软件出现错误或者计算机网络配置出现问题,而导致计算机网络不能正常运行。逻辑故障主要可以分为三类:①进程故障或端口故障。当计算机的端口或进程遭到病毒入侵时,会导致计算机不能正常运行。另外,计算机还可能会受到其他软件的影响,而导致系统关闭。②主机的逻辑故障。它是因为网卡的驱动程序发生了错误,网络参数配置不正确,又或是网络通信协议不当而引发的网络故障。③路由器故障。逻辑故障也会发生在路由器上,比如路由器的内置配置错误,端口参数出现了错误,内存不足或中央处理器利用率太高。

二计算机网络故障处理

1断开本地连接

当计算机网络发生故障时,如果要断开本地连接,一般的处理步骤为:①根据日常生活,结合计算机的应用经验,可初步认定这类故障属于物理故障;②依照一定的思路分析计算机网络结构的模型,确定该故障是否发生在物理层;③采用测线仪等网络测试工具测试网线与端口的连接是否正常,经过处理后,再查看一下计算机网络是否可以正常运行。

2本地连接正常但无法浏览网页

这类故障属于逻辑故障,一般是因为浏览器自身发生故障而引起的,又或者是被计算机上的一些软件恶意篡改系统而导致网页不能访问,还有可能是因为域名系统的配置出现了错误,这时,就要检查相关配置。

3本地连接受到限制/无连接

在使用计算机的过程中,经常会遇见本地连接受到限制或者无连接的情况,一般情况下,这是因为参数配置不正确或者网络协议出现了错误。在检查它们的过程中,还要注意网络设备设置是否处于正常的状态,待找到造成网络故障的原因后,进行有效的修复或者重新安装一些软件。

三计算机网络的维护

1软件的维护

计算机作为软件的载体,为了保证计算机网络能够正常运行,要定期对软件进行维护。具体的工作主要从下面几个方面入手:①维护系统,及时清理垃圾和没用的文件等;②做好计算机的防毒工作,安装杀毒软件,并定期升级软件;③在计算机网络数据库中,对于重要的信息,要备份或加密,以防数据泄露或丢失;④定时备份计算机里的注册表,以防发生网络故障,损失注册表;⑤定期检查网络的通畅性,及时排查故障。

2硬件的维护

在维护计算机的过程中,要先排查计算机电源、网线、网卡或路由器引发的故障。如果检查后发现不是这些引起的故障,就要再对硬盘、显卡和显示器等进行故障排查。在日常生活中,由于计算机长时间未清洁,灰尘过多,使得计算机不能正常运行。

3其他方面的维护

创建一个计算机网络维护方面的文档,记录每次计算机发生故障后处理、维护时的相关内容。这样,如果下次再出现同样的网络故障,就可以根据文档中记录的故障处理方法和步骤解决相关的问题。

四结束语

第3篇

1.1软件故障

事实上,一旦脱离应用软件计算机就很难继续运行,所以说部分应用软件的故障也会造成网络通讯的中断。通常情况下,软件的安装错误造成的网络通讯故障会比硬件故障造成的损伤更大。例如,在软件的应用过程中经常会发生IP地址冲突、网络协议等故障,影响网络通讯的速度,造成线路中断。造成这些故障的主要原因有:其一,病毒侵扰。部分恶意病毒会扰乱网络通信软件的正常运行,造成链接线路的中断,此类故障在网络时代十分张建;其二,计算机交换机的配置。一些交换机配置的兼容性会伴随型号的变化而发生相应的变化,造成交换机配置发生错误,影响整个的网络通讯;其三,计算机主机逻辑发生问题。这是受到主机安全性能的影响,造成整个网络地址的混乱,使得计算机主机的IP与其他主机发生冲突,造成通讯线路的被迫中断;其四,计算机软件中的网卡发生后故障,网卡损坏会对网卡造成很大的伤害,最终使得计算机无法正常运行。

1.2安全问题

一般而言,网络通讯安全问题主要有以下三点:首先是自然条件的影响,也就是环境温度、适度有机一些不可抗拒的外部环境,这些都会在不同程度上对计算机造成影响,使得用户的密码被破译或者丢失;其次,是人为作用。人为作用即人为性质的恶意破坏,有人处于某种私利损坏计算机网络系统,进行不正当的偷听、假冒等行为,意图偷取计算机系统中用户的个人信息沟壑重要资料等;最后,病毒入侵。病毒入侵指的是黑客以及部分编制设计出隐藏性高、破坏性强大的病毒,意图破坏计算机的正常运行,将整个的计算机网络陷于不安全的环境之下。

2.处理计算机网络通讯故障的有效措施

2.1加强日常维护,改善硬件环境

计算网络通讯软件、硬件设备都需要根据使用手册进行日常的维修与保养,这是保证计算机正常运行的重要条件。计算机硬件需要进行定期的检查,一般检查对象有交换机、路由器、网卡、网线、显示器进行等。在检查的过程中,对于发现的问题需要及时采取措施进行修理,将已经发生故障的部分进行更换。与此同时,要定期检查计算机网络通信的安全性能,保证计算机系统处于加密状态,从而进一步改善计算机的硬件环境,让计算机得以正常运行。在计算机网络通讯初步建立时期,就需要严格根据国家制定的指标开展工作,在建设完成的基础之上,再由公安机关进行严密的检查之后才能正式运行。不仅如此,相关人员要做好计算机的防火、防水等硬件保护工作,为计算机提供一个良好的硬件环境,使得计算机网络通讯系统得以正常运行。

2.2及时进行检测,做好软件维护工作

在计算机网络通信系统的运用过程中,要注意及时检测计算机配置时候存在潜在隐患,正确的设定IP协议,保证计算机设备驱动能够正常运行。倘若设备驱动能够正常运行,则需要进行木马检查,检测计算机系统是否存在软件故障等隐患。与此同时,还可以借助杀毒软件来保护计算机软件的安全,定期检查计算机系统中是否存在病毒软件,及时的更新杀毒软件,重新安装已经发生故障的系统软件,做好系统漏洞的修复工作。需要注意的是,在计算机软件的使用过程中,需要对软件、文件进行有效的管理,将运行的软件控制在一定数量以内,使得计算机一直处于最佳的状态,避免计算机的高负荷运行,导致运行速度的降低,从而影响到整个计算机网络通讯的数据传输。

2.3注重计算机安全,构建保障体系

现阶段的计算机网络通讯技术都是自动化运行,大大降低了人为性的干扰因素,提高了计算机的智能化水平。因此,在提高计算机网络安全的管理水平,强化安全管理意识,定期进行计算机网络通讯检查,对网络管理人员进行统一的培训,有利于提高管理人员对网络故障的处理水平,让其能够及时处理计算机网络出现故障。与此同时,计算机网络管理建立健全相关的保障体系,积极投身于计算机智能化的开发工作,以此来提高计算机网络通讯的安全性能和运行质量。通过这样的路径来构建安全的计算机网络环境,促进计算机网络通讯得以更好的发展。

3.结语