前言:我們精心挑選了數篇優質計算機網絡故障論文文章,供您閱讀參考。期待這些文章能為您帶來啟發,助您在寫作的道路上更上一層樓。
[論文摘要]故障管理是計算機網絡的管理最基本、最重要的功能。文中針對網絡故障管理進行研究,并提出了網絡故障管理智能化的方法,為網絡故障智能化的進一步發展奠定了基礎。
一個網絡管理系統有五大功能域:故障管理、配置管理、性能管理、計費管理和安全管理其中,故障管理是最基本,也是最重要的功能。目的是保證網絡能夠連續可靠地運行。如果網絡服務意外中止,將會對生產、生活造成很大影響,這就需要一套科學的故障管理策略,及時發現故障、排除故障。
現在一些網管軟件趨向于將專家系統等人工智能技術引入到網絡故障診斷和排除中。提高網絡故障的智能水平有助于網絡高效、可靠地運行。網絡管理的智能化也是發展的必然趨勢。為此本文針對網絡故障智能化管理進行研究,并提出了建立事件知識庫提高故障管理的智能水平的方法,為網絡故障智能化的進一步發展奠定了基礎。
1.計算機網絡故障管理技術研究
(1)故障管理概述
故障是指軟、硬件的缺陷;錯誤則是軟硬件的不正確輸出;失效是指所有和某故障有關的錯誤造成的網絡的非正常運行。網絡故障按生命周期可分為永久故障、暫時故障和瞬間故障三類;按故障對網絡造成的空間失效范圍的大小,可將失效分為四類:任務失效、基本網絡部件失效、結點失效和子網失效。故障管理的主要任務是及時發現并排除網絡故障。一般說來,故障管理包括以下幾個內容:故障監測和捕獲故障產生相關的事件和報警;定位分析故障、記錄故障日志;如有可能排除故障等。
(2)故障管理的類型
故障類型指的是具有某種特征的故障的分類。通常我們可以根據故障發生來源的不同,將它們劃分為兩大類,即硬故障(harderrors)和軟故障(softerrors)。
硬故障是指網絡的硬件設備在工作過程中產生的各種錯誤。這些錯誤與該設備的作用有密切關系,網絡系統的復雜性也正是由于設備的多樣性而體現出來的。根據這網絡設備的作用,我們也可以將故障簡單分為以下三類:
①連接設備故障
這種故障的現象主要是網絡的物理連接出現問題,也可以稱為通路故障。造成故障的原因可能是電纜線斷開、收發器斷開或不能正常工作以及其它連接設備間的接口出問題等等。根據這類故障的來源不同,我們又可以將該類型的故障細分為線路故障、網絡接口故障、收發器故障、路由器故障等等,該類故障是故障管理的最主要對象。
②共享設備故障
這種故障的表現是用于資源共享的設備出現問題,不能提供或享受所需的服務。同樣,該類型的故障也可以細分為服務器故障(打印機故障、文件服務器故障等)、工作站故障等等。
③其它設備故障。包括電源故障、監控器故障、測試儀故障、分析儀故障等等。
軟故障是指網絡系統軟件運行出錯。軟故障的發現和處理是在管理過程中逐漸被人們所認識的,因為軟件屬于一種無形的東西,問題的表現不如硬件那么直觀。從這個意義上看,軟故障的識別和診斷更加困難。故障管理中所處理的軟故障主要針對與網絡通訊和服務有關的系統軟件,它可以直接根據網絡軟件來劃分,包括通訊協議軟件故障、網絡文件系統(FNS)故障、文件傳輸軟件故障、域名服務系統(DNS)等等,其中通訊協議軟件故障是系統研究的重點。這種錯誤通常是在協議軟件運行時遇到某個異常條件(如緩沖隊列滿)或協議軟件本身未提供可靠機制而導致傳輸失敗,報文丟失。
故障類型并不是一成不變的,隨著網絡在復雜性和規模上提高,網絡故障管理的要求也在不斷增加。新的技術、設備的應用使故障的類型、故障原因、故障源等各方面都發生了變化,這就要求故障管理系統必須增加新的內容。
(3)故障管理的功能
故障管理的根本目標在于排除網絡中出現的各種故障,達到這一目標要求系統至少必須具備檢測、隔離和糾正故障的能力。
故障檢測(detection)是指對系統的性能和狀態進行檢查和測試,根據結果和一定的識別規則判斷系統是否故障。故障檢測要求管理系統監視網絡的工作,考查網絡的狀態及其變化,一旦發現系統出現故障馬上進行報警。
故障隔離(isolation)是指確定故障發生的位置,通俗地說就是指出誰發生了故障,如哪個子網、哪個設備或者設備的哪個部件,對于軟故障則指明哪個系統出了問題。由于網絡是一個復雜的系統,故障類型、原因、故障源多種多樣,而且不同故障的表現可能完全相同,這就導致了故障隔離的復雜性。隔離系統應當盡可能地縮小故障源的范圍。
故障糾正(correction)是指糾正所發生的錯誤,恢復系統的正常工作。故障糾正建立在前兩者的基礎之上,目前所采取的手段除了進行硬件維修、系統重啟、一定程度的恢復外,還包括一些非技術性的活動,如人員的使用和技術培訓以及設備生產廠商的支持等。
(4)影響故障管理的因素
與網絡管理一樣,故障管理也必須考慮三方面的因素:過程、設備和工具、人員。成功的故障管理策略是這三者的完整結合,而不僅僅是其中的某一個方面。
過程主要指為實現故障管理功能而進行的操作,下一節介紹的內容就屬于故障管理的過程。了解管理的一般過程是開發一個實用的故障管理系統的基礎。
設備和工具指的是進行故障管理的軟硬件工具,包括故障檢測設備、維修設備、實用的故障管理系統等。設備和工具在故障管理中起著非常重要的作用,它可以幫助管理員和工程師實施管理功能,排除故障,保障網絡系統正常運轉。下面介紹的就是幾種專用的物理設備:
①時間域反射測量儀(TDR)。通過顯示物理介質傳輸信號的波形表明設備或鏈路是否故障。
②網絡監視器。監視網絡上各結點的狀態,得到網絡的各種統計數字,以確定是否故障。
③網絡分析儀。實時分析結點的收發報文,幫助管理者跟蹤和隔離故障。管理人員在故障管理中的任務主要是維護管理系統和工具的運行,并在它們的幫助下完成故障排除和系統恢復工作。
2.智能化網絡管理的概述
為了能夠更有效地對各種大型復雜的網絡進行管理,許多研究人員將人工智能技術應用到網絡管理領域。雖然全面的智能化的網絡管理距離實際應用還有相當長的一段路要走,但是在網絡管理的特定領域實施智能化,尤其是基于專家系統技術的網絡管理是可行的。
用于故障管理的專家系統由知識庫、推理機、知識獲取模塊和解釋接口四大主要部分組成。專家系統以其實時性、協作管理、層次性等特點,特別適合用在網絡的故障管理領域。但同時專家系統也面臨一些難題:
(1)動態的網絡變化可能需要經常更新知識庫。
(2)由于網絡故障可能會相關到其它許多事件,很難確定與某一癥狀相關的時間的開始和結束,解釋和綜合消息復雜。
(3)可能需要大量的指令用以標識實際的網絡狀態,并且專家系統需要和它們接口。
(4)專家系統的知識獲取一直以來是瓶頸所在,要想成功地獲取網絡故障知識,需要經驗豐富的網絡專家。
在實現智能化網絡管理系統時,還必須把握系統復雜性與系統性能的關系。不僅要利用將較為成熟的人工智能技術,而且要考慮實現上的復雜度和引入人工智能技術對系統性能和穩定性的影響。
3.事件知識庫的研究
在專家系統中,知識的表示有邏輯表示法、語義網絡表示法、規則表示法、特性表示法、框架表示法和過程表示法。產生式表示法,即規則表示法,是最常見的一種表示法。其特點是模塊性、一致性和自然。知識庫是知識的集合,嚴格意義上的知識庫包括概念、事實和規則只部分,缺一不可。
為了提高故障管理的智能水平,可以建立事件知識庫(EKB,EventKnowledgeBase,
用于存儲所有己知事件的類型、產生事件的原因和所造成的影響,以及應該采取什么樣的措施等一些細節的靜態描述。這個EKB并不是真正意義上的知識庫,它的數據僅僅包含了屬性值與元組,而屬性值表示概念,元組表示事實。但研究EKB可以為今后建立完善的知識庫奠定基礎。
在EKB中存儲了己經確定事件。最初,被確定的事件僅限于一些標準事件和措施。隨著網絡的運行和系統的反饋,EKB的內容將不斷增加。
理想狀態是能夠確定所有的事件。
下面是EKB涉及到的只種基本的數據庫表:
(1)事件類型表:該表中主要存儲了事件的靜態定義。
EKB中保存了己確定的事件可能涉及的相關知識,如事件類別(如:性能、系統、網絡、應用事件或其它)、嚴重程度(如:嚴重、主要、次要、警告等)、產生事件的設備標識、指明設備的類型、事件造成什么影響(如:影響網速、單個用戶不能訪問等)、故障排除參考策略、上次更新的時期/時間、關于這個事件的備注信息、事件的詳細描述等。
(2)實時事件表:描述了正在運行的網絡中的實時事件。
實時事件表中提供可能用的一些字段,用于記錄網絡運行中發生的事件,如:設備的ID(從IP地址或查詢設備表可以獲得)、實時事件的狀態(如:新增、確認、清除等)、根據故障票ID獲得的相應的故障票信息等。
(3)設備信息表:存儲了網絡中設備的實際參數。
設備信息表主要記錄了每個設備的相關參數。例如,設備ID號、IP地址、設備名稱、廠商、類型、重要性級別等。
EKB中存儲的相關事件的知識主要來源于專家。開發人員將獲得的知識應用到與故障管理相關的系統中,根據不同系統的需要分配相應的知識,以提高系統性能。雖然EKB并不是嚴格意義上的知識庫,但在開發過程中,可以通過不斷地增加和修正EKB的內容,在一定程度上提高系統的智能水平。
4.結論
文中分析了網絡故障的類型,提出將事件知識庫用于計算機網絡故障的智能管理。實驗表明,計算機網絡故障的智能管理提供了基于知識的決策手段,比傳統的管理方式具有更高的決策水平,為專家系統技術在故障的檢測和隔離方面更加廣泛的應用,奠定了一定基礎。
參考文獻:
[1]趙志囡等.計算機網絡中的服務[M].現代情報.2006.(11)
一般情況下,可將計算機網絡故障分為物理故障和邏輯故障兩種。
1物理故障
物理故障又被稱為硬件故障,出現這種網絡故障的原因是當計算機網絡設備或線路受到外界因素的作用時,發生了一定程度的損害或接口發生了松動等,或是因為人為因素而使得網絡連接出現錯誤。其主要的表現方式是網絡斷開或網絡狀況不穩定,時斷時續。另外,物理故障還可以分為以下幾種:①接口故障。這主要是因為插頭松動或者端口本身受到了一定程度上的物理損害。②線路故障。其故障發生的比例還是比較高的,一般是因為線路受到了損害或者干擾。③路由器或交換機發生了故障。在網絡正常運行的過程中,有時可能會因為交換機或路由器本身受到了損害,使得計算機網絡不能正常運行。④網卡故障。所謂“網卡”,就是經常說的網絡適配器,通常情況下,網卡都是安裝在計算機主機里的,有時候網卡會松動或者網卡自身受到了物理損害等。
2邏輯故障
邏輯故障又被稱為軟件故障,它是因為計算機內部所安裝的軟件出現錯誤或者計算機網絡配置出現問題,而導致計算機網絡不能正常運行。邏輯故障主要可以分為三類:①進程故障或端口故障。當計算機的端口或進程遭到病毒入侵時,會導致計算機不能正常運行。另外,計算機還可能會受到其他軟件的影響,而導致系統關閉。②主機的邏輯故障。它是因為網卡的驅動程序發生了錯誤,網絡參數配置不正確,又或是網絡通信協議不當而引發的網絡故障。③路由器故障。邏輯故障也會發生在路由器上,比如路由器的內置配置錯誤,端口參數出現了錯誤,內存不足或中央處理器利用率太高。
二計算機網絡故障處理
1斷開本地連接
當計算機網絡發生故障時,如果要斷開本地連接,一般的處理步驟為:①根據日常生活,結合計算機的應用經驗,可初步認定這類故障屬于物理故障;②依照一定的思路分析計算機網絡結構的模型,確定該故障是否發生在物理層;③采用測線儀等網絡測試工具測試網線與端口的連接是否正常,經過處理后,再查看一下計算機網絡是否可以正常運行。
2本地連接正常但無法瀏覽網頁
這類故障屬于邏輯故障,一般是因為瀏覽器自身發生故障而引起的,又或者是被計算機上的一些軟件惡意篡改系統而導致網頁不能訪問,還有可能是因為域名系統的配置出現了錯誤,這時,就要檢查相關配置。
3本地連接受到限制/無連接
在使用計算機的過程中,經常會遇見本地連接受到限制或者無連接的情況,一般情況下,這是因為參數配置不正確或者網絡協議出現了錯誤。在檢查它們的過程中,還要注意網絡設備設置是否處于正常的狀態,待找到造成網絡故障的原因后,進行有效的修復或者重新安裝一些軟件。
三計算機網絡的維護
1軟件的維護
計算機作為軟件的載體,為了保證計算機網絡能夠正常運行,要定期對軟件進行維護。具體的工作主要從下面幾個方面入手:①維護系統,及時清理垃圾和沒用的文件等;②做好計算機的防毒工作,安裝殺毒軟件,并定期升級軟件;③在計算機網絡數據庫中,對于重要的信息,要備份或加密,以防數據泄露或丟失;④定時備份計算機里的注冊表,以防發生網絡故障,損失注冊表;⑤定期檢查網絡的通暢性,及時排查故障。
2硬件的維護
在維護計算機的過程中,要先排查計算機電源、網線、網卡或路由器引發的故障。如果檢查后發現不是這些引起的故障,就要再對硬盤、顯卡和顯示器等進行故障排查。在日常生活中,由于計算機長時間未清潔,灰塵過多,使得計算機不能正常運行。
3其他方面的維護
創建一個計算機網絡維護方面的文檔,記錄每次計算機發生故障后處理、維護時的相關內容。這樣,如果下次再出現同樣的網絡故障,就可以根據文檔中記錄的故障處理方法和步驟解決相關的問題。
四結束語
1.1軟件故障
事實上,一旦脫離應用軟件計算機就很難繼續運行,所以說部分應用軟件的故障也會造成網絡通訊的中斷。通常情況下,軟件的安裝錯誤造成的網絡通訊故障會比硬件故障造成的損傷更大。例如,在軟件的應用過程中經常會發生IP地址沖突、網絡協議等故障,影響網絡通訊的速度,造成線路中斷。造成這些故障的主要原因有:其一,病毒侵擾。部分惡意病毒會擾亂網絡通信軟件的正常運行,造成鏈接線路的中斷,此類故障在網絡時代十分張建;其二,計算機交換機的配置。一些交換機配置的兼容性會伴隨型號的變化而發生相應的變化,造成交換機配置發生錯誤,影響整個的網絡通訊;其三,計算機主機邏輯發生問題。這是受到主機安全性能的影響,造成整個網絡地址的混亂,使得計算機主機的IP與其他主機發生沖突,造成通訊線路的被迫中斷;其四,計算機軟件中的網卡發生后故障,網卡損壞會對網卡造成很大的傷害,最終使得計算機無法正常運行。
1.2安全問題
一般而言,網絡通訊安全問題主要有以下三點:首先是自然條件的影響,也就是環境溫度、適度有機一些不可抗拒的外部環境,這些都會在不同程度上對計算機造成影響,使得用戶的密碼被破譯或者丟失;其次,是人為作用。人為作用即人為性質的惡意破壞,有人處于某種私利損壞計算機網絡系統,進行不正當的偷聽、假冒等行為,意圖偷取計算機系統中用戶的個人信息溝壑重要資料等;最后,病毒入侵。病毒入侵指的是黑客以及部分編制設計出隱藏性高、破壞性強大的病毒,意圖破壞計算機的正常運行,將整個的計算機網絡陷于不安全的環境之下。
2.處理計算機網絡通訊故障的有效措施
2.1加強日常維護,改善硬件環境
計算網絡通訊軟件、硬件設備都需要根據使用手冊進行日常的維修與保養,這是保證計算機正常運行的重要條件。計算機硬件需要進行定期的檢查,一般檢查對象有交換機、路由器、網卡、網線、顯示器進行等。在檢查的過程中,對于發現的問題需要及時采取措施進行修理,將已經發生故障的部分進行更換。與此同時,要定期檢查計算機網絡通信的安全性能,保證計算機系統處于加密狀態,從而進一步改善計算機的硬件環境,讓計算機得以正常運行。在計算機網絡通訊初步建立時期,就需要嚴格根據國家制定的指標開展工作,在建設完成的基礎之上,再由公安機關進行嚴密的檢查之后才能正式運行。不僅如此,相關人員要做好計算機的防火、防水等硬件保護工作,為計算機提供一個良好的硬件環境,使得計算機網絡通訊系統得以正常運行。
2.2及時進行檢測,做好軟件維護工作
在計算機網絡通信系統的運用過程中,要注意及時檢測計算機配置時候存在潛在隱患,正確的設定IP協議,保證計算機設備驅動能夠正常運行。倘若設備驅動能夠正常運行,則需要進行木馬檢查,檢測計算機系統是否存在軟件故障等隱患。與此同時,還可以借助殺毒軟件來保護計算機軟件的安全,定期檢查計算機系統中是否存在病毒軟件,及時的更新殺毒軟件,重新安裝已經發生故障的系統軟件,做好系統漏洞的修復工作。需要注意的是,在計算機軟件的使用過程中,需要對軟件、文件進行有效的管理,將運行的軟件控制在一定數量以內,使得計算機一直處于最佳的狀態,避免計算機的高負荷運行,導致運行速度的降低,從而影響到整個計算機網絡通訊的數據傳輸。
2.3注重計算機安全,構建保障體系
現階段的計算機網絡通訊技術都是自動化運行,大大降低了人為性的干擾因素,提高了計算機的智能化水平。因此,在提高計算機網絡安全的管理水平,強化安全管理意識,定期進行計算機網絡通訊檢查,對網絡管理人員進行統一的培訓,有利于提高管理人員對網絡故障的處理水平,讓其能夠及時處理計算機網絡出現故障。與此同時,計算機網絡管理建立健全相關的保障體系,積極投身于計算機智能化的開發工作,以此來提高計算機網絡通訊的安全性能和運行質量。通過這樣的路徑來構建安全的計算機網絡環境,促進計算機網絡通訊得以更好的發展。
3.結語