物理層故障
物理層是0SI分層結(jié)構(gòu)體系中最基礎(chǔ)的一層。它建立在通信媒體的基礎(chǔ)上,實現(xiàn)系統(tǒng)和通信媒體的物理接口,為數(shù)據(jù)鏈路實體之間進行透明傳輸,為建立、保持和拆除計算機和網(wǎng)絡(luò)之間的物理連接提供服務(wù)。物理層涉及底層通信及相關(guān)網(wǎng)絡(luò)設(shè)備,像中繼器、集線器、多路復(fù)用器和網(wǎng)卡(NIC,即網(wǎng)絡(luò)接口卡)等均運行在物理層上,物理介質(zhì)的質(zhì)量在很大程度上決定了網(wǎng)絡(luò)的基礎(chǔ)性能。故可從如下方面了解常見的物理層故障。
1.物理線路故障
◆線路物理連接錯誤導(dǎo)致不能正常通信,如在局域網(wǎng)中直通線與交叉線的錯用。
◆電纜制作標(biāo)準(zhǔn)不統(tǒng)一,如雙絞線的EIMA-568-A與EIA-568-B。
◆違反接線規(guī)則或布線規(guī)則,如以太網(wǎng)連接的543規(guī)則。
◆模塊、跳線等物理故障。
2.網(wǎng)絡(luò)設(shè)備端口設(shè)置問題
◆兩端連接端口物理類型不匹配,如RS232與V.35之間的轉(zhuǎn)換。
◆通信兩端相關(guān)端口設(shè)置不正確,如速率、雙工等。
◆通信端口人為關(guān)閉等。
3.集線器故障
(1)網(wǎng)絡(luò)傳輸信號的質(zhì)量和信號傳輸?shù)臓顟B(tài)有時可能與介質(zhì)的性能和質(zhì)量關(guān)系不大,而與設(shè)備本身的質(zhì)量有關(guān)??梢越?jīng)常定期地對集線器端口發(fā)出的數(shù)字基帶信號的質(zhì)量進行監(jiān)測,比如,定期地看一看信號的強度、抖動、極性、前后延波形等是否符合要求。事實上會發(fā)現(xiàn),一個工作了三年的集線器,可能有甚至高達5%-10%的端口存在老化問題,傳輸?shù)男盘栙|(zhì)量大打折扣。
(2)連接距離超過線纜或相關(guān)技術(shù)要求。在局域網(wǎng)連接范圍較遠
網(wǎng)技術(shù)的要求。在傳統(tǒng)10M以太網(wǎng)中最多可以通過集線器級連四級,使網(wǎng)絡(luò)的最大傳輸距離可以達到600m,而當(dāng)網(wǎng)絡(luò)升級到快速以太網(wǎng)時,就只允許兩個100M集線器級連了,而且兩個集線器的連接距離不能超過5m,即在100M快速以太網(wǎng)中使用集線器時最大傳輸范圍不能超過205m,否則就不能正常通信了,這就是由于所使用的以太網(wǎng)技術(shù)而限制的。
(3)電纜的連接方式錯誤。集線器之間級連時,所使用的端口不同,相應(yīng)的電纜連接方式也不同,例如交換機集線器通過Uplink級連時使用直通線,而不通過Upl1ink口級聯(lián)時必須使用交又線等。
(4)網(wǎng)站制作集線器端口故障。集線器端口由于經(jīng)常拔插以及使用劣質(zhì)水鏡頭,都可能導(dǎo)致端口故障或接觸不良,這時可換個端口試試,或者關(guān)閉設(shè)備電源重新啟動。
網(wǎng)絡(luò)的分層診斷技術(shù)
為了降低設(shè)計的復(fù)雜性,增強通用性和兼容性,計算機網(wǎng)絡(luò)互聯(lián)都設(shè)計成層次結(jié)構(gòu),例如典型的應(yīng)用性架構(gòu)TCP/IP協(xié)議簇,它相應(yīng)地也遵循OST的七層理論模型(所有網(wǎng)絡(luò)架構(gòu)組成的理論框架),這種分層體系能夠使多種不同硬件系統(tǒng)和軟件系統(tǒng)能夠方便地連接到網(wǎng)絡(luò)。正是基于這一網(wǎng)絡(luò)結(jié)構(gòu)特點,網(wǎng)絡(luò)管理員在分析和排査網(wǎng)絡(luò)故障時,可充分利用網(wǎng)絡(luò)這種分層的特點,把網(wǎng)絡(luò)故障層次化、簡單化,快速準(zhǔn)確地定位并排除故障。然而在實際故障排查過程中,這種分層方法往往被忽略,導(dǎo)致故障排査效率降低。
OSI的層次結(jié)構(gòu)把每層功能及職責(zé)范圍定義得非常清晰,為管理員分析和排查故障提供了非常好的組織方式。由于各層相對獨立,按層排査能夠有效地發(fā)現(xiàn)和隔離故障,因而一般使用逐層分析和排查的方法。通常有兩種逐層排查方式,一種是從低層開始排査,適用于物理網(wǎng)絡(luò)不夠成熟穩(wěn)定的情況,如組建新的網(wǎng)絡(luò)、重新調(diào)整網(wǎng)絡(luò)線纜、增加新的網(wǎng)絡(luò)設(shè)備;另一種是從高層開始排查,適用于物理網(wǎng)絡(luò)相對成熟穩(wěn)定的情況,如硬件設(shè)備沒有變動。無論哪種方式,最終都能達到目標(biāo),只是解決問題的效率有所差別,第一種方法較為普遍。
具體采用哪種方式,可根據(jù)具體情況來選擇。例如,遇到某客戶端不能訪同Web服務(wù)的情,如果管理員首先去檢查網(wǎng)絡(luò)的連接線纜,就顯得太悲觀了,除非明確知道網(wǎng)絡(luò)線路有所變動。比較好的選擇是直接從應(yīng)用層著手,可以這樣來排查:首先檢查客戶端Web瀏覽器是否正確配置,可嘗試使用瀏覽器訪問另一個Web服務(wù)器:如果Web測覽器沒有問題,可在Web服務(wù)器上測試Web服務(wù)器是否正常運行:如果Web服務(wù)器沒有問題,再測試網(wǎng)絡(luò)的連通性。即使是Web服務(wù)器問題,
從底層開始逐層排查也能最終解決問題,只是花費的時間太多了。如果碰巧是線路問題,從高層開始逐層排查也要浪費時間。在實際應(yīng)用中往往采用折中的方式,凡是涉及網(wǎng)絡(luò)通信的應(yīng)用出了問題,直接從位于中間的網(wǎng)絡(luò)層開始排查,首先測試網(wǎng)絡(luò)連通性,如果網(wǎng)絡(luò)不能連通,再從物理層(測試線路)開始排查:如果網(wǎng)絡(luò)能夠連通,再從應(yīng)用層(測試應(yīng)用程序本身)開始排査。
據(jù)統(tǒng)計,網(wǎng)站建設(shè)網(wǎng)絡(luò)故障有35%在物理層,25%在數(shù)據(jù)鏈路層,12%在網(wǎng)絡(luò)層,10%在傳輸層,8%在對話層,7%在表示層,3%在應(yīng)用層。由此可以看出網(wǎng)絡(luò)故障通常發(fā)生在網(wǎng)絡(luò)七層模型的下三層,即物理層、鏈路層和網(wǎng)絡(luò)層,對應(yīng)于實際的網(wǎng)絡(luò)也就是我們使用的網(wǎng)線、連接模塊、網(wǎng)卡、交換機、路由器等設(shè)備故障。這些故障可能因為產(chǎn)品的質(zhì)量或性能、磨損老化、人為誤操作、不正確的設(shè)置以及管理缺陷等原因而經(jīng)常性地發(fā)生。其后果輕則影響單個站點的信息傳送,重則可能造成網(wǎng)絡(luò)重要設(shè)備:服務(wù)器、交換機和路由器的宕機,導(dǎo)致全網(wǎng)絡(luò)的癱瘓。
確定解決方案
當(dāng)確定了最終可能導(dǎo)致故障的原因之后,就可以方便地制出相關(guān)問題的解決方案,包括故障的診斷計劃,在此同時,有兩個方面要特別注意:一是可以考慮用一個最可能的故障原因進行診斷,來觀察這種改變對故降的影響;二是要考慮解決方案能否破壞故障的基本現(xiàn)象,是否有辦法把所做的改變恢復(fù)為原狀。
在執(zhí)行解決方案前,還需考慮以下幾方面問題
所確定的原因是否真是故障原因,需要相應(yīng)的診斷結(jié)果或報告作支撐。
◆是否可以對設(shè)定的解決方案進行預(yù)先的測試,并制定故障的診斷計劃。
◆實現(xiàn)解決方案預(yù)定的結(jié)果是怎樣的?
◆所制定的解決方案對于網(wǎng)絡(luò)的其他部分有沒有影響?
相應(yīng)地,在實施某一項方案或計劃之前,還必須做好相應(yīng)的準(zhǔn)備工作,因為實施解決方案可能導(dǎo)致筆試實施前更壞的情況,無論故障以及解決方案是否涉及整個網(wǎng)絡(luò)還是個別的用戶,都應(yīng)該考慮怎么樣把事件恢復(fù)到初始狀態(tài)。所以在實施解決方案前必須完成以下相關(guān)的操作
◆保存全部的網(wǎng)絡(luò)設(shè)備配置文件
的各段的置文件進行備份記錄。
◆記錄網(wǎng)絡(luò)的基本拓撲結(jié)構(gòu),設(shè)備的物理位置以及各設(shè)備之間線路的連接關(guān)系、端口號等。
◆網(wǎng)站設(shè)計建立最終的基準(zhǔn),以便對新舊結(jié)果進行對比,同時在需要恢復(fù)時可以作為比較的依據(jù)。