排查故障是一門學(xué)問,深得很。但籠而統(tǒng)之,就三大必須,有了這三條,沒有排查不了的故障:第一、心態(tài),第二、策略,第三、耐心。
第一條心態(tài)。你必須對出現(xiàn)的故障,有強烈的感激。謝謝上天給了我這個機會,我要牢牢把握住。你可以想象自己是福爾摩斯,已經(jīng)好幾個月沒有接活了,和華生天天閑聊已經(jīng)沒有意思了,急切希望有個案子,蘇格蘭場束手無策了,等著你出馬了。只有這種心態(tài),才能讓你能夠在后續(xù)的長期斗爭中保持亢奮的頭腦、縝密的思路以及足夠的耐心。
我最大的特點就在于此。學(xué)生給我匯報故障的時候,我通常是特別興奮,一字一句聽,像聽考題一樣,他們漫不經(jīng)心的,我的眼睛卻犀利如刀。我特別希望我的學(xué)生能夠?qū)W會這一點。
第二條策略。這是技術(shù)活。細講太多,粗粗說點兒。
1)讓故障重復(fù)出現(xiàn),避免隨機性故障。對隨機性故障,我找機會另說。
2)保護故障現(xiàn)場,不輕易亂動。動的無論是軟件還是硬件,都應(yīng)保證可以恢復(fù)。因此,別隨意焊下芯片,焊下的芯片也要放好,能找回來。另外,軟件一定要按照序號備份。
3)不要一次做兩個以上的改變。
4)養(yǎng)成習(xí)慣,用個小本記錄所有的動作和事實。換了個電源,看似小事,有可能由A故障變成了B故障,你腦子就亂了。因此,如果要換電源,也要記錄。
5)重視儀器和操作方法。每次記錄事實,一定要確保事實是真的。
6)學(xué)會用邏輯的思維。主要是,造成這種故障現(xiàn)象的可能性有多少種,一一列出,可能性最大的到可能性最小的。
7)學(xué)會排查次序。影響排查次序的有兩個主要因素,第一故障可能性,第二排查難度。我們當(dāng)然要先試探可能性最大的,且排查難度最小的。但是兩者并不總是這么巧。比如,你懷疑是A芯片壞了,這可能性最大。但是把它焊下來很費勁,排查實施難度較大,就可以先排查別的可能。這一項有點運氣成分,也有點經(jīng)驗成分。
8)學(xué)會二分法并巧妙使用。二分法,就是把故障分為兩部分(或者三部分,別太多,否則會亂),然后制造一些情況,想辦法確定是哪部分,然后再細分,逐漸縮小包圍圈。以前日本鬼子查城區(qū)里面哪里在發(fā)報,就用這方法:一個區(qū)域一個區(qū)域停電,看哪里一停電就導(dǎo)致電報信號消失,就能確定發(fā)報者在哪個區(qū)域,然后再縮小區(qū)域停電,最終找到我們的地下工作者。幾句話還是說不清,我找機會再說吧。
當(dāng)按照這種縝密的思維方式,羅列了所有故障可能性,且一一排查均無結(jié)果的時候,你應(yīng)該更加亢奮。就像給一個1k電阻加了一個1V直流電壓,測量的電流卻不是1mA一樣,你應(yīng)該有這種心態(tài):活見鬼了,難道歐姆定律都不成立了嗎?
此時,找老師,找朋友,找什么人都行。但是,有誰做到這一步呢?多數(shù)學(xué)生都在這個階段,徹底崩潰了。
因此,第三條,足夠的耐心。