PC机主板常见故障分析和排除 左巍 2000年 第4期   主板是整个PC机系统的关键部件,在PC机中起着至关重要的作用。CPU及总线控制逻辑、BIOS芯片读写控制、系统时钟发生器与时序控制电路、DMA传输与中断控制、内存及其读写控制、键盘控制逻辑、I/O总线插槽及某些外设控制逻辑都集成在主板上。因此,主板产生故障将会影响到整个PC机系统的工作。当一台PC机出现故障时,我们首先要使用插拔法、替换法、比较法来确认PC机中其它部件是否有故障,最后才将故障确定在主板上。由于目前主板上部件集成度越来越高,以及受芯片来源和检测设备的限制,当检测到PC机主板存在故障时,更多是更换主板,这样不仅处理速度快,而且可靠性高。   PC机主板引起的常见故障现象有:开机加电显示器呈黑屏状态、扬声器无声响、键盘被封锁、硬盘驱动器不能引导等,但是就其故障的性质来说,可划分为以下两大类:一是关键性故障,二是非关键性故障,其中关键性故障又细分为电源故障、CPU故障、总线故障等。主板上的电源、CPU芯片、BIOS芯片、定时器芯片、数据收发逻辑电路、DMA控制器、中断控制器以及基本的64K内存和内存刷新电路是系统运行的关键部件。一旦这些部件出现故障,将使整个系统陷于瘫痪,在加电自检程序中,系统首先对这些部件进行检查,如果这些部件出错,就作为关键性故障。一般以初始化显示器子系统为界,在此以前出现的故障为关键性故障,这时屏幕上无显示,显示器呈黑屏状态,扬声器发出“嘟嘟”声响。如果出现关键性故障,PC机系统将不能继续引导。 #1  一、电源故障   PC机电源采用的都是无工频变压器四路开关稳压电源,电源功率在200W~250W之间,所有电源均带有过压和过载保护,若使用中发生直流过压和过载故障,一般电源会自动关闭,直至故障排除为止。开关电源可向主板提供±5V和±12V的直流电压,其中+5V是向主板的各种板卡及键盘供电,+12V是向软、硬盘驱动器和光驱等供电,-5V用于板卡上的锁相式数据分离电路,-12V用于为异步通信适配器提供的EIA接口电源。常见的PC机开关电源性能指标如下:+5V应达到20A,-5V应达到0.5A,+12V应达到9A,-12V应达到0.5A。   当220V交流电压经过低通滤波器后,进入桥式整流电路,经整流滤波后得到300V的高压直流电,再经过逆变器变成20KHz的脉宽可调矩形方波直流电,在变压器的次级得到宽度可调的输出脉冲方波,再经过整流、滤波后,获得所需直流电压输出。下^04030401a^为开关电源工作原理简图。   另外,PC机电源有一个特殊的输出信号,称为POWER GOOD(PG)信号。PG信号在电源开启后不是马上输出,而是经过一段时间(约100ms~500ms)的延时后才输出的,它是一个与TTL电平兼容的信号。它由各直流输出电压检测信号和交流输入电压失效信号逻辑与而获得,当电源正常工作时为高电平,当电源有故障时为低电平。   开机加电后,PC机电源的常见故障有以下几种:   1.直流变换器驱动电路中的功率开关管损坏,无输出电压。   2.当电源的+5V输出空载时,产生保护动作,+12V轴流风扇转动一会儿就停止,无输出电压。   3.±5V和±12V直流输出任何一路发生故障,无输出电压。   4.整流二极管损坏或高压滤波电容损坏,造成输出直流电压偏低而且不稳定。   5.当电压过高时,轻则烧断保险丝或限流热敏电阻,重则烧坏大功率管,造成电源无输出。当电压过低时,造成欠压,进入保护状态,电源无输出电压。   6.PG信号无动作或PG信号延时时间不够,机器不能启动。   根据笔者的经验,当电源发生故障时,比较常见的是电源的直流输出电压中的任何一路无输出或PG信号失效而引起主板无法正常工作。我们应该首先检查开关电源的小轴流风扇是否工作,如果不工作,检查给PC机供电的交流电源是否接好。否则,可能是电源内部原因,可用万用表测量主板上四种直流电源对地的阻值,看是否存在短路现象。如果没有短路,直接测试电源的PG信号是否正常,因为PG信号的建立比PC机直流输出端电压的建立要晚几百毫秒,如果PG信号的低电平持续时间不够或没有低电平时间,PC机将无法启动。如果PG信号一直为低电平,则PC机系统始终处于复位状态。这时PC机也出现黑屏、无声响等死机现象。当用逻辑笔测试PG信号时,发现有时有高电平到低电平的跳变,有时又总是低电平,则是PG信号延时时间不够,可以在电源的PG信号线与地线之间跨接一个100μF左右的电解电容。利用电容加电后自身的充电时间来产生一个PG信号延时,保证PG信号有足够的延时时间。如果存在短路现象,则表明电源内部结构有故障。由于PC机电源结构复杂,维修比较困难,需要一定的电工专业知识。所以当分析并确认是电源故障时,维修主板时建议更换新的PC机电源为好。 #1  二、CPU故障   排除电源故障后,仍出现黑屏,无声响等关键性故障现象,则应首先检查CPU是否工作,再检查BIOS芯片是否工作,最后检查CPU芯片本身。根据笔者的经验,由于CPU芯片本身的故障率比较低,因此,CPU的故障大多是CPU工作输入信号不正常造成的或BIOS芯片有故障引起的。   CPU工作的基本输入信号有三个,一是系统复位信号RESET;二是系统时钟信号CLK;三是CPU就绪信号READY。对于RESET信号可以通过检测ISA插槽中的B02复位驱动信号是否具有一个正脉冲,如果没有则是系统复位故障,应重点检查复位信号产生电路,或PC信号和RC信号线路的逻辑关系等。接着测试产生RESET信号的时钟处理芯片的RESET输出端。若无RESET信号,再测试时钟处理芯片的PG信号输入端,正常开机时有一个TTL电平的跳变信号,否则是主机电源的故障。对于CLK信号可以通过检测ISA插槽中的B20系统时钟信号是否具有一个标准的TTL电平脉冲方波,有脉冲则说明CLK信号正常,反之CLK有故障,应重点检查时钟信号产生电路,传输线路及相关芯片的逻辑关系等。接着关机后用万用表测CPU的CLK引脚对地的阻值是否存在短路现象,若无短路,说明时钟脉冲发生器电路有故障;若短路,则检查传输线路及相关逻辑关系等。对于READY信号,可以在开机前将逻辑笔放在CPU的READY信号引脚上,然后开机观察,如果READY信号一直保持高电平状态,则说明CPU工作不正常,一直处于等待状态;若一直为低电平状态,则多为等待状态逻辑电路发生故障。   如果CPU的三个输入信号正常,开机还是呈黑屏,而且无声响,就要考虑是否是BIOS芯片有故障,反复利用开机瞬间测试BIOS芯片的片选引脚CS,若发现是低电平,则说明正常,否则,BIOS芯片未被选中。接着测试BIOS芯片的允许信号输出引脚OE,若是低电平,则表示允许BIOS内部数据正常输出到数据总线上,否则是BIOS芯片本身损坏。排除B对于第一个方面,在各层次的总线中,任何一种类型的总线出现故障,CPU就不能在取IOS芯片本身故障的最好的方法是更换相同型号的芯片。   如果开机后CPU能够选中BIOS,但仍呈黑屏状态,则要重点检查DMA控制器、中断控制器、定时器芯片等。它们是CPU的高级支持电路,发生故障时,同样会出现黑屏,无声响等现象。   如果是CPU芯片本身损坏,我们只能更换新的CPU,而没有其它的好方法。 #1  三、总线故障   在排除CPU故障后,还是出现黑屏,无声响等关键性故障现象,则应该检查是否是总线故障。总线可分成CPU总线,存储器总线,I/O通道总线和外围接口总线四个层次。每个层次的总线又分为地址总线、控制总线、数据总线等三种。地址总线和控制总线上的信号是由执行总线操作的主设备产生的,CPU和DMA控制器都有权控制总线。数据总线是为各部件之间提供数据传送的通路。只有在控制总线和地址总线的作用下,数据总线才有意义。总线故障主要表现在三个方面:总线本身故障;总线控制权错误引起故障;系统总线故障。   指令的总线周期中正确地读取指令码,从而使得以后的任何操作都失败。只有内存数据总线,I/O通道数据总线和局部数据总线三者内容保持一致,才能保证读取指令总线周期时CPU能够得到正确的指令。   对于第二个方面,为了满足系统对多主控模块争用总线控制权的需要,在总线接口中一般配备了总线控制器模块。当CPU需要DMA控制器去完成控制功能时,才把控制权交给DMA控制器。此外,DMA还可以控制内存的刷新操作。如果这些总线主控器或相关电路发生错误也会引起总线故障。   对于第三个方面,系统总线是PC机主板上信息交换的中心。CPU输出的地址信息经过地址缓冲器后输出到系统地址总线上,输出的数据信息经过数据缓冲器后输出到系统数据总线上。输出的指令经过指令缓冲器后输出到系统控制总线上。所以,影响系统总线的因素很多,如由局部总线故障、系统总线之间的芯片或外围接口总线芯片故障引起的。   总线故障多以系统总线故障为主,当系统总线出现故障时,经常出现黑屏,无声响等关键性故障现象。CPU执行的任何周期只能靠READY信号低电平来结束工作,如果READY为高电平,则CPU自动插入等待状态,直到READY为低电平。因此我们可以让CPU在开机执行完第一个周期后不结束,这样CPU就可以保持输出的地址信号0FFFFFF0H一直有效,通过用逻辑笔来跟踪、测试这些CPU输出的有效信号,同时记录结果,与相同型号的正常主板的测试结果进行比较,找到有故障的芯片,来排除系统总线故障。   考虑到目前PC机主板上都有ISA总线插槽,笔者常用测试ISA总线输出的地址信号,来排除系统总线故障。ISA总线插槽包括两个部分,一部分是62线ISA插槽,另一部分是36线ISA插槽,共98个引脚。   正常情况下,加电后ISA插槽中的地址信号和数据信号均为脉冲信号,如果两者均无脉冲信号,则可能是CPU没有工作,若个别地址总线或数据总线为恒定电平或有脉冲信号,则是系统总线故障。一般情况是,若发现某一位或很少几位为恒定电平,可重新开机测试这些位在开机瞬间是否为恒定电平,若开机瞬间即为恒定电平,则是故障状态。若开机瞬间为脉冲,而后变为恒定电平则应测试其他信号,若发现八位以上出错状态,则应测试相应的总线驱动门控制信号。   如果开机后,ISA插槽中的地址总线和数据总线出现过脉冲信号,随后又变成恒定电平,则说明CPU工作基本正常,可能是系统总线的故障。用逻辑笔在ISA插槽中逐位地测试地址总线信号和数据总线信号,如果发现某位或很少几位为恒定电平,则马上复位测试在开机瞬间是否为恒定电平。如果开机瞬间有一个以上的脉冲出现,则应首先测试其他信号。如果有某位信号在开机时为恒定电平,则是错误状态,应重点检查该信号的传输线路及与该信号有关的逻辑关系等。在不加电情况下,将ISA总线插槽中的62线I/O插槽中A10(IO CHARY)和B10(GND)信号短接,使CPU加电后仅执行一个总线周期就停止。这样CPU在执行第一条开机指令的第一个总线周期时,地址信号值为0FFFF0H,传输的路径是CPU→地址锁存器→总线驱动器芯片→BIOS。数据信号值是5BEAH。传输路径为BIOS→数据传送/接收器芯片→CPU。沿着这条路径,用逻辑笔逐级核对地址信号A0-A19是否为0FFFF0H,数据信号D0-D15是否为5BEA,存储器读信号(MEMR)是否为低电平,发现哪一级出错,就重点测试与该级有关的传输线路和相应芯片的逻辑关系。   除了上面关键性故障表现的三个方面外,还有主板上的定时器、中断控制器、数据收发逻辑电路、DMA控制器以及基本的64KB内存和内存刷新电路等关键部件的故障。一旦这些部件出现故障,将使整个系统陷于瘫痪。   根据笔者的经验,对于关键性故障,还可以根据PC机扬声器所发出的“嘟嘟”报警声的次数来判断故障的大致部位(见附表^04030401b^一、^04030401c^二),从而分析和排除关键性故障,根据这些信息仔细分析,查找故障原因,通过插拔法、比较法、替换法等排除故障。 #1  四、非关键性故障   POST程序检查完关键性部件无故障后,系统就具备了最基本的运行条件,可以对其它部件进行诊断和测试。与关键性故障相比,出现非关键性故障时不死机,屏幕上有提示,可允许系统继续启动。   1.中断控制电路故障   在PC中常用两块8259芯片级联组成16级中断电路模块,在BIOS测试过程中分别对主/从8259芯片的两个地址口进行读写操作。当CPU对主/从8259芯片进行读写操作时,其芯片的CS、RD、WR、A0引脚都应有脉冲信号。用逻辑笔测试当CS为低电平时,RD为低电平有效,表示可以读操作,WR为低电平有效,表示可以写操作,A0引脚为高电平有效,表示选择了I/O地址,则表明故障出现在8259模块电路上。否则,8259芯片本身损坏。当中断电路模块出现故障时,如果故障点影响到系统总线时,这时同样会出现黑屏、无声响等关键性故障现象。系统总线受影响大多是由于中断电路芯片8259的I/O引脚对地短路造成的,可以测试8259芯片的I/O引脚信号,来排除故障。   如果确认中断控制器有故障,对于直接采用8259芯片的主板可以直接更换该芯片,或最好为更换主板。   2.DMA电路故障   在PC机中CPU和DMA都是系统的控制器,但DMA能够提供地址信号和控制信号。在BIOS测试过程中,如果发现DMA控制器故障,则在屏幕上给出提示信息。如果当软盘不能引导时,在排除软盘驱动器和软盘本身故障后,就需要测试DMA控制器,因为,软盘读写控制使用DMA通道2。如果DMA控制器工作正常,接着测试ISA总线插槽中的SA0-SA15引脚信号是否有脉冲,以及DMA控制器控制地址锁存器和页面寄存器等有关电路。DMA控制器有故障时,也可能会影响到内存的刷新,这时同样会出现黑屏,无声响等关键性故障现象。如果确认DMA控制器电路模块有故障,可以更换该芯片或相关芯片或更换主板。   3.定时器电路故障   定时器模块电路是由8253或8254定时器芯片组成的。在BIOS测试过程中,对8253内部的控制寄存器只进行写操作,对三个通道计数器进行读写操作,当测试到内部的寄存器有问题时,则在屏幕上给出提示信息,表示定时器模块有故障,然后允许BIOS测试继续运行。但是特殊情况下,有的内存的刷新请求信号(DRQO)是由8253的通道0发出的,如果该通道有故障,也可能造成黑屏,无声响等关键性故障现象。   如果确认定时器电路模块有故障,可以更换该芯片或相应模块,或建议更换主板。   4.键盘控制器模块故障   键盘控制器基本上由一个8042芯片组成。在BIOS测试过程中,如果发现键盘控制器有故障,则在屏幕上给出提示信息,然后停止工作。如果更换键盘后故障依旧,则说明可能主板上8042芯片有故障。在开机时用逻辑笔测试8042芯片的CS、AD、RD、WR等引脚是否有脉冲信号,若有则测试8042芯片的RESET引脚,如果是先出现低电平信号并且保持了一段时间后上升为高电平,则表示复位正常,这时就可以确定是8042芯片本身的故障,否则测试相应模块。   如果确认键盘控制器模块有故障,由于8042芯片为DIP封装,最简单的方法就是拆下来更换新的芯片。   5.实时钟/日历和CMOS RAM模块电路故障   主板的BIOS SETUP设置程序一般保存在CMOS RAM模块内。在BIOS测试过程中,发现当实时钟/日历电路模块出现故障时,一般会在屏幕上给出相应的提示信息,从而比较容易排除故障。比较常见的现象有:   ①主板上的后备电池出现漏液,使电池功能无效,造成CMOS RAM中的参数丢失。须要更换新电池来解决。   ②后备电池电压不足2V,造成CMOS RAM中的参数丢失。须要更换新电池来解决。   ③实时钟/日历和CMOS RAM模块电路故障或本身芯片损坏,建议更换该芯片。   6.内存控制模块电路故障   主板中都采用内存条模块,在BIOS测试过程中,如果是第一个16KB内存出现故障,则出现黑屏、无声响等关键性故障现象。   通过插拔法和替换找到损坏的内存条,排除故障。如果是内存插槽有故障,建议更换新主板。   综上所述,PC机主板的故障分析和排除,不仅需要我们紧跟当前主板的制造和发展技术,而且还要熟悉和掌握PC机和主板的工作原理,不断总结实际工作中的经验,才能更快地提高水平。