一块技嘉8I915P DUO曲折维修实例

一块技嘉8I915P DUO(IO IT8712F-A)主板维修实例:开机后用户自诉有灰尘用手摸了一下风扇座下方,重启后不能开机。检测CPU无供电,我换了12个场管。接俄罗斯主板诊断卡和假负载后,开机。检测卡的12V、5V、3.3V灯闪烁一下即灭,不跑码。同时电源风扇转一下就停止。CPU风扇不转。测试待机电压为1.9V,南桥不热。当时考虑电容漏电,但经一夜检测开机部分电阻电容均正常,我的能力没法判断IO和南桥,无计可施。中午去由老师那里请教,结果对光发现非常隐蔽的痕迹,南桥已经击穿,看来检查切不可粗心,根源回去我也找了,客户电源保养不好多路电压输出值偏低输出不稳,而我当时阴雨天为了省一点点电,连灯都未开,仅凭直觉,实在是错误。好在同客户沟通的还顺畅,没有发生意料的纠纷。

但是帮他另购一块替代的板子时,出现了意外。由于这种同时支持DDR-DDR2的过渡板市场上已不多见,仓促中只好选了一块同期的GA-8I945PLGE-RH,能正常开机,但是进入系统时反复重启,不能U启,也不能光启。检测内存时循环出现Lrand failed,用百度搜解决办法,发现技嘉到目前最新的产品也一直存在此问题,所谓兼容性不好,但是网上没有解决办法,多数是换内存条解决。思考了很久看了很多资料,弄清楚客户原来的内存PC2-6400是400的外频,而这块945支持最低的是533。于是找BIOS里的有关内存的项目,只有No-Execute Memory Protect,查了一下是INTEL的技术,不使用内存保护技术功能打开,就能启用EDB硬件防毒功能,在超频过程中会影响超频的结果。所以请在正式超频之前将此选项关闭。很好,就把该项禁用了。开机顺利进入系统,然后重装系统测试,OK。

没赚反赔的一单,客户觉得我没有修好而且很粗枝大叶几分不满,我也感觉十分疲惫。总结一下确实今后要多注意细节,全面思考。期待今后的改观,不要因为这事影响未来的前景。

其实教训是很深刻的,技艺不精是不可以的,不能太浮躁。(文/伴夜 转载请注明出处http://mtoou.info/jijia-8i915p-duo/)

电脑主板不跑码维修分析思路

      不跑码的故障是电脑主板维修工作中最难,牵涉面最广的问题。要想主板跑码就必须得先测量所有供电,如果所有供电都正常了,那么就会有电源好信号出来,时钟也就会工作。然后南桥时钟正常后收到电源好信号后发出PCIRST信号,再当北桥收PCIRST后又发出CPURST复位CPU,然后CPU开始执行代码加载BIOS。目前我本人对PCIRST的信号之前的故障维修基本上算是掌握,只是有时不出CPURST信号还真是拿不准,就算CPURST信号正常了如果还不跑码的话,那我就更加没什么办法了,有些这种故障的机器虽然修好了,但那也是完全凭经验瞎闯的。所以这个问题一直困扰着我,一直想找个机会突破这层障碍,今天在网上找到这么一段资料觉得还不错,打算闭关数日专攻这个难题。

以下内容摘自网络

      如果debug灯没有显示或者直接停在一个不正常代码,则需HW工程师进一步量测信号以定位问题。

1. 测clock信号

首先量测系统的各种clock是否正确产生,如果正常继续后面量测分析。

2.测时序信号

      量测PWRGOOD(南桥发给CPU)和 PCIRST#、CPURST#(北桥发给CPU)信号是否正常按照我们的timing 图中的要求和示意产生,如果正常无误则继续后面量测分析。

3. 测BIOS地址线

      先从BIOS ROM开始测量看CPU是否能正常解码到BIOS读取代码。因为EC Code和system共用一个BIOS flash ROM,但是目前    EC的code(64KB)放在低位的地址空间,只用到了A0-A15 address线,可以在插入adapter关机状态下测量A16-A18应该没有地址信号,而A0    -A15则有地址信号的变化是因为EC在运行。用示波器探头点到A18,开机时抓取地址信号,如果有一段地址信号变化则基本表明CPU已经读    取到BIOS的CODE,可能是code 有问题才导致不能继续run下去。请BIOS 协助在code的最早的位置设定断点和诊断代码分析以逐步分析问题    。如果开机后BIOS ROM A16-A18上都没有解到CPU读取BIOS的地址信号动作,则需进一步量测上一级总线信号以判断是那个总线上的设备有    问题。  

      注:CPU被Reset后,所有的状态被clear到一个硬件的缺省状态,并且clear L1和L2 cache。然后CPU开始从0FFFF-FFF0H的地址读取BIOS    的第一条代码执行BIOS程序,所以从最高位地址量测比较方便。

4.测LPC总线

      因为我们目前的架构BIOS总线是从LPC上经过EC(PC87591) Bridge过去的,所以需要进一步判断LPC上是否正常解码到CPU 的发    出的解码信息。开机时用示波器测量LPC上的Frame#信号看有否低电平的信号变化(为什么测Frame#,因为Frame#用来启动一个总线周期的    传输,更详细内容请自行阅读LPC spec)。如果有信号则说明EC有问题,没有把LPC的总线周期传到BIOS上。如果没有信号动作说明LPC上    也没有解码出CPU的第一条读取指令信息。

5.测PCI总线

      通常LPC总线是从南桥的PCI-LPC bridge转出来的,所以当LPC上没有动作时,就要量测PCI的总线上是否有解码到CPU 的第一    条指令。也是开机时用示波器抓PCI的FRAME#信号看有否低电平的信号动作。如果有信号则说明南桥有问题,没有把PCI的总线周期传到PCI    上。如果没有说明PCI上也没有解码出CPU的第一条读取指令信息。

6.测Vlink或HUB-link

      因为PCI是由北桥和南桥的点对点传输后在南桥内部转出的,所以 此时要进一步量测*link上的strobe#信号是否有动    作,以判断北桥是否把CPU的解码指令传下来。如果有信号则说明南桥有问题,如果也没有则要进一步测量host bus。

7.测host bus

      开机时用示波器抓host bus的ADS# 信号,如果有低电平的信号动作,则说明CPU有发出BIOS的执行指令,而北桥因故没有正确解码该总线周期,需要check的北桥的电路原理图和焊接质量及物料是否有装错等等因素。如果也没有则说明CPU电路有问题,不是CPU坏了就是CPU的电路原理连接有误或者工艺或者物料装错等等原因。

      以上内容用通俗一点的话讲出来,首先是测量供电,时钟,复位等硬件工作的主要条件,接着打到BIOS的A16-A18的地址总线上面,看有无波形跳变,如有,则BIOS损坏,需要刷写BIOS ,如果没有,则检查LPC总线的FRAME#如果有,刚EC损坏的可能性比较大,如果还没有,则检查PCI总线上的FRAME#,如果有,刚南桥损坏,如果没,则要继续向前级检HUB 总线上面的STROBE#信号,如果有跳变,则南桥损坏,如果没有,则要检查HOST总线上面的ADS#,如果有,则北桥损坏的可能性较大,如果还是没有,则要检查CPU。

电脑知识与技术博客 http://mtoou.info

本文链接:http://mtoou.info/zhuban-nopaoma/