服务器主板维修思路一波三折修显卡


一台服务器代表顶尖的高科技

一台服务器代表顶尖的高科技,一家公司首先要学会建立稳定的机房网络系统,有的公司直到现在还在用H61的主板,那些老的掉牙的机械硬盘,这样的公司还有前途?
在新的时 代里,需要创新!

服务器运行过程中卡死

服务器运行过程中卡死,强行重启后,无法启动,里面有金蝶ERP,客户慌了。
今天有一新客户,是苏州某苗圃公司,经同行介绍,搬来一台组装的服务器, 采用的是华硕P8B-X主板,开机后发现,刚看到主板信息,就直接重启了。
拔掉主板上的power、reset插针,取下钮扣电池,换上我们的主机电源,重新开机。
机器不再无故重启了,但是提示操作系统不存在,看了一眼,有三块机械硬盘,问客户,是不是组了RAID,回答说一开始做的,后来重新搞过一次,不知道还有没有RAID。
技术员插优盘进PE,打开DiskGenius看了一眼,前面两块硬盘显示出同样的分区信息:2个分区,一个是100多
G,剩下空间为另一分区,但是提示分区表错误,没有任何内容。而后面一块硬盘,直接是显示空白,未分区状态,此时客户很慌。
我告诉他,其实先不用慌,也许几分钟就能解决问题了,就算是阵列真的崩了,数据也未必全丢。
重启服务器,进入BIOS,把SATA模式改为RAID模式,保存,重启。
顺利看到RAID信息:三块硬盘做的RAID5,状态:Normal,看来问题不大,没几分钟,顺利进入系统,数据都在,客户松了一口气,嘿嘿,问题虽小,确实够吓人的。
本以为就这么结束了,谁知事情还没完,客户的主机电源插回去,恢复power、reset插针后,服务器又无限重启了,不过这次不慌了。开机状态拔掉power插针,服务器正常启动进入系统,很明显,是开关按钮坏了,关机,拆前面板,随手换个开关按钮,再开机,一切正常,顺利解决问题。
最后提醒客户:硬盘陈旧且有异响,一定要注意数据备份。
总结,遇事不要慌,先冷静分析,由简入难地处理问题,但是实在不懂的话,也别瞎折腾,以免数据丢失。

有过惨痛经历:客户搬迁

有过惨痛经历:客户搬迁,让我们清理一下服务器灰尘,熟练地拆机,拿到他们车间,空压机一吹,干净得狠,看上去像新的一样,结果其中有一台再也没点亮过,花大几千换主板解决[捂脸]//@冰河_独自流浪:很多服务器连跑10几年都没问题,但是一个重启可能就起不来了IT狂人日志

刚上班就接到苏州某设计院电话,说是所有电脑只能缓慢地登上QQ和微信,任何网页无法打开。 第一反应就是DNS的问题,利用动态域名远程登录路由器,发现无法ping通主域控制器(DNS服务器自然是配置在域控上面),顿时紧起来,难道是稳若磐石的戴尔R420服务器宕机了? 要知道,这台戴尔R420服务器,从部署到现在,马上就8周年了,期间没发生过任何问题,可以说是相当争气了。 在核心交换机上,利用DHCP,把外网的DNS服务器作为第二个DNS地址下发给各个VLAN,让客户能正常上网办公,至于网盘,只能等我们人员到位,检修服务器之后再说了。 工程师到现场后发现,服务器前面板没有显示任何错误代码,后面网卡灯正常闪烁,貌似问题不大。 接上显示器后发现,服务器竟然停在BIOS界面。查询日志后发现,早在上班之前,服务器停过电,供电恢复后,服务器自动启动,但是自动进入了BIOS配置界面,系统当然就不会启动,看来工作8年的UPS已经不行了,后来问客户后果然得知,只能坚持30秒,呃……果然是老了不中用了。 检查BIOS并无异常,退出后,服务器正常启动,进入熟悉的Windows Server,检查DNS服务器配置,转发器工作正常。 客户测试网盘正常,我们功成身退。同时建议客户:
1、更换UPS主机;
2、增加第二台域控,同样也是第二台文件服务器,网盘需要增加容量,而且至少也需要交叉备份——这不是最优方案,但是应该是最经济实惠的方案了。

一台R720 服务器

一台R720 服务器,人工重启后 idrac  初始化失败,关机再次重启后 前面板LCD 屏无法显示 ,屏幕提示:Warning! iDRAC initialization error.Continuing to boot may yield unexpecte power loss due to unknown power inventory and various features lost such as remote ess, Active power Management, Thermal Management,Inventory,LCD,or system error reporting.自检很慢,经过排查,基本上是iDRAC模块坏了,无法通过BIOS复位iDRAC,和进入iDRAC界面。只能更换服务器主板了,做硬件迁移。保留之前的系统和数据了。

沪电股份逻辑挖掘

沪电股份逻辑挖掘。
因访问需求量过大,ChatGPT近日暂停Plus销售服务,算力无疑是这次人工智能革命的一切基础。
GPU光模块所对应的个股已经证明了他们的在算力中的重要性。在服务器里还有非常重要的一块是PCB以及载板。服务器对PCB需求量大以6层以上的高多层板为主。
沪电股份:AI服务器最受益品种,微软采购中AI占比已经超30%。沪电在北美AI服务器主板份额超80%,ASP提升1倍。23年纯AI服务器收入有望突破10亿,通讯PCB收入占比接近70%,盈利占比接近75%。以IDC交换机、路由器、服务器等下游应用为主。产品大多是高多层板算力配套设施相关的交换,路由等也有望受益迎来高增。
二季度开始ESG平台备货,有望催生普通服务器PCB拐点。3月AI业务已加单,二季度有望看到订单全面好转23年业绩17亿+,目标估值30x看500亿+市值。

今天下午去太原最大的数码城修电脑

今天下午去太原最大的数码城修电脑,商场人不是很多。但是大部分当铺都正常营业,不像疫情期间好多都空着的这台电脑是做服务器端的电脑,故障是:开机后几秒钟就自动断电了,维修的师傅反复的试了电源,内存条,显卡…就剩CPU和主板没有试了。目前没有合适的型号,只能放在这里等待消息了,看能不能找到原因和配件

一波三折修显卡

一波三折修显卡,不会修显卡的网络工程师,不是好IT。

帮某客户折腾服务器,要求顺便修一下显卡。

拿回来之后,发现风扇是坏的,随时会掉下来,轴断了,已经无法固定,插到电脑上测试一下,能点亮电脑,由于没风扇,不敢多试,先买两个风扇回来再说。

风扇到了先装上,插到电脑上,发现无法安装驱动,初步怀疑是我们用来测试用的X99主板不兼容这块RX480显卡,但是换了台i7 CPU、B460的主板, 还是无法安装驱动,设备管理器里面显卡黄色感叹号。

想尽办法装上驱动,黄色感叹号是消失了,但是鲁大师无法跑分测试、快速拖动窗口有卡顿现象,很显然,显卡驱动并没有真正生效。

鉴于笔者多年前遭遇CIH病毒的时候,曾经利用一块网卡BOOTROM刷BIOS的方法救活无数主板,也曾经用显卡BIOS刷新大法救了一些显卡,所以打算尝试一下刷新BIOS能否救回这块显卡。

废话不多说,一通搜索后,总算找到貌似匹配的BIOS,说干就干,把显卡BIOS刷新程序复制到C盘,下载好的BIOS也放到C盘,用管理员运行CMD,命令行下开刷:amdvbflash -p -f 0 c:1.rom。

刷完重启电脑,黑屏,呃……,有点小慌张。

找一块平时测试用的显卡,插在PCI-E-
1,显示器接到这块显卡,把这块黑屏的显卡插在插在PCI-E-
3,开机,顺利启动进入系统。

换个BIOS文件,再刷:amdvbflash -p -f q c:2.rom

关机,测试显卡拔掉,这块维修显卡插回到PCI-E-
1,开机,有点小紧张,还好,顺利进入系统,提示找到新设备,看来有戏啊。

驱动自动安装上了,设备管理中没有黄色感叹号,打开鲁大师,显卡单独跑分,15万分,下载游戏测试,还是挺流畅的,2小时下来没在任何问题,应该是修复了。