Oracle ILOM cli ile Exadata , db node ve cell node üzerinde oluşan donanım hatalarının görüntülenmesi ve temizlenmesi

7 Haz by Ahmet Duruöz

Oracle ILOM cli ile Exadata , db node ve cell node üzerinde oluşan donanım hatalarının görüntülenmesi ve temizlenmesi

Exadata db node ve cell node ‘larda oluşan donanım sorunlarının bazı durumlarda manuel tespiti ve temizlenmesi gerekmektedir. Geçici olan durumlarda bile donanım arıza ışığı yanmakta ve ilom üzerinden kontrol edildiğinde arıza kaydı görülmektedir.

Sunucuların ilom ip’lerinden ssh ile bağlanarak ilgili hataları görüntüleyip temizlemek mümkündür.

Aşağıdaki gibi ilom ip’sinden bağlantı sağlanabilir.

[root@exadb01 ~]# ssh 10.124.20.14
Password: 

Oracle(R) Integrated Lights Out Manager

Version 3.1.2.20.b r82465

Copyright (c) 2013, Oracle and/or its affiliates. All rights reserved.

Bağlantı sağlandıktan sonra aşağıdaki gibi mevcut hataları görüntüleyebiliriz.

-> show faulty
Target       | Property        | Value              
--------------------+------------------------+---------------------------------
/SP/faultmgmt/0   | fru          | /SYS/MB/RISER1/PCIE4/F20CARD  
/SP/faultmgmt/0/  | class         | fault.chassis.device.esm.eol.exc
 faults/0      |            | eeded              
/SP/faultmgmt/0/  | sunw-msg-id      | SPX86-8002-S3          
 faults/0      |            |                 
/SP/faultmgmt/0/  | component       | /SYS/MB/RISER1/PCIE4/F20CARD  
 faults/0      |            |                 
/SP/faultmgmt/0/  | uuid          | 9e8b85cb-6f07-c007-d592-c19a4618
 faults/0      |            | 244e              
/SP/faultmgmt/0/  | timestamp       | 2017-10-17/18:21:16       
 faults/0      |            |                 
/SP/faultmgmt/0/  | system_component_seria | 1038FMM112           
 faults/0      | l_number        |                 
/SP/faultmgmt/0/  | system_component_part_ | 602-4982-01           
 faults/0      | number         |                 
/SP/faultmgmt/0/  | system_component_name | SUN FIRE X4270 M2 SERVER    
 faults/0      |            |                 
/SP/faultmgmt/0/  | system_component_manuf | Oracle Corporation       
 faults/0      | acturer        |                 
/SP/faultmgmt/0/  | chassis_serial_number | 1038FMM112           
 faults/0      |            |                 
/SP/faultmgmt/0/  | chassis_part_number  | 602-4982-01           
 faults/0      |            |                 
/SP/faultmgmt/0/  | chassis_name      | SUN FIRE X4270 M2 SERVER    
 faults/0      |            |                 
/SP/faultmgmt/0/  | chassis_manufacturer  | Oracle Corporation       
 faults/0      |            |                 
/SP/faultmgmt/0/  | system_serial_number  | 1038FMM112           
 faults/0      |            |                 
/SP/faultmgmt/0/  | system_part_number   | 602-4982-01           
 faults/0      |            |                 
/SP/faultmgmt/0/  | system_name      | SUN FIRE X4270 M2 SERVER    
 faults/0      |            |                 
/SP/faultmgmt/0/  | system_manufacturer  | Oracle Corporation       
 faults/0      |            |                 
/SP/faultmgmt/0/  | fru_name        | Aura1              
 faults/0      |            |                 
/SP/faultmgmt/0/  | fru_manufacturer    | Celestica Apodaca,Nuevo Leon,  
 faults/0      |            | Mexico             
/SP/faultmgmt/0/  | fru_serial_number   | 0111APO-1029AU007Q       
 faults/0      |            |                 
/SP/faultmgmt/0/  | fru_rev_level     | 50               
 faults/0      |            |                 
/SP/faultmgmt/0/  | fru_dash_level     | 02               
 faults/0      |            |                 
/SP/faultmgmt/0/  | fru_part_number    | 511-1500            
 faults/0      |            |                 

Birden fazla hata oluştuğunda , mevcut hatalar /SP/faultmgmt/1 , /SP/faultmgmt/2 gibi başlayacaktır. Hatanın giderilmesi için hatalardaki ilk satırdaki VALUE sütunundaki bileşeni kullanarak işlem yapılacaktır. Yukarıda /SP/faultmgmt/0 ile belirtilen hatanın bileşeni /SYS/MB/RISER1/PCIE4/F20CARD şeklinde olup, bu bileşendeki hatayı aşağıdaki gibi kapatabiliriz.

-> set /SYS/MB/RISER1/PCIE4/F20CARD clear_fault_action=true
Are you sure you want to clear /SYS/MB/RISER1/PCIE4/F20CARD (y/n)? y
Set 'clear_fault_action' to 'true'

Sonrasında kontrol ettiğimizde herhangi bir hata görülmeyecektir.

-> show faulty                       
Target       | Property        | Value              
--------------------+------------------------+---------------------------------

 

Loading

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir