Catalyst 6000/6500 Устранение неисправностей, связанных с системными сбоями - Часть 4

Сбои, связанные с модулем MSFC

Система получает исключение, связанное с ошибкой шины

Может произойти сбой платы MSFC с исключением ошибки шины, которое может возникнуть по причине как программной, так и аппаратной проблемы. Могут присутствовать следующие сообщения об ошибках:

  • На консоли:

    *** System received a Bus Error exception ***
    signal= 0xa, code= 0x10, context= 0x60ef02f0
    PC = 0x601d22f8, Cause = 0x2420, Status Reg = 0x34008002
  • В выходных данных команды show version:

    
    !--- Output is suppressed.
    
    System was restarted by bus error at PC 0x0, address 0x0 at 15:31:54 EST Wed Mar 29 2000
    
    !--- Output is suppressed.
    
    

Если указанный адрес является недействительным и находится вне диапазона памяти, это означает наличие ошибки в программном обеспечении. Если адрес находится в допустимом диапазоне, причина возникновения проблемы может заключаться в аппаратном сбое памяти процессора.

За дополнительной информацией о сбоях, связанных с ошибками шины, обратитесь к документу Устранение сбоев из-за ошибок шины. Дополнительные сведения см. в описании идентификатора ошибки Cisco ID CSCdx92013.

Система получает исключение, связанное с контролем четности кэш-памяти

Плата MSFC не предусматривает защиту памяти на основе кода исправления ошибок. Таким образом, обнаружение ошибки приводит к аварийному завершению работы платы MSFC. Ниже приведены некоторые из ошибок, возникающие в результате:

  • На консоли отображается:

    *** System received a Cache Parity Exception *** 
    signal= 0x14, code= 0xa405c428, context= 0x60dd1ee0 
    PC = 0x6025b2a8, Cause = 0x6420, Status Reg = 0x34008002
  • В выходных данных команды show version отображается:

    
    !--- Output is suppressed.
    
    System returned to ROM by processor memory parity error at PC 0x6020F4D0, 
    address 0x0 at 18:18:31 UTC Wed Aug 22 2001   
    
    !--- Output is suppressed.
    
    

Файл crashinfo, записанный в загрузочной флэш-памяти или на консоли, содержит следующее:

Error: primary data cache, fields:  data, SysAD 
virtual addr 0x4B288202, physical addr(21:3) 0x288200, vAddr(14:12) 0x0000 
virtual address corresponds to pcimem, cache word 0 
Address: 0x4B288200 not in L1 Cache      
Address: 0x4B288202 Can not be loaded into L1 Cache

При возникновении ошибки более одного раза плату MSFC необходимо заменить. Однократное возникновение ошибки можно рассматривать как следствие случайного возмущения. В этом случае необходимо установить наблюдение за платой MSFC. Дополнительную информацию об ошибках четности см. в документе Ошибки четности памяти процессора (PMPE).

Прочие ошибки, связанные с контролем четности

Плата MSFC2 предусматривает защиту памяти на основе кода ECC. Тем не менее, существуют области памяти, в которых проверить четность возможно, но исправить одноразрядные ошибки не удается. Ниже представлены некоторые сообщения об ошибках, отображаемые в файле crashinfo и указывающие на ошибку четности:

  • MISTRAL_TM_DATA_PAR_ERR_REG_MASK_HI: 42
  • Error condition detected: TM_NPP_PARITY_ERROR
  • Error condition detected: SYSAD_PARITY_ERROR
  • Error condition detected: SYSDRAM_PARITY

Однократное возникновение сообщений об ошибках следует рассматривать как следствие случайного возмущения. Необходимо установить наблюдение за платой MSFC2. При более частом возникновении ошибок плату MSFC2 необходимо заменить. Дополнительную информацию об ошибках четности см. в документе Ошибки четности памяти процессора (PMPE.

%MISTRAL-3-ERROR

При наличии файла crashinfo на загрузочном устройстве флэш-памяти после возникновения аварийного отказа необходимо выполнить команду more bootflash:crashinfo_filename. Команда отображает информацию файла crashinfo. Если в начале журнала crashinfo присутствует сообщение об ошибке MISTRAL-3-ERROR, то необходимо определить, имела ли место одна из наиболее распространенных причин. Для этого обратитесь к разделу ИТ аутсорсинг.

Общий порядок диагностики для коммутаторов под управлением CatOS

Санитарная проверка в коде CatOS

Команда show system sanity запускает набор предопределенных проверок конфигурации с возможным сочетанием нескольких состояний системы для составления списка ситуаций, представляющих угрозу. Проверки предназначены для поиска всех вероятных несоответствий. Проверки также предназначены для поддержания системы необходимой корректной настройки системы и ее исправной работы. Эта команда поддерживается в CatOS версии 8.3x или выше.

Список выполняемых проверок и образец выходных данных команды приведены в разделе Санитарная проверка неполадок в настройках и общего состояния системы.

Восстановление коммутаторов Catalyst при сбое во время первоначальной загрузки CatOS

Восстановление коммутаторов Cisco Catalyst 6000/6500 с модулем управления Supervisor Engine 1 или 2 описано в разделе Восстановление Catalyst 6500/6000 с модулем управления Supervisor Engine I или II.

Восстановление коммутатора Cisco Catalyst 6000/6500 с модулем управления Supervisor Engine 720 или 32 описано в разделе Восстановление коммутатора Cisco Catalyst 6000/6500 с модулем управления Supervisor Engine 720 или 32.

Извлечение информации из файла Crashinfo

Файл crashinfo содержит коллекцию важных сведений о текущем сбое, сохраненных во флэш-памяти или загрузочной флэш-памяти. Если маршрутизатор дает сбой из-за повреждения данных или стека, для отладки этого типа сбоев нужно больше сведений о перезагрузке, чем просто выходные данные обычной команды show stacks.

В файле сведений об аварийном отказе содержатся следующие сведения:

  • ограниченное сообщение об ошибке (журнал) и история команд;

  • описание образа, работавшего в момент сбоя;

  • выходные данные команды show alignment;

  • трассировка операций выделения-освобождения памяти (malloc/free);

  • трассировка стека на уровне процессов;

  • контекст на уровне процесса;

  • дамп стека на уровне процесса;

  • дамп стека на уровне прерывания;

  • сведения об уровне процесса;

  • дамп памяти регистров на уровне процесса.

Порядок получения файла crashinfo и дополнительные сведения приведены в документе Извлечение информации из файла Crashinfo.

Заказать звонок

Пожалуйста, оставьте свои контакты