miércoles, 18 de agosto de 2010

OEM Grid Control

Apuntes Oracle Enterprise Manager Grid Control:

Para la instalación exitosa de Oracle Enterprise Manager Grid Control (linux_x86_64) y los agentes necesarios, se ha de utilizar la documentación oficial Oracle:

http://www.oracle.com/technetwork/oem/grid-control/downloads/grid-control-10-089610.html
"Oracle Enterprise Manager
Grid Control ReadMe for Linux x86-64
10g Release 5 (10.2.0.5)
April 2009 "

Para la instalación de Oracle Management Agent de forma silenciosa, sin requerir interfaces Xs:

Instalación de Management Agents (se descara el .zip de la versión de sistema operativo adecuada de otn) y se modifica el fichero "additional_agent.rsp" con el siguiente contenido (modificando las rutas, grupo de sistema operativo, etc):

cd /u01/app/oracle/install_GC/linux/agent
./runInstaller -silent -responseFile=/u01/app/oracle/install_GC/linux/response/additional_agent.rsp -ignoresysprereqs

Muy importante esquemas de conectividad en entornos con Firewalls entre los agentes y el oms:

http://download.oracle.com/docs/cd/B13789_01/network.101/b10775/concepts.htm
"Oracle® Database Net Services Administrator's Guide
10g Release 1 (10.1)
Part Number B10775-01"

http://download-uk.oracle.com/docs/cd/B16240_01/doc/em.102/e10954/firewalls.htm#i1005609
"Oracle® Enterprise Manager Advanced Configuration
10g Release 5 (10.2.0.5)
Part Number E10954-03"

A tener en cuenta algunos bugs y notas de Metalink importantes:

The Grid Control Agent 10.2.0.5 Fails to Monitor 9.2.0.x Databases with ORA-3113/ORA-7445 [ID 828464.1]
Parche a aplicar en la instalación del agente: Patch 9162498

Problemas con el agente tras comunicación incorrecta con gridmanager : ...Thread-.. ERROR pingManager: nmepm_pingReposURL: Error in request response. code = 400. text =
Thread-... ERROR command: nmejcn: error receiving response headers from...
No funcionan las notas de Metalink [ID 378104.1] y similares.
Se borra completamente la instalación del agente y se instala de nuevo, funcionando en este caso todo correctamente.

Para problemas de comunicaciones con agentes en Windows: USE_SHARED_SOCKETS=TRUE ver nota metalink:"How to configure USE_SHARED_SOCKET on Windows NT/2000 [ID 124140.1]"

Problemas de carga de información en OMS: [XMLLoader0 ....xml] WARN  eml.XMLLoader LoadFiles.755 - Marking the file for retry : ...xml after receiving exceptionjava.sql.SQLException: ORA-04091: la tabla SYSMAN.MGMT_DB_HDM_METRIC_HELPER está mutando, puede que el disparador/la función no puedan verla
ORA-06512: en "SYSMAN.MGMT_DB_HDM_METRIC_TR", línea 4
ORA-04088: error durante la ejecución del disparador 'SYSMAN.MGMT_DB_HDM_METRIC_TR'
Se aplica el parche 8219750 en la instalación de OMS.

Problemas de captura de información relacionados con la variable TZ: [Thread-...] ERROR track.Snapshot captureIntoRepository.604 - ECM: Cannot capture [Information of type Host Configuration for Host ... at ... (MEST)]: invalid snapshot timestamp: ... (MEST). Unparseable date: "... (MEST)"
Se aplica nota de metalink: "Problem: Config: Invalid Snapshot Timestamp In emoms.log when using MET timezone [ID 404224.1]", estableciendo la variable TZ antes del arranque a: "Europe/Madrid" ó "CET"

Problema: "program nmhs is using a deprecated SCSI ioctl, please convert it to SG_IO"
Se aplica el parche 5897089 en la instalación del AGENTE en gridmanager.

Problema: "storage_report_metrics.pl: ...: WARN:  STORAGE_REPORTS:error::snmhsutl.c:executable nmhs should have root suid enabled
Se aplica Nota de Metalink: "Problem - storage_report_metrics.pl STORAGE_REPORTS error snmhsutl.c:executable nmhs should have root suid enabled [ID 435793.1]"

Problemas tras el cambio de entradas en /etc/hosts (el servidor no consigue arrancar): el problema estaba en el "formato" del fichero /etc/hosts,
Las entradas /etc/hosts deben ser así: ip nombre_cualificado_completo nombre_no_cualificado
Tras el cambio en el /etc/hosts, todo arranca correctamente.

Problema: Al intentar entrar en un destino de instancia nos aparece el mensaje: "The database target is currently unavailable" estando la bbdd correctamente levantada y accesible
Se soluciona con el comando: "./emctl clearstate agent" en el agente del nodo cliente, para evitar repeticiones futuras del problema, se han de definir blackouts cada vez que haya reinicios controlados de las intancias.

Problema: "Se ha producido un error inesperado al preparar el contenido de esta página.
ORA-06502: PL/SQL: numeric or value error: character to number conversion error ORA-06512: at "DBSNMP.MGMT_BSLN", line 236
ORA-06512: at "DBSNMP.MGMT_BSLN", line 255 ORA-06512: at "DBSNMP.MGMT_BSLN_INTERNAL", line 1435 ORA-06512: at "DBSNMP.MGMT_BSLN", line 2580"
Está motifivado por el "idioma" del explorador, hay que cambiarlo a English y reiniciar el navegador.

Problema: "ORA-07445: exception encountered: core dump [msqsub()+4] [SIGSEGV] [Address not mapped to object] [0x35B000000000070] [] []" al intentar obtener el plan de ejecución de consultas con campos "bind" en la parte del ORDER BY.
No se encuentra solución, no intentar analizar consultas con campos bind en la parte del ORDER BY.

Problema: error ... agent unreachable
... Thread-84888480 ERROR ssl: nzos_Handshake failed, ret=28862
... Thread-84888480 ERROR http: 12: Error initializing SSL connection for incoming request, aborting request. ret=-10
Se siguen los pasos de esta resolucion en el foro de oracle: http://kr.forums.oracle.com/forums/thread.jspa?threadID=931444
http://oracledbasupport.co.uk/oem-agent-problem-the-agent-is-running-but-not-ready/
Delete all files at $AGENT_HOME/sysman/emd/upload and $AGENT_HOME/sysman/emd/state
export AGENT_HOME=/opt/oracle/product/agent10g/
echo $AGENT_HOME
rm –Rf $AGENT_HOME/sysman/emd/upload/*.*
rm –Rf $AGENT_HOME/sysman/emd/state/*.*
$ ./emctl clearstate agent
$ ./emctl unsecure agent
$ ./emctl start agent
$ ./emctl upload agent
$ ./emctl secure agent
Check 731692.1 and 808318.1 documents on metalink

Enlace con scripts interesantes para OEM Grid Control:
http://www.oraclerant.com/?p=83

No hay comentarios:

Publicar un comentario