Как отладить неисправный процесс cloudera-scm-server?

Я пытаюсь установить Cloudera Manager 5 на centOS6, но процесс cloudera-scm-server продолжает давать сбой без явной ошибки в журналах.

service --status-all

cloudera-scm-agent (pid  7058) is running...
cloudera-scm-server dead but pid file exists
pg_ctl: server is running (PID: 13650)
/usr/bin/postgres "-D" "/var/lib/cloudera-scm-server-db/data"

cat /var/log/cloudera-scm-server/cloudera-scm-server.out

JAVA_HOME=/usr/java/jdk1.7.0_67-cloudera
Killed (core dumped)

`cat /var/log/cloudera-scm-server/cloudera-scm-server.log

...
2015-06-15 13:54:23,642 INFO main:org.springframework.context.annotation.AnnotationConfigApplicationContext: Refreshing org.springframework.context.annotation.AnnotationConfigApplicationContext@6424e9d8: startup date [Mon Jun 15 13:54:23 UTC 2015]; root of context hierarchy
2015-06-15 13:54:23,682 INFO main:org.springframework.beans.factory.support.DefaultListableBeanFactory: Pre-instantiating singletons in org.springframework.beans.factory.support.DefaultListableBeanFactory@3738baec: defining beans [org.springframework.context.annotation.internalConfigurationAnnotationProcessor,org.springframework.context.annotation.internalAutowiredAnnotationProcessor,org.springframework.context.annotation.internalRequiredAnnotationProcessor,org.springframework.context.annotation.internalCommonAnnotationProcessor,defaultValidatorConfiguration,messageInterpolator,validServiceDependencyValidator,uniqueServiceTypeValidator,uniqueRoleTypeValidator,existingServiceTypeValidator,existingRoleTypeValidator,expressionValidator,autoConfigSharesValidValidator,sdlParser,mdlParser,parcelParser,alternativesParser,permissionsParser,manifestParser,stringInterpolator,serviceDescriptorValidatorWithoutDependencyCheck,serviceDescriptorValidatorWithDependencyCheck,referenceValidator,serviceMonitoringDefinitionsDescriptorValidator,descriptorVisitor,parcelDescriptorValidator,alternativesDescriptorValidator,permissionsDescriptorValidator,manifestDescriptorValidator,springConstraintValidatorFactory,validatorFactoryBean,metricNameFormatValidator,nameForCrossEntityAggregateFormatValidator,builtInServiceTypes,builtInRoleTypes,builtInNamesForCrossEntityAggregateMetrics,uniqueFieldValidator]; root of factory hierarchy
2015-06-15 13:54:48,589 INFO main:com.cloudera.csd.components.MdlRegistry: Loaded /mdls/cdh5/oozie.mdl
2015-06-15 13:54:48,627 INFO main:com.cloudera.cmf.rules.RulesEngine: Loading rules knowledge base

Конец журнала не соответствует 100%, но в целом я бы сказал, что это место, после которого он регулярно дает сбой. В случае ошибки OutOfMemoryError приложение будет уничтожено, как это происходит, но я ожидаю, что в этом случае найдется указание на ошибку в журналах. Также куча должна быть сброшена, но я не могу найти дамп кучи, нигде на машине нет файла *.hprof. Поскольку в журнале cloudera-scm-server.out что-то говорится о дампе ядра, но я его тоже не нашел, где мне его искать?

Серверная БД является встроенной и работает правильно. Единственное сообщение об ошибке, которое кажется мне подозрительным в журналах, заключается в том, что отношение «cm_version» не существует.


person kutschkem    schedule 15.06.2015    source источник


Ответы (1)


Проблема была связана с памятью: заканчивалось не место в куче, а реальная физическая память. Моя виртуальная машина имела по умолчанию 512 МБ памяти, а JVM была настроена на 2 ГБ пространства в куче - заполнение физической памяти привело к тому, что ОС молча убила процесс, поэтому никаких полезных записей в журнале. Решение состояло в том, чтобы увеличить память виртуальной машины.

person kutschkem    schedule 18.06.2015