리눅스/Pacemaker(HA Cluster)

[HA]적절한 Timeout 값과 설정 이유

ㅎㄷㄹㅁㅇ 2024. 10. 26. 01:06
반응형

Timeout 설정이 클러스터 성능에 미치는 영향

 

Suse Pacemaker timeout

SUSE Linux Enterprise HA 인 Pacemaker에서 timeout 설정은 클러스터의 안정성과 성능에 중요한 역할을 합니다. 이 글에서는 주요 timeout 설정의 기본값과 그 영향에 대해 알아보겠습니다.

 

주요 Timeout 설정 및 기본값

  1. Operation Timeout: 20초
  2. stonith-timeout: 60초
  3. SBD_WATCHDOG_TIMEOUT: 5초
  4. stonith-watchdog-timeout: 0초 (디스크리스 SBD 모드에서는 0이 아니어야 함)
  5. failure-timeout: 일반적으로 60초로 설정 (명시적 기본값 없음)

 

Timeout 설정이 클러스터 성능에 미치는 영향

1. 너무 짧은 Timeout 설정의 영향

  • 불필요한 리소스 실패와 페일오버 발생
  • 과도한 노드 펜싱
  • 클러스터 안정성 저하

2. 너무 긴 Timeout 설정의 영향

  • 실제 문제 발생 시 대응 지연
  • 리소스 복구 시간 증가
  • 서비스 가용성 저하

3. 적절한 Timeout 설정의 이점

  • 불필요한 페일오버 방지
  • 실제 문제에 대한 신속한 대응
  • 클러스터 안정성 향상

 

최적의 Timeout 설정을 위한 팁

  1. 리소스의 실제 동작 시간 모니터링
  2. 시스템 요구사항에 맞춰 조정
  3. 각 timeout 설정 간의 관계 고려

 

결론

Pacemaker의 timeout 설정은 클러스터의 성능과 안정성에 직접적인 영향을 미칩니다. 기본값은 대부분의 환경에 적합하지만, 특정 시스템 요구사항에 따라 조정이 필요할 수 있습니다. 적절한 timeout 설정을 통해 클러스터의 안정성을 높이고 효율적인 운영을 할 수 있습니다.

 

참고 자료

SUSE Linux Enterprise High Availability 15 SP6 Administration Guide:
https://documentation.suse.com/sle-ha/15-SP6/single-html/SLE-HA-administration/index.html
Pacemaker 공식 문서:
https://clusterlabs.org/pacemaker/doc/
SUSE Linux Enterprise High Availability Extension 제품 페이지:
https://www.suse.com/products/highavailability/
Pacemaker 2.1 문서:
Clusters from Scratch: https://clusterlabs.org/pacemaker/doc/2.1/Clusters_from_Scratch/html/
Pacemaker Administration: https://clusterlabs.org/pacemaker/doc/2.1/Pacemaker_Administration/html/

반응형
TOP