쿠버네티스
쿠버네티스에서 수집되는 지표 일부는 서버 모니터링, 애플리케이션과 동일합니다.
container
컨테이너 관련 지표
대상 : 마스터 프로젝트, 네임스페이스 프로젝트
수집 간격 : 5초
통계 데이터 : 5분
Tags
태그명 | 설명 | 비고 |
---|---|---|
agentOid |
노드 에이전트 고유 ID |
고유값 |
agentPcode |
프로젝트 코드 |
고유값 |
command |
실행 명령어 |
- |
containerId |
컨테이너 ID |
고유값 |
containerKey |
컨테이너 Key |
- |
created |
컨테이너가 생성된 TimeStamp |
- |
image |
컨테이너 이미지명 |
- |
imageHash |
이미지 해쉬 값 |
- |
imageId |
이미지 ID |
- |
microOid |
컨테이너에 설치된 와탭 APM 에이전트의 고유 ID |
- |
name |
컨테이너 이름 |
- |
namespace |
컨테이너가 소속된 네임스페이스 |
- |
namespaceHash |
컨테이너가 소속된 네임스페이스 해쉬 값 |
- |
okind |
컨테이너에 설치된 와탭 APM 에이전트에 지정한 OKIND 고유 ID |
- |
okindName |
컨테이너에 설치된 와탭 APM 에이전트에 지정한 OKIND 이름 |
- |
oname |
컨테이너에 설치된 와탭 APM 에이전트 이름 |
- |
onode |
컨테이너가 작동 중인 노드 에이전트의 고유 ID |
- |
onodeName |
컨테이너가 작동 중인 노드 이름 |
- |
podHash |
컨테이너의 POD 해쉬 값 |
- |
podName |
컨테이너의 POD 이름 |
- |
replicaSetHash |
컨테이너의 리플리카셋 해쉬 값 |
- |
replicaSetName |
컨테이너의 리플리카셋 이름 |
- |
whatap_project |
컨테이너가 속한 와탭 프로젝트 이름 |
- |
- TIPS
-
container 카테고리는 컨테이너의 pod에 설정된 모든 사용자 정의 라벨들을 태그로 수집합니다.
Fields
필드명 | 단위 | 설명 (Shortname, Name, Description) |
---|---|---|
blkio_rbps |
바이트 |
IoReadBytes |
Container Block I/O Read Byte |
||
컨테이너 전체 블럭 디바이스의 초당 읽은 바이트 합 |
||
blkio_riops |
건수 |
IoReadIops |
Container Block I/O Read IOPS |
||
컨테이너 전체 블럭 디바이스의 초당 읽은 건수 합 |
||
blkio_wbps |
바이트 |
IoWriteBytes |
Container Block I/O Write Byte |
||
컨테이너 전체 블럭 디바이스의 초당 쓴 바이트 합 |
||
blkio_wiops |
건수 |
IoWriteIops |
Container Block I/O Write IOPS |
||
컨테이너 전체 블럭 디바이스의 초당 쓴 건수 합 |
||
cpu_per_quota |
퍼센트 |
CpuByLimit |
Container CPU Usage by Limit (%) |
||
CPU Limit 기준 CPU 전체 사용률 |
||
cpu_quota |
밀리 코어 |
CpuLimit |
Container CPU Limit (core) |
||
컨테이너 CPU Limit 할당량 |
||
cpu_quota_percent |
퍼센트 |
CpuLimitByNode |
Container CPU Limit by Node (%) |
||
노드 CPU 대비 컨테이너 CPU Limit 할당량 |
||
cpu_sys |
퍼센트 |
CpuSysByNode |
Container CPU Sys Usage by Node (%) |
||
노드 CPU 대비 컨테이너 CPU System 사용률 |
||
cpu_throttledperiods |
건수 |
CpuThrottledCnt |
Container CPU Throttling Count |
||
컨테이너 CPU Throttled 건수 |
||
cpu_throttledtime |
나노세컨드 |
CpuThrottledTime |
Container CPU Throttling Time |
||
컨테이너 CPU Throttled 시간 |
||
cpu_total |
퍼센트 |
CpuByNode |
Container CPU Usage by Node (%) |
||
노드 CPU 대비 컨테이너 CPU 사용률 |
||
cpu_total_milli |
밀리코어 |
CpuTotUsage |
Container CPU Usage (millicore) |
||
컨테이너 CPU 사용량 |
||
cpu_user |
퍼센트 |
CpuUserByNode |
Container CPU User Usage by Node (%) |
||
노드 CPU 대비 컨테이너 CPU User 사용률 |
||
cpu_request |
밀리코어 |
CpuRequest |
Container CPU Request (core) |
||
컨테이너 CPU 요청 |
||
cpu_per_request |
퍼센트 |
CpuByRequest |
Container CPU Usage by Request (%) |
||
컨테이너 CPU 요청 대비 사용률 |
||
mem_failcnt |
건수 |
MemFailCnt |
Container Memory Failure Count |
||
컨테이너 메모리 Limit 도달 건수 |
||
mem_limit |
바이트 |
MemLimit |
Container Memory Limit (byte) |
||
컨테이너 메모리 Limit 크기 |
||
mem_maxusage |
바이트 |
MemMaxUsage |
Container Memory Max Usage (byte) |
||
컨테이너 메모리 최대 사용량 기록 값 |
||
mem_percent |
퍼센트 |
MemByLimit |
Container Memory by Limit (%) |
||
컨테이너 메모리 Limit 기준 사용량 |
||
mem_totalcache |
바이트 |
MemTotCache |
Container Memory Total Cache (byte) |
||
컨테이너 전체 캐시 크기 |
||
mem_totalpgfault |
횟수 |
MemTotPageFaultCnt |
Container Memory Total Page Fault Count |
||
컨테이너 Page Fault 횟수 |
||
mem_totalrss |
바이트 |
MemTotRss |
Container Memory Total RSS (byte) |
||
컨테이너 RSS 메모리 전체 크기 |
||
mem_totalrss_percent |
퍼센트 |
MemTotRssByLimit |
Container Memory Total RSS by Limit (%) |
||
컨테이너 RSS 메모리 전체 사용률 |
||
mem_totalunevictable |
바이트 |
MemTotUnevictable |
Container Memory Total Unevictable (byte) |
||
컨테이너 Unevictable Memory 전체 크기 |
||
mem_usage |
바이트 |
MemUsage |
Container Memory Usage (byte) |
||
컨테이너 메모리 사용량 |
||
mem_working_set |
바이트 |
MemWs |
Container Memory Working Set (byte) |
||
컨테이너 메모리 working set |
||
mem_working_set_percent |
퍼센트 |
MemWsByLimit |
Container Memory Working Set by Limit (%) |
||
컨테이너 메모리 Limit 기준 working set 사용량 |
||
mem_request |
바이트 |
MemRequest |
Container Memory Request (byte) |
||
컨테이너 메모리 Request 크기 |
||
mem_per_request |
퍼센트 |
MemWsByRequest |
Container Memory Working Set by Request (%) |
||
컨테이너 메모리 Request 기준 working set 사용량 |
||
network_rbps |
바이트 |
NetRxBytes |
Container Network Receive Byte |
||
컨테이너 전체 블럭 디바이스의 초당 읽기 바이트 합 |
||
network_rdropped |
바이트 |
NetRxDropped |
Container Network Receive Dropped |
||
컨테이너 네트워크 수신 dropped 건수 |
||
network_rerror |
바이트 |
NetRxError |
Container Network Receive Error |
||
컨테이너 네트워크 수신 에러 건수 |
||
network_riops |
바이트 |
NetRxIops |
Container Network Receive IOPS |
||
컨테이너 네트워크 수신 건수 |
||
network_wbps |
바이트 |
NetTxByes |
Container Network Transmit Byte |
||
컨테이너 네트워크 송신 데이터 크기 |
||
network_wdropped |
건수 |
NetTxDropped |
Container Network Transmit Dropped |
||
컨테이너 네트워크 송신 dropped 건수 |
||
network_werror |
건수 |
NetTxError |
Container Network Transmit Error |
||
컨테이너 네트워크 송신 에러 건수 |
||
network_wiops |
건수 |
NetTxIops |
Container Network Transmit IOPS |
||
컨테이너 네트워크 송신 건수 |
||
node_cpu |
퍼센트 |
ConNodeCpu |
Container Work Node CPU Usage (%) |
||
컨테이너가 실행 중인 노드의 CPU 사용량 |
||
node_mem |
퍼센트 |
ConNodeMem |
Container Work Node Memory Usage (%) |
||
컨테이너가 실행 중인 노드의 메모리 사용량 |
||
restart_count |
정수 |
ConRestartCnt |
Container Restart Count |
||
컨테이너 다시 시작 횟수 |
||
state |
정수 |
ConState |
Container Current State |
||
컨테이너 상태 코드 |
||
status |
문자열 |
ConStatus |
Container Current Status |
||
컨테이너 상태 정보 |
kube_node
쿠버네티스 노드 관련 지표
- TIPS
-
마스터 프로젝트는 클러스터 전체에 대해
대상 : 마스터 프로젝트, 네임스페이스 프로젝트
수집 간격 : 5초
통계 데이터 : 5분, 1시간
Fields
필드명 | 단위 | 설명 | 비고 |
---|---|---|---|
allocatable_cpu |
밀리 코어 |
노드 할당 가능한 CPU량 |
- |
allocatable_memory |
바이트 |
노드 할당 가능한 메모리량 |
- |
allocatable_pods |
정수 |
노드 할당 가능한 POD 수 |
- |
limit_cpu |
밀리 코어 |
노드 CPU Limit 합계 |
- |
limit_memory |
바이트 |
노드 메모리 Limit 합계 |
- |
pods |
정수 |
노드 POD 총개수 |
- |
request_cpu |
밀리 코어 |
노드 CPU Request 합계 |
- |
request_memory |
바이트 |
노드 메모리 Request 합계 |
- |
kube_event
쿠버네티스 이벤트
- TIPS
-
kube_event 카테고리는 마스터 프로젝트의 경우 클러스터 전체를 대상으로 데이터를 수집하며 네임스페이스 프로젝트는 해당 네임스페이스에서 발생한 이벤트에 대해서만 수집합니다.
대상 : 마스터 프로젝트, 네임스페이스 프로젝트
수집 간격 : 5초
통계 데이터 : 5분, 1시간
Tags
태그명 | 설명 | 비고 |
---|---|---|
field_path |
Field Path |
- |
kind |
종류 |
이벤트가 발생한 오브젝트 종류 |
name |
오브젝트 이름 |
이벤트가 발생한 쿠버네티스 오브젝트 이름 |
namespace |
네임스페이스 이름 |
이벤트가 발생한 네임스페이스 |
reason |
이벤트 발생 사유 |
- |
type |
이벤트 유형 |
Warning 또는 Normal |
uid |
UID |
이벤트가 발생한 오브젝트 |
Fields
필드명 | 단위 | 설명 | 비고 |
---|---|---|---|
action |
문자열 |
액션 이름 |
- |
count |
건수 |
이벤트 발생 건수 |
- |
event_time |
정수 |
이벤트 최초 발생 TimeStamp |
- |
first_timestamp |
정수 |
이벤트 최초 발생 시간 |
- |
last_timestamp |
정수 |
이벤트 마지막 발생 시간 |
- |
message |
문자열 |
이벤트 메시지 |
- |
reasonFiled |
문자열 |
이벤트 Reason |
- |
reporting_component |
문자열 |
현재 이벤트를 보고하는 컴포넌트 |
- |
reporting_instance |
문자열 |
현재 이벤트를 보고하는 인스턴스 |
- |
series_last_observed_time |
정수 |
series last observed time |
- |
kube_stat
쿠버네티스 클러스터 통계
- TIPS
-
kube_stat 카테고리는 마스터 프로젝트의 경우 클러스터 전체 대상으로 수집하고 네임스페이스 프로젝트는 해당 네임스페이스와 연관된 오브젝트를 대상으로만 수집합니다.
대상 : 마스터 프로젝트, 네임스페이스 프로젝트
수집 간격 : 5초
통계 데이터 : 5분, 1시간
Fields
필드명 | 단위 | 설명 | 비고 |
---|---|---|---|
alloctable_cpu |
밀리 코어 |
클러스터 전체 코어 수 |
마스터 프로젝트 Only |
alloctable_ephemeral-storage |
바이트 |
클러스터 전체 할당 가능한 ephemeral storage |
마스터 프로젝트 Only |
alloctable_hugepages-1gi |
바이트 |
클러스터 전체 할당 가능한 hugepages-1Gi |
마스터 프로젝트 Only |
alloctable_hugepages-2mi |
바이트 |
클러스터 전체 할당 가능한 hugepages-2Mi |
마스터 프로젝트 Only |
alloctable_memory |
바이트 |
클러스터 전체 할당 가능한 메모리 |
마스터 프로젝트 Only |
alloctable_pods |
정수 |
할당 가능한 Pod 수 |
- |
available_pod |
정수 |
Available Pod 수 |
- |
desired_pod |
정수 |
Desired Pod 수 |
- |
nodes |
정수 |
노드 수 |
- |
pod_phase_Pending |
정수 |
Pending 상태 Pod 수 |
- |
pod_phase_Running |
정수 |
Running 상태 Pod 수 |
- |
running_containers |
정수 |
Running 컨테이너 수 |
- |
stopped_containers |
정수 |
Stopped 컨테이너 수 |
- |
total_available_cpu |
정수 |
할당 가능한 CPU 총합 |
- |
total_available_memory |
정수 |
할당 가능한 Memory 총합 |
- |
total_limit_cpu |
밀리 코어 |
Limit CPU 총합 |
- |
total_limit_memory |
바이트 |
Limit Memory 총합 |
- |
total_request_cpu |
밀리 코어 |
Request CPU 총합 |
- |
total_request_memory |
바이트 |
Request Memory 총합 |
- |
unavailable_pod |
정수 |
Unavailable Pod 수 |
- |
waiting_containers |
정수 |
Waiting Container 수 |
- |
kube_pod
파드 관련 지표
대상 : 마스터(클러스터) 프로젝트, 네임스페이스 프로젝트
수집 간격 : 5초
통계 데이터 : 5분
Tags
태그명 | 설명 | 비고 |
---|---|---|
agentOid |
노드 에이전트 고유 ID |
고유값 |
agentPcode |
프로젝트 코드 |
고유값 |
command |
실행 명령어 |
- |
Deployment |
Deployment |
- |
name |
파드 이름 |
- |
podName |
파드 이름 |
- |
namespace |
파드가 소속된 네임스페이스 |
- |
namespaceHash |
파드가 소속된 네임스페이스 해시 값 |
- |
replicaSetHash |
파드의 ReplicaSet 해시 값 |
- |
replicaSetName |
파드의 ReplicaSet 이름 |
- |
whatap_project |
파드가 속한 와탭 프로젝트 이름 |
- |
- TIPS
-
kube_pod 카테고리는 파드에 설정된 모든 사용자 정의 라벨들을 태그로 수집합니다.
Fields
필드명 | 단위 | 설명 (Shortname, Name, Description) |
---|---|---|
blkio_rbps |
바이트 |
IoReadBytes |
Pod Block I/O Read Byte |
||
파드 전체 블럭 디바이스의 초당 읽은 바이트 합 |
||
blkio_riops |
건수 |
IoReadIops |
Pod Block I/O Read IOPS |
||
파드 전체 블럭 디바이스의 초당 읽은 건수 합 |
||
blkio_wbps |
바이트 |
IoWriteBytes |
Pod Block I/O Write Byte |
||
파드 전체 블럭 디바이스의 초당 쓴 바이트 합 |
||
blkio_wiops |
건수 |
IoWriteIops |
Pod Block I/O Write IOPS |
||
파드 전체 블럭 디바이스의 초당 쓴 건수 합 |
||
cpu_per_limit |
퍼센트 |
CpuByLimit |
Pod CPU Usage by Limit (%) |
||
CPU Limit 기준 CPU 전체 사용률 |
||
cpu_per_request |
퍼센트 |
CpuByRequest |
Pod CPU Usage by Limit (%) |
||
CPU Limit 기준 CPU 전체 사용률 |
||
cpu_quota_percent |
퍼센트 |
CpuLimitByNode |
Pod CPU Limit by Node (%) |
||
노드 CPU 대비 파드 CPU Limit 할당량 |
||
cpu_sys |
퍼센트 |
CpuSysByNode |
Pod CPU Sys Usage by Node (%) |
||
노드 CPU 대비 파드 CPU System 사용률 |
||
cpu_throttledperiods |
건수 |
CpuThrottledCnt |
Pod CPU Throttling Count |
||
파드 CPU Throttled 건수 |
||
cpu_throttledtime |
나노세컨드 |
CpuThrottledTime |
Pod CPU Throttling Time |
||
파드 CPU Throttled 시간 |
||
cpu_total |
퍼센트 |
CpuByNode |
Pod CPU Usage by Node (%) |
||
노드 CPU 대비 파드 CPU 사용률 |
||
cpu_total_milli |
밀리코어 |
CpuTotUsage |
Pod CPU Usage (millicore) |
||
파드 CPU 사용률 |
||
cpu_user |
퍼센트 |
CpuUserByNode |
Pod CPU User Usage by Node (%) |
||
노드 CPU 대비 파드 CPU User 사용률 |
||
cpu_request |
밀리코어 |
CpuRequest |
Pod CPU Request (core) |
||
파드 CPU 요청 |
||
cpu_per_request |
퍼센트 |
CpuByRequest |
Pod CPU Usage by Request (%) |
||
파드 CPU 요청 대비 사용률 |
||
mem_totalcache |
바이트 |
MemTotCache |
Pod Memory Total Cache (byte) |
||
파드 전체 캐시 크기 |
||
mem_totalpgfault |
횟수 |
MemTotPageFaultCnt |
Pod Memory Total Page Fault Count |
||
파드 Page Fault 횟수 |
||
mem_totalrss |
바이트 |
MemTotRss |
Pod Memory Total RSS (byte) |
||
파드 RSS 메모리 전체 크기 |
||
mem_totalrss_percent |
퍼센트 |
MemTotRssByLimit |
Pod Memory Total RSS by Limit (%) |
||
파드 RSS 메모리 전체 사용률 |
||
mem_totalunevictable |
바이트 |
MemTotUnevictable |
Pod Memory Total Unevictable (byte) |
||
파드 Unevictable Memory 전체 크기 |
||
mem_usage |
바이트 |
MemUsage |
Pod Memory Usage (byte) |
||
파드 메모리 사용량 |
||
mem_working_set |
바이트 |
MemWs |
Pod Memory Working Set (byte) |
||
파드 메모리 working set |
||
mem_working_set_percent |
퍼센트 |
MemWsByLimit |
Pod Memory Working Set by Limit (%) |
||
파드 메모리 할당량 기준 working set 사용량 |
||
memory_request |
바이트 |
MemRequest |
Pod Memory Request (byte) |
||
파드 메모리 요청량 |
||
memory_limit |
바이트 |
MemLimit |
Pod Memory Limit (byte) |
||
파드 메모리 Limit 할당량 |
||
memory_per_request |
퍼센트 |
MemByRequest |
Pod Memory by Request (%) |
||
파드 메모리 요청량 기준 사용량 |
||
memory_per_limit |
퍼센트 |
MemByLimit |
Pod Memory by Limit (%) |
||
파드 메모리 Limit 기준 사용량 |
||
network_rbps |
바이트 |
NetRxBytes |
Pod Network Receive Byte |
||
파드 전체 블럭 디바이스의 초당 읽기 바이트 합 |
||
network_rdropped |
바이트 |
NetRxDropped |
Pod Network Receive Dropped |
||
파드 네트워크 수신 dropped 건수 |
||
network_rerror |
바이트 |
NetRxError |
Pod Network Receive Error |
||
파드 네트워크 수신 에러 건수 |
||
network_riops |
바이트 |
NetRxIops |
Pod Network Receive IOPS |
||
파드 네트워크 수신 건수 |
||
network_wbps |
바이트 |
NetTxByes |
Pod Network Transmit Byte |
||
파드 네트워크 송신 데이터 크기 |
||
network_wdropped |
건수 |
NetTxDropped |
Pod Network Transmit Dropped |
||
파드 네트워크 송신 dropped 건수 |
||
network_werror |
건수 |
NetTxError |
Pod Network Transmit Error |
||
파드 네트워크 송신 에러 건수 |
||
network_wiops |
건수 |
NetTxIops |
Pod Network Transmit IOPS |
||
파드 네트워크 송신 건수 |
||
phase |
문자열 |
Phase |
Pod Current Phase |
||
파드 Phase |
- TIPS
-
아래 필드는 내부용으로 예약되었습니다.
필드명 |
설명 |
비고 |
kube_sless_normal |
쿠버네티스 정보성 이벤트 발생 건수 |
- |
kube_sless_warning |
쿠버네티스 경고 이벤트 발생 건수 |
- |
micro_sful_critical |
apm 심각 상태 기반 이벤트 발생 건수 |
- |
micro_sful_info |
apm 정보성 상태 기반 이벤트 발생 건수 |
- |
micro_sful_warning |
apm 경고 상태 기반 이벤트 발생 건수 |
- |
micro_sless_critical |
apm 심각 무상태 이벤트 발생 건수 |
- |
micro_sless_info |
apm 정보성 무상태 이벤트 발생 건수 |
- |
micro_sless_warning |
apm 경고 무상태 이벤트 발생 건수 |
- |
sful_critical |
매트릭스 심각 상태 기반 이벤트 발생 건수 |
- |
sful_info |
매트릭스 정보성 상태 기반 이벤트 발생 건수 |
- |
sful_warning |
매트릭스 경고 상태 기반 이벤트 발생 건수 |
- |
sless_critical |
매트릭스 심각 무상태 이벤트 발생 건수 |
- |
sless_info |
매트릭스 정보성 무상태 이벤트 발생 건수 |
- |
sless_warning |
매트릭스 경고 무상태 이벤트 발생 건수 |
- |
kube_pod_stat
쿠버네티스 Pod 관련 지표
- TIPS
-
kube_pod_stat 카테고리 마스터 프로젝트는 클러스터 전체를 대상으로 데이터를 수집하며 네임스페이스 프로젝트는 해당 네임스페이스에 소속된 Pod에 대해서만 수집합니다.
대상 : 마스터 프로젝트, 네임스페이스 프로젝트
수집 간격 : 5초
통계 데이터 : 5분, 1시간
Tags
태그명 | 설명 | 비고 |
---|---|---|
kind |
유형 |
마스터 프로젝트의 경우 cluster 고정 값을 가지며 네임스페이스 프로젝트의 경우 Deployment 또는 ReplicaSet에 대해서만 수집합니다. |
name |
쿠버네티스 자원 이름 |
마스터 프로젝트는 name 값이 없으며 네임스페이스 프로젝트는 Deployment 또는 ReplicaSet의 이름입니다. |
Fields
필드명 | 단위 | 설명 | 비고 |
---|---|---|---|
available_pod |
정수 |
Available Pod 수 |
- |
desired_pod |
정수 |
Desired Pod 수 |
- |
limit_cpu |
밀리 코어 |
CPU Limit 사용량 |
- |
limit_memory |
바이트 |
Memory Limit 사용량 |
- |
request_cpu |
밀리 코어 |
CPU Request 사용량 |
- |
request_memory |
바이트 |
Memory Request 사용량 |
- |
running_container |
정수 |
Running Container 수 |
- |
stopped_container |
정수 |
Stopped Container 수 |
- |
waiting_container |
정수 |
Waiting Container 수 |
- |
kube_hpa_stat
쿠버네티스 HPA(Horizontal Pod Autoscaler) 관련 지표
- TIPS
-
와탭에서 사용하는 ClusterRole에 HPA가 추가되어야 지표 수집이 시작됩니다.
대상 : 마스터 프로젝트, 네임스페이스 프로젝트
수집 간격 : 5초
통계 데이터 : 5분, 1시간
Fields
필드명 | 단위 | 설명 | 비고 |
---|---|---|---|
currentReplicas |
정수 |
현재 리플리카 수 |
- |
desiredReplicas |
정수 |
Desired 리플리카 수 |
- |
lastScaleTime |
정수 |
마지막으로 스케일이 변경된 TimeStamp |
- |
maxReplicas |
정수 |
최대 리플리카 수 |
- |
minReplicas |
정수 |
최소 리플리카 수 |
- |
metric_pod_cpu_avg |
밀리 코어 |
HPA CPU 사용량 |
- |
metric_pod_memory_avg |
바이트 |
HPA Memory 사용량 |
- |
resource_cpu |
퍼센트 |
HPA CPU 평균 사용률 |
- |
resource_memory |
퍼센트 |
HPA Memory 평균 사용률 |
- |