쿠버네티스

쿠버네티스에서 수집되는 지표 일부는 서버 모니터링, 애플리케이션과 동일합니다.

container

컨테이너 관련 지표

대상 : 마스터 프로젝트, 네임스페이스 프로젝트

수집 간격 : 5초

통계 데이터 : 5분

Tags

태그명 설명 비고

agentOid

노드 에이전트 고유 ID

고유값

agentPcode

프로젝트 코드

고유값

command

실행 명령어

-

containerId

컨테이너 ID

고유값

containerKey

컨테이너 Key

-

created

컨테이너가 생성된 TimeStamp

-

image

컨테이너 이미지명

-

imageHash

이미지 해쉬 값

-

imageId

이미지 ID

-

microOid

컨테이너에 설치된 와탭 APM 에이전트의 고유 ID

-

name

컨테이너 이름

-

namespace

컨테이너가 소속된 네임스페이스

-

namespaceHash

컨테이너가 소속된 네임스페이스 해쉬 값

-

okind

컨테이너에 설치된 와탭 APM 에이전트에 지정한 OKIND 고유 ID

-

okindName

컨테이너에 설치된 와탭 APM 에이전트에 지정한 OKIND 이름

-

oname

컨테이너에 설치된 와탭 APM 에이전트 이름

-

onode

컨테이너가 작동 중인 노드 에이전트의 고유 ID

-

onodeName

컨테이너가 작동 중인 노드 이름

-

podHash

컨테이너의 POD 해쉬 값

-

podName

컨테이너의 POD 이름

-

replicaSetHash

컨테이너의 리플리카셋 해쉬 값

-

replicaSetName

컨테이너의 리플리카셋 이름

-

whatap_project

컨테이너가 속한 와탭 프로젝트 이름

-

TIPS

container 카테고리는 컨테이너의 pod에 설정된 모든 사용자 정의 라벨들을 태그로 수집합니다.

Fields

필드명 단위 설명 (Shortname, Name, Description)

blkio_rbps

바이트

IoReadBytes

Container Block I/O Read Byte

컨테이너 전체 블럭 디바이스의 초당 읽은 바이트 합

blkio_riops

건수

IoReadIops

Container Block I/O Read IOPS

컨테이너 전체 블럭 디바이스의 초당 읽은 건수 합

blkio_wbps

바이트

IoWriteBytes

Container Block I/O Write Byte

컨테이너 전체 블럭 디바이스의 초당 쓴 바이트 합

blkio_wiops

건수

IoWriteIops

Container Block I/O Write IOPS

컨테이너 전체 블럭 디바이스의 초당 쓴 건수 합

cpu_per_quota

퍼센트

CpuByLimit

Container CPU Usage by Limit (%)

CPU Limit 기준 CPU 전체 사용률

cpu_quota

밀리 코어

CpuLimit

Container CPU Limit (core)

컨테이너 CPU Limit 할당량
※ Limit 미설정인 경우 컨테이너가 작동 중인 해당 노드의 CPU 전체 코어가 밀리코어 단위로 표시된다.

cpu_quota_percent

퍼센트

CpuLimitByNode

Container CPU Limit by Node (%)

노드 CPU 대비 컨테이너 CPU Limit 할당량
※ Limit 미설정인 경우 컨테이너가 작동 중인 해당 노드의 CPU 전체 코어가 퍼센트로 표시된다.

cpu_sys

퍼센트

CpuSysByNode

Container CPU Sys Usage by Node (%)

노드 CPU 대비 컨테이너 CPU System 사용률

cpu_throttledperiods

건수

CpuThrottledCnt

Container CPU Throttling Count

컨테이너 CPU Throttled 건수

cpu_throttledtime

나노세컨드

CpuThrottledTime

Container CPU Throttling Time

컨테이너 CPU Throttled 시간

cpu_total

퍼센트

CpuByNode

Container CPU Usage by Node (%)

노드 CPU 대비 컨테이너 CPU 사용률

cpu_total_milli

밀리코어

CpuTotUsage

Container CPU Usage (millicore)

컨테이너 CPU 사용량

cpu_user

퍼센트

CpuUserByNode

Container CPU User Usage by Node (%)

노드 CPU 대비 컨테이너 CPU User 사용률

cpu_request

밀리코어

CpuRequest

Container CPU Request (core)

컨테이너 CPU 요청

cpu_per_request

퍼센트

CpuByRequest

Container CPU Usage by Request (%)

컨테이너 CPU 요청 대비 사용률
= cpu_total_milli / cpu_request * 100

mem_failcnt

건수

MemFailCnt

Container Memory Failure Count

컨테이너 메모리 Limit 도달 건수

mem_limit

바이트

MemLimit

Container Memory Limit (byte)

컨테이너 메모리 Limit 크기

mem_maxusage

바이트

MemMaxUsage

Container Memory Max Usage (byte)

컨테이너 메모리 최대 사용량 기록 값

mem_percent

퍼센트

MemByLimit

Container Memory by Limit (%)

컨테이너 메모리 Limit 기준 사용량
= mem_usage / mem_limit * 100

mem_totalcache

바이트

MemTotCache

Container Memory Total Cache (byte)

컨테이너 전체 캐시 크기

mem_totalpgfault

횟수

MemTotPageFaultCnt

Container Memory Total Page Fault Count

컨테이너 Page Fault 횟수

mem_totalrss

바이트

MemTotRss

Container Memory Total RSS (byte)

컨테이너 RSS 메모리 전체 크기

mem_totalrss_percent

퍼센트

MemTotRssByLimit

Container Memory Total RSS by Limit (%)

컨테이너 RSS 메모리 전체 사용률

mem_totalunevictable

바이트

MemTotUnevictable

Container Memory Total Unevictable (byte)

컨테이너 Unevictable Memory 전체 크기

mem_usage

바이트

MemUsage

Container Memory Usage (byte)

컨테이너 메모리 사용량

mem_working_set

바이트

MemWs

Container Memory Working Set (byte)

컨테이너 메모리 working set
= mem_usage - inactive file

mem_working_set_percent

퍼센트

MemWsByLimit

Container Memory Working Set by Limit (%)

컨테이너 메모리 Limit 기준 working set 사용량
= mem_working_set / mem_limit * 100

mem_request

바이트

MemRequest

Container Memory Request (byte)

컨테이너 메모리 Request 크기

mem_per_request

퍼센트

MemWsByRequest

Container Memory Working Set by Request (%)

컨테이너 메모리 Request 기준 working set 사용량
= mem_working_set / mem_request * 100

network_rbps

바이트

NetRxBytes

Container Network Receive Byte

컨테이너 전체 블럭 디바이스의 초당 읽기 바이트 합

network_rdropped

바이트

NetRxDropped

Container Network Receive Dropped

컨테이너 네트워크 수신 dropped 건수

network_rerror

바이트

NetRxError

Container Network Receive Error

컨테이너 네트워크 수신 에러 건수

network_riops

바이트

NetRxIops

Container Network Receive IOPS

컨테이너 네트워크 수신 건수

network_wbps

바이트

NetTxByes

Container Network Transmit Byte

컨테이너 네트워크 송신 데이터 크기

network_wdropped

건수

NetTxDropped

Container Network Transmit Dropped

컨테이너 네트워크 송신 dropped 건수

network_werror

건수

NetTxError

Container Network Transmit Error

컨테이너 네트워크 송신 에러 건수

network_wiops

건수

NetTxIops

Container Network Transmit IOPS

컨테이너 네트워크 송신 건수

node_cpu

퍼센트

ConNodeCpu

Container Work Node CPU Usage (%)

컨테이너가 실행 중인 노드의 CPU 사용량

node_mem

퍼센트

ConNodeMem

Container Work Node Memory Usage (%)

컨테이너가 실행 중인 노드의 메모리 사용량

restart_count

정수

ConRestartCnt

Container Restart Count

컨테이너 다시 시작 횟수

state

정수

ConState

Container Current State

컨테이너 상태 코드
① RUNNING = 114
② PAUSE = 112
③ RESTARTING = 101
④ OOMKILLED = 111
⑤ DEAD = 100
⑥ WAITING = 119

status

문자열

ConStatus

Container Current Status

컨테이너 상태 정보
① running 상태 : uptime 정보 표시
② waiting / terminated 상태 : 상태에 대한 reason 정보 표시

kube_node

쿠버네티스 노드 관련 지표

TIPS

마스터 프로젝트는 클러스터 전체에 대해

대상 : 마스터 프로젝트, 네임스페이스 프로젝트

수집 간격 : 5초

통계 데이터 : 5분, 1시간

Tags

태그명 설명 비고

nodeName

노드 이름

-

TIPS

kube_node 카테고리는 노드에 설정된 모든 사용자 정의 라벨들을 태그로 수집합니다.

Fields

필드명 단위 설명 비고

allocatable_cpu

밀리 코어

노드 할당 가능한 CPU량

-

allocatable_memory

바이트

노드 할당 가능한 메모리량

-

allocatable_pods

정수

노드 할당 가능한 POD 수

-

limit_cpu

밀리 코어

노드 CPU Limit 합계

-

limit_memory

바이트

노드 메모리 Limit 합계

-

pods

정수

노드 POD 총개수

-

request_cpu

밀리 코어

노드 CPU Request 합계

-

request_memory

바이트

노드 메모리 Request 합계

-

kube_event

쿠버네티스 이벤트

TIPS

kube_event 카테고리는 마스터 프로젝트의 경우 클러스터 전체를 대상으로 데이터를 수집하며 네임스페이스 프로젝트는 해당 네임스페이스에서 발생한 이벤트에 대해서만 수집합니다.

대상 : 마스터 프로젝트, 네임스페이스 프로젝트

수집 간격 : 5초

통계 데이터 : 5분, 1시간

Tags

태그명 설명 비고

field_path

Field Path

-

kind

종류

이벤트가 발생한 오브젝트 종류

name

오브젝트 이름

이벤트가 발생한 쿠버네티스 오브젝트 이름

namespace

네임스페이스 이름

이벤트가 발생한 네임스페이스

reason

이벤트 발생 사유

-

type

이벤트 유형

Warning 또는 Normal

uid

UID

이벤트가 발생한 오브젝트

Fields

필드명 단위 설명 비고

action

문자열

액션 이름

-

count

건수

이벤트 발생 건수

-

event_time

정수

이벤트 최초 발생 TimeStamp

-

first_timestamp

정수

이벤트 최초 발생 시간

-

last_timestamp

정수

이벤트 마지막 발생 시간

-

message

문자열

이벤트 메시지

-

reasonFiled

문자열

이벤트 Reason

-

reporting_component

문자열

현재 이벤트를 보고하는 컴포넌트

-

reporting_instance

문자열

현재 이벤트를 보고하는 인스턴스

-

series_last_observed_time

정수

series last observed time

-

kube_stat

쿠버네티스 클러스터 통계

TIPS

kube_stat 카테고리는 마스터 프로젝트의 경우 클러스터 전체 대상으로 수집하고 네임스페이스 프로젝트는 해당 네임스페이스와 연관된 오브젝트를 대상으로만 수집합니다.

대상 : 마스터 프로젝트, 네임스페이스 프로젝트

수집 간격 : 5초

통계 데이터 : 5분, 1시간

Tags

태그명 설명 비고

name

kube_stat

고정 값

Fields

필드명 단위 설명 비고

alloctable_cpu

밀리 코어

클러스터 전체 코어 수

마스터 프로젝트 Only

alloctable_ephemeral-storage

바이트

클러스터 전체 할당 가능한 ephemeral storage

마스터 프로젝트 Only

alloctable_hugepages-1gi

바이트

클러스터 전체 할당 가능한 hugepages-1Gi

마스터 프로젝트 Only

alloctable_hugepages-2mi

바이트

클러스터 전체 할당 가능한 hugepages-2Mi

마스터 프로젝트 Only

alloctable_memory

바이트

클러스터 전체 할당 가능한 메모리

마스터 프로젝트 Only

alloctable_pods

정수

할당 가능한 Pod 수

-

available_pod

정수

Available Pod 수

-

desired_pod

정수

Desired Pod 수

-

nodes

정수

노드 수

-

pod_phase_Pending

정수

Pending 상태 Pod 수

-

pod_phase_Running

정수

Running 상태 Pod 수

-

running_containers

정수

Running 컨테이너 수

-

stopped_containers

정수

Stopped 컨테이너 수

-

total_available_cpu

정수

할당 가능한 CPU 총합

-

total_available_memory

정수

할당 가능한 Memory 총합

-

total_limit_cpu

밀리 코어

Limit CPU 총합

-

total_limit_memory

바이트

Limit Memory 총합

-

total_request_cpu

밀리 코어

Request CPU 총합

-

total_request_memory

바이트

Request Memory 총합

-

unavailable_pod

정수

Unavailable Pod 수

-

waiting_containers

정수

Waiting Container 수

-

kube_pod

파드 관련 지표

대상 : 마스터(클러스터) 프로젝트, 네임스페이스 프로젝트

수집 간격 : 5초

통계 데이터 : 5분

Tags

태그명 설명 비고

agentOid

노드 에이전트 고유 ID

고유값

agentPcode

프로젝트 코드

고유값

command

실행 명령어

-

Deployment

Deployment

-

name

파드 이름

-

podName

파드 이름

-

namespace

파드가 소속된 네임스페이스

-

namespaceHash

파드가 소속된 네임스페이스 해시 값

-

replicaSetHash

파드의 ReplicaSet 해시 값

-

replicaSetName

파드의 ReplicaSet 이름

-

whatap_project

파드가 속한 와탭 프로젝트 이름

-

TIPS

kube_pod 카테고리는 파드에 설정된 모든 사용자 정의 라벨들을 태그로 수집합니다.

Fields

필드명 단위 설명 (Shortname, Name, Description)

blkio_rbps

바이트

IoReadBytes

Pod Block I/O Read Byte

파드 전체 블럭 디바이스의 초당 읽은 바이트 합

blkio_riops

건수

IoReadIops

Pod Block I/O Read IOPS

파드 전체 블럭 디바이스의 초당 읽은 건수 합

blkio_wbps

바이트

IoWriteBytes

Pod Block I/O Write Byte

파드 전체 블럭 디바이스의 초당 쓴 바이트 합

blkio_wiops

건수

IoWriteIops

Pod Block I/O Write IOPS

파드 전체 블럭 디바이스의 초당 쓴 건수 합

cpu_per_limit

퍼센트

CpuByLimit

Pod CPU Usage by Limit (%)

CPU Limit 기준 CPU 전체 사용률

cpu_per_request

퍼센트

CpuByRequest

Pod CPU Usage by Limit (%)

CPU Limit 기준 CPU 전체 사용률

cpu_quota_percent

퍼센트

CpuLimitByNode

Pod CPU Limit by Node (%)

노드 CPU 대비 파드 CPU Limit 할당량
※ Limit 미설정인 경우 파드가 작동 중인 해당 노드의 CPU 전체 코어가 퍼센트로 표시된다.

cpu_sys

퍼센트

CpuSysByNode

Pod CPU Sys Usage by Node (%)

노드 CPU 대비 파드 CPU System 사용률

cpu_throttledperiods

건수

CpuThrottledCnt

Pod CPU Throttling Count

파드 CPU Throttled 건수

cpu_throttledtime

나노세컨드

CpuThrottledTime

Pod CPU Throttling Time

파드 CPU Throttled 시간

cpu_total

퍼센트

CpuByNode

Pod CPU Usage by Node (%)

노드 CPU 대비 파드 CPU 사용률

cpu_total_milli

밀리코어

CpuTotUsage

Pod CPU Usage (millicore)

파드 CPU 사용률

cpu_user

퍼센트

CpuUserByNode

Pod CPU User Usage by Node (%)

노드 CPU 대비 파드 CPU User 사용률

cpu_request

밀리코어

CpuRequest

Pod CPU Request (core)

파드 CPU 요청

cpu_per_request

퍼센트

CpuByRequest

Pod CPU Usage by Request (%)

파드 CPU 요청 대비 사용률
= cpu_total_milli / cpu_request * 100

mem_totalcache

바이트

MemTotCache

Pod Memory Total Cache (byte)

파드 전체 캐시 크기

mem_totalpgfault

횟수

MemTotPageFaultCnt

Pod Memory Total Page Fault Count

파드 Page Fault 횟수

mem_totalrss

바이트

MemTotRss

Pod Memory Total RSS (byte)

파드 RSS 메모리 전체 크기

mem_totalrss_percent

퍼센트

MemTotRssByLimit

Pod Memory Total RSS by Limit (%)

파드 RSS 메모리 전체 사용률

mem_totalunevictable

바이트

MemTotUnevictable

Pod Memory Total Unevictable (byte)

파드 Unevictable Memory 전체 크기

mem_usage

바이트

MemUsage

Pod Memory Usage (byte)

파드 메모리 사용량

mem_working_set

바이트

MemWs

Pod Memory Working Set (byte)

파드 메모리 working set
= mem_usage - inactive file

mem_working_set_percent

퍼센트

MemWsByLimit

Pod Memory Working Set by Limit (%)

파드 메모리 할당량 기준 working set 사용량
= mem_working_set / mem_limit * 100

memory_request

바이트

MemRequest

Pod Memory Request (byte)

파드 메모리 요청량

memory_limit

바이트

MemLimit

Pod Memory Limit (byte)

파드 메모리 Limit 할당량

memory_per_request

퍼센트

MemByRequest

Pod Memory by Request (%)

파드 메모리 요청량 기준 사용량

memory_per_limit

퍼센트

MemByLimit

Pod Memory by Limit (%)

파드 메모리 Limit 기준 사용량

network_rbps

바이트

NetRxBytes

Pod Network Receive Byte

파드 전체 블럭 디바이스의 초당 읽기 바이트 합

network_rdropped

바이트

NetRxDropped

Pod Network Receive Dropped

파드 네트워크 수신 dropped 건수

network_rerror

바이트

NetRxError

Pod Network Receive Error

파드 네트워크 수신 에러 건수

network_riops

바이트

NetRxIops

Pod Network Receive IOPS

파드 네트워크 수신 건수

network_wbps

바이트

NetTxByes

Pod Network Transmit Byte

파드 네트워크 송신 데이터 크기

network_wdropped

건수

NetTxDropped

Pod Network Transmit Dropped

파드 네트워크 송신 dropped 건수

network_werror

건수

NetTxError

Pod Network Transmit Error

파드 네트워크 송신 에러 건수

network_wiops

건수

NetTxIops

Pod Network Transmit IOPS

파드 네트워크 송신 건수

phase

문자열

Phase

Pod Current Phase

파드 Phase

TIPS

아래 필드는 내부용으로 예약되었습니다.

필드명

설명

비고

kube_sless_normal

쿠버네티스 정보성 이벤트 발생 건수

-

kube_sless_warning

쿠버네티스 경고 이벤트 발생 건수

-

micro_sful_critical

apm 심각 상태 기반 이벤트 발생 건수

-

micro_sful_info

apm 정보성 상태 기반 이벤트 발생 건수

-

micro_sful_warning

apm 경고 상태 기반 이벤트 발생 건수

-

micro_sless_critical

apm 심각 무상태 이벤트 발생 건수

-

micro_sless_info

apm 정보성 무상태 이벤트 발생 건수

-

micro_sless_warning

apm 경고 무상태 이벤트 발생 건수

-

sful_critical

매트릭스 심각 상태 기반 이벤트 발생 건수

-

sful_info

매트릭스 정보성 상태 기반 이벤트 발생 건수

-

sful_warning

매트릭스 경고 상태 기반 이벤트 발생 건수

-

sless_critical

매트릭스 심각 무상태 이벤트 발생 건수

-

sless_info

매트릭스 정보성 무상태 이벤트 발생 건수

-

sless_warning

매트릭스 경고 무상태 이벤트 발생 건수

-

kube_pod_stat

쿠버네티스 Pod 관련 지표

TIPS

kube_pod_stat 카테고리 마스터 프로젝트는 클러스터 전체를 대상으로 데이터를 수집하며 네임스페이스 프로젝트는 해당 네임스페이스에 소속된 Pod에 대해서만 수집합니다.

대상 : 마스터 프로젝트, 네임스페이스 프로젝트

수집 간격 : 5초

통계 데이터 : 5분, 1시간

Tags

태그명 설명 비고

kind

유형

마스터 프로젝트의 경우 cluster 고정 값을 가지며 네임스페이스 프로젝트의 경우 Deployment 또는 ReplicaSet에 대해서만 수집합니다.

name

쿠버네티스 자원 이름

마스터 프로젝트는 name 값이 없으며 네임스페이스 프로젝트는 Deployment 또는 ReplicaSet의 이름입니다.

Fields

필드명 단위 설명 비고

available_pod

정수

Available Pod 수

-

desired_pod

정수

Desired Pod 수

-

limit_cpu

밀리 코어

CPU Limit 사용량

-

limit_memory

바이트

Memory Limit 사용량

-

request_cpu

밀리 코어

CPU Request 사용량

-

request_memory

바이트

Memory Request 사용량

-

running_container

정수

Running Container 수

-

stopped_container

정수

Stopped Container 수

-

waiting_container

정수

Waiting Container 수

-

kube_hpa_stat

쿠버네티스 HPA(Horizontal Pod Autoscaler) 관련 지표

TIPS

와탭에서 사용하는 ClusterRole에 HPA가 추가되어야 지표 수집이 시작됩니다.

대상 : 마스터 프로젝트, 네임스페이스 프로젝트

수집 간격 : 5초

통계 데이터 : 5분, 1시간

Tags

태그명 설명 비고

name

HPA 이름

-

Fields

필드명 단위 설명 비고

currentReplicas

정수

현재 리플리카 수

-

desiredReplicas

정수

Desired 리플리카 수

-

lastScaleTime

정수

마지막으로 스케일이 변경된 TimeStamp

-

maxReplicas

정수

최대 리플리카 수

-

minReplicas

정수

최소 리플리카 수

-

metric_pod_cpu_avg

밀리 코어

HPA CPU 사용량

-

metric_pod_memory_avg

바이트

HPA Memory 사용량

-

resource_cpu

퍼센트

HPA CPU 평균 사용률

-

resource_memory

퍼센트

HPA Memory 평균 사용률

-