Server

Redis ZIP List of LISTS

레디스 내부구조 교육	레디스 정기점검/기술지원 Redis Technical Support	레디스 엔터프라이즈 서버 Redis Enterprise Server

ZIP LIST 배경

왜 WHY

ZIP LIST 데이터 구조

Zip List Data Structure

Entry Data Structure

itself len 구성 - 값(value)이 문자열 일 때

itself len 구성 - 값(value)이 숫자(정수) 일 때

itself len 구성 - 값(value)이 실수(소수점을 가진 숫자)일 때는?

실수는 더블 형으로 바꾸어야 하는데, 그러면 문자열로 그대로 둘 때보다 메모리를 더 많이 사용할 경우가 많으므로 문자열 그대로 사용한다.

prevlen 구성

정리하면

itself len은 값이 문자열일 때는 1,2,5 바이트로 구분해서 길이를 저장하고, 숫자(정수) 일 때는 1 바이트만 사용한다.
prevlen은 이전 엔트리의 길이를 저장하는 것이므로 문자, 숫자 구분 없이 1,5 바이트 두 종류를 사용한다.
값(value)은 문자열일 때는 그대로 저장하고, 숫자(정수) 일 때는 4,8,16,24,32,64 비트로 구분해서 저장한다.
값(value)이 실수일 때는 문자열로 취급한다.
레디스에서는 이렇게 데이터의 형태, 길이에 맞게 최대한 메모리를 절약할 수 있는 구조로 짚 리스트를 설계해서 사용하고 있다.

짚 리스트 오퍼레이션

그림으로 보는 짚 리스트 오퍼레이션

prevlen은 왜 두 종류만 사용할까?

정리하면

CascadeUpdate가 발생했을 때 성능

while i <= end_index:
conn.lpush(key,'A'*250)
i = i+1
...
3929:M 03 Jan 13:43:52.346 * Processing time(us):5, LPUSH key
3929:M 03 Jan 13:43:52.346 * Processing time(us):5, LPUSH key
3929:M 03 Jan 13:43:52.346 * Processing time(us):5, LPUSH key
3929:M 03 Jan 13:43:52.346 * Processing time(us):6, LPUSH key
3929:M 03 Jan 13:43:52.346 * Processing time(us):7, LPUSH key
3929:M 03 Jan 13:43:52.346 * Processing time(us):5, LPUSH key
3929:M 03 Jan 13:43:52.346 * Processing time(us):6, LPUSH key
3929:M 03 Jan 13:43:52.346 * Processing time(us):5, LPUSH key
...
>>> conn.lpush('key','B'*251)
501L
3929:M 03 Jan 13:49:10.598 * Processing time(us):2886, LPUSH key

5.6us

2,886us

약 500배 이상의 시간이 걸렸다.

절대 수치보다는 상대적인 비율을 보시기 바랍니다.

LIST와 ziplist의 메인 오퍼레이션 연결 관계

< listTypeOperation에서 엔트리 개수에 따라, Linked List operation과 zip list operation으로 나누어지는데, 여기서는 zip list를 설명하고 있으므로 Listed List operation은 제외했다. >

어려운 글 끝까지 읽어주어 고맙습니다. 짚 리스트를 이해하는데 도움이 되시길 바랍니다.

<< STRINGS Data Structure	ZIP List of LISTS	LINKED List of LISTS >>

Email 답글이 올라오면 이메일로 알려드리겠습니다.