Server

Redis HASH Table of SETS

레디스 내부구조 교육	레디스 정기점검/기술지원 Redis Technical Support	레디스 엔터프라이즈 서버 Redis Enterprise Server

HASH TABLE Elements Management

시작하기

정수 배열(intset)

데이터 구조

redis SET Hashtable data structure — 그림 1-1 Hash Table Overview

dict은 해시 테이블의 메인 데이터 구조로 dictht를 두 개 가지고 있고, 관련 펑션을 가지고 있는 dictType을 가리키는 포인터를 가지고 있습니다.
dictht는 dictionary hash table의 약자로, bucket을 가리키는 포인터를 가지고 있으며, 배열로 0, 1 두 개가 있고, dict안에 포함되어 있습니다.
dictType은 SET 관련 해시 테이블의 동작을 처리하기 위한 펑션을 가지고 있습니다.
buckets은 dictEntry를 가리키는 포인터 배열입니다.
dictEntry는 엔트리(값, value) 당 하나씩 할당되며, 값을 포함한 redisObject를 가리키는 포인터를 가지고 있습니다.

dict(dictionary)는 해시 테이블의 앞에 있다. dictht은 hash table 2개를 포함해서 96 bytes이다. privdata는 null이 할당된다.

redis SET dict data structure — 그림 1-2 dict data structure

DictType는 해시 테이블의 오퍼레이션이 가지고 있는 범용 구조이다.

setDictType

dictht의 table 필드는 dictEntry를 가리키는 포인터 배열이고 버킷(buckets)이라고 한다. size는 버킷의 크기를 나타낸다. 버킷 개수는 4부터 시작해서, 8, 16 이렇게 2의 제곱으로 증가한다. sizemask는 버킷 인덱스를 얻기 위한 값으로 size-1이다. used는 해시 테이블이 가지고 있는 엔트리 개수이다.

redis SET dictht data structure — 그림 1-4 dictht data structure

dictEntry는 24 바이트로, 값(value) 하나당 하나씩 할당된다. Key 필드가 값을 가지고 있는 redisObject를 가리킨다. Val 필드는 SET에서는 null 이 할당된다. Next 필드는 해시 값 충돌 시 다음 엔트리를 가리키는 포인터이다.

redis SET dictentry data structure — 그림 1-5 dictEntry data structure

연결 관계

데이터 구조 처음에 단순한 그림으로 보여주었던 해시 테이블 구조를 자세하게 표시했다.

redis SET dict relation — 그림 2-1 dict relation

redisObject의 type은 SET(REDIS_SET 0), encoding은 HT(REDIS_ENCODING_HT 2)이고, ptr은 SET의 dict를 가리킨다.
dict에서 dictht[0]과 dictht[1]을 연결하는 선을 점선으로 한 것은 dict 안에 배열로 포함된 것임을 나타낸다. 포인터가 아니다.
dictht[0]의 table 필드와 dictEntry 사이에 버킷(buckets)이 있어야 하나 여기서는 생략했다.

아래는 각 데이터 구조가 어느 펑션에서 생성되는지를 표시한 그림이다.

redisObject는 robj *createObject(int type, void *ptr)에서 생성된다.
dictht를 포함한 dict은 dict *dictCreate(dictType *type, void *privDataPtr)에서 생성된다. 이때 privDataPtr은 null로 들어온다.
dictType은 redis.c에 있는 setDictType에서 생성(할당) 된다.
dictEntry는 dictAddRaw에서 생성된다.
값(value)는 이미 robj와 sds로 할당되어 넘어오고, 이것을 dictEntry의 val이 아닌, key가 가리키도록 한다. Val에는 null로 채워진다.

아래는 버킷(buckets)과 sdshdr까지 포함하고, 그림에 맞는 값을 넣은 그림이다.

위에 SET의 dict를 가리키는 redisObject는 type이 SET이고, encoding은 HT이다.
DictType은 hash function, key compare, key destuctor에 펑션이 할당된다. 나머지 필드는 null로 채워진다.
dictht[0]에서 size는 가리키는 bucket의 개수이고, used는 엔트리 개수이다. bucket에 1번이 비어있으나, 인덱스 0이 해시 값 충돌이 발생해 2개 엔트리가 연결되어 있다. 그래서 used가 4이다.
값(value)를 가지고 있는 redisObject의 type은 STRING이고 encoding은 EMBSTR이다. 저장된 값이 5자리이기 때문에 EMBSTR이다. 두 번째 표시한 엔트리는 값이 50자리이므로 encoding이 RAW이다.
이에 대한 자세한 내용은 스크링 데이터 구조 에 있으니 참고하길 바랍니다.
그리고 각 값을 가리키는 robj의 type은 SET으로 바꾸지 않고 클라이언트로 받았을 때 설정된 STRING을 그대로 사용한다.

SET 해시 테이블(hashtable) 메모리 사용량

redis version 3.0.6
info memory : 815,072
명령 > sadd key A1001
info memory : 815,360 사용량 >> 288 bytes
명령 > sadd key A1002
info memory : 815,424 사용량 >> 64 bytes

24 바이트

16 바이트

8 바이트

5 바이트

1바이트

54 바이트

dictEntry 32 바이트와 합쳐서 64 바이트

메모리 오버헤드가 67 바이트

redisObject 16 바이트 + DictType 48 바이트 + dict 96 바이트 + buckets 32 바이트를 합하면 192 바이트

redisObject + sds에 32 바이트

그럼, 테스트를 해보자. 키 하나에 sadd 명령으로 'A1001' ~ 'A2000'까지 1000개의 데이터를 넣어보자. 테스트는 파이썬(Python)으로 했다.

redis version 3.0.6
>>> conn.info('memory') 815,072
>>> test.saddstr(conn,'key',1001,2000)
>>> conn.info('memory') 886,432 사용량 >> 71,360 bytes

71,360 바이트

데이터 한 건당 64 바이트를 사용하므로 64 * 1,000 하면 64,000 바이트이다.
총 메모리 사용량 71,360 - 64,000 = 7,360 바이트가 남는다.
여기서 버킷 메모리 사용량이 8 * 1024 = 8,192 바이트이다.
논리적으로 계산한 사용량이 72,192 바이트로 실제 사용량 71,360 바이트와 약간의 차이는 있다.
정리하면, 실 데이터 크기 보다 약 14배의 메모리를 더 사용했고, 데이터 건당 66 바이트의 메모리 오버헤드가 발생한다.
이 테스트는 메모리 측면만 본 것이다. 값의 크기가 작은(5바이트) 것으로 해서 상대적으로 오버헤드가 커보인다. 빠른 속도와 값의 개수가 아주 많아도 성능이 거의 떨어지지 않는 것이 해시 테이블의 큰 장점이다.
SET을 사용하면서 메모리를 절약할 수 있는 방법은 데이터(값)을 가능한 정수로 하는 것이다. 이렇게 해서 intset 을 사용하는 것이다. redis.conf에 있는 파라미터 set-max-intset-entries의 기본값(defaul)이 512인데 이것을 1024로 수정해서 사용해도 성능이 거의 떨어지지 않는다. 메모리 부족이 문제라면 고려해 볼 것을 권합니다.

버킷 확장(Expand)

아래 그림은 버킷 4개에 모두 dictEntry가 할당된 상태이다.

확장 조건은 dictht[0].used가 size보다 같거나 크고, background로 AOF rewrite나 RDB save가 진행 중이 아니면 expand를 수행한다. 특별한 경우로 background로 AOF rewrite나 RDB save가 수행 중 이어도 used가 size의 5 배 보다 많으면 expand를 수행한다.
확장은 현재 사용중인 버킷을 확장하는 것이 아니고, 새로운 버킷크기로 메모리를 할당하는 것이다. dictht[1]은 새로 할당된 버킷을 가리키고, size = 8, used = 0이다.

redis SET dict expand — 그림 3-2 버킷 할당(Expand)

새로운 키가 입력될 때는 saddCommand()에서 시각 해서 dbAdd()를 거쳐, dictAddRaw()에서 4개짜리 버킷이 할당되지만, 일반적으로는 값이 입력되는 (연한 주황색 function을 따라가자)
setTypeAdd() -> dictAdd() -> dictAddRaw() -> _dictKeyIndex() -> _dictExpandIfNeed() -> dictExpand()에서 메모리가 할당된다.

그림 3-3 버킷 할당(Expand) functions 흐름

아래는 dictExpand()에서 수행되는 버킷 확장(할당) 조건을 그림으로 표현했다.

redis SET dict expand functions — 그림 3-4 버킷 할당(Expand) condition

Rehash

앞에서 간단히 설명한 몇 가지 오퍼레이션을 아래 그림으로 표시했다. 해당 오퍼레이션은 dictAddRaw(), dictGenericDelete(), dictFind(), dictGetRandomKey(), dictGetSomeKeys() 이다. Add나 Delete뿐만 아니라, Find에서도 rehash를 수행한다.
한 버킷 씩 수행되므로 펑션 명도 dictRehashStep이다.

위에 redis.c에 있는 databaseCron() 에서 부터 시작하는 rehash 가 있다. 대상은 키를 관리하는 레디스 메인 해시 테이블이다. 일반 SET, HASH의 해시 테이블은 대상이 아니다.
- databaseCron()은 100 millisecond마다 수행되는데, redis.conf에 있는 activerehashing이 yes 이면 rehash function 호출한다.
- dictRehashMilliseconds(100)은 한 번 호출 시 100개의 버킷(buckets)을 rehash 한다.
- 100 buckets을 rehash 후 1ms를 초과했으면 멈추고, 초과하지 않았으면 다시 100 buckets에 대해서 rehash를 수행하는 작업을 반복한다.