Post List

2015년 8월 14일 금요일

MongoDB Study #20 Sharding System 2/2 : 고려사항 및 관리, Trouble Shooting

1. Shard System 구축시 고려 사항

1.1 Shard Key

- Shard Key 를 어떤 Field로 설정하느냐에 따라 MongoDB 성능이 달라지므로 중요합니다.
- Shard Key는 분할(Partition) 과 균등 분산(Load Balancing)을 위한 기준이기 때문에 적절한 카디널리티(Cardinality)를 가진 Field로 정해야 합니다.
- Cardinality 란 Data의 분산정도를 뜻하는데 특정 조건에 만족하는 Data가 많다면 Low Cardinality라고 하고, 만족하는 Data가 적다면 High Cardinality 라고 합니다. 사원번호는 유일한 값이므로 High Cardinality를 가지고, 성별은 50 : 50 확률이므로 Low Cardinality를 가집니다. 너무나도 높은 Cardinality로 설정하는 것도 효과적인 분산이 되지 않으므로, 다른 Key로 하는게 좋습니다. 하나의 Field로 적절한 Key 설정이 힘들다면 여러 개의 Filed를 조합하여 설정하는 것이 좋습니다.

1.2 Shard Key Index

- Shard Key는 반드시 하나의 Index를 생성해야 합니다.
- Shard Key를 기준으로 Data를 분산하는 기준이 되며, Chunk Migration 회수와 빈도를 결정합니다.

1.3 Hashed Index 고려

- 적절히 Shard Key로 설정할만한 Field가 없다면 먼저 Compound Index를 생각해봐야 하지만, 적절히 Field 들을 조합해서 좋은 Cardinality를 가진 Shard Key를 만들어내는 것이 쉬운 일은 아닙니다.
- 그럴 경우에는 Hashed Index를 고려해 볼만 합니다. Hashed Index는 시스템에서 생성한 알고리즘으로 적절히 분산을 시켜줍니다.
- 하지만 Hashed index로 Shard Key를 생성하면 연속된 Data 들이 각기 다른 Shard Node로 저장되기 때문에 Index IO가 증가 할 수 있습니다.
- 그러므로, 연속된 Data를 읽어야 하는 작업이 있는 경우에는 Hashed Index를 사용하지 않고 적절한 Shard Key를 찾는 것이 좋습니다.

1.4 Chunk Size 와 Migration 임계값

- Chunk : 여러 대의 Shard Server로 구성되었더라도 하나의 Server에만 쓰기 작업이 집중적으로 발생할 수 있습니다. 이럴 경우 쓰기 지연 현상으로 인하여 성증 저하가 발생합니다. 그럴 경우를 대비하여 Server에 저장하는 Data를 여러 개의 논리적 구조로 분할 저장해 두었다가 일정 량에 도달했을 때  다른 Server로 분할 Data의 일부를 이동시킵니다. 이 분할 단위를 Chunk라고 합니다.
- Chunk의 기본적으로 Size는 64MB (또는 10만개의 Document) 단위로 분할되지만 설정된 Shard Key에 따라 그 이상이 될 수도 있습니다.
- Chunk Size가 작다면 Chunk Migration이 자주 일어나게 되며, Chunk Size가 크다면 하나의 Server에만 Data가 쌓이게 됩니다. 그러므로 적절한 Chunk Size의 설정이 중요하며, 최초 설정 후에도 성능 저하 현상이 발생하면 Tuning을 통해서 적절한 Size로 조정해야 합니다.
- 평균적으로 하나의 Shard Server에 20개 미만의 Chunk가 발생할 경우 평균 2회 정도의 Chunk Migration이 발생합니다. 21 ~ 80개 정도에는 4번, 80개 이상일 경우 8개 정도의 Chunk Migration이 발생합니다.

2. Shard Server 관리

2.1 Server 추가 , 삭제, 이동

먼저 Node 4에서 사용할 경로를 생성 후 Shard Server 를 Port 40004로 가동합니다.
C:\>cd\MongoDB
C:\MongoDB>MD Shard4
C:\MongoDB>mongod --shardsvr --dbpath c:/mongodb/shard4 --port 40004

방금 새로 활성화한 Shard4 를 추가합니다.
C:\>mongo localhost:50000/admin
MongoDB shell version: 3.0.5
connecting to: localhost:50000/admin
mongos> db.runCommand( { addshard : "localhost:40004" } )
{ "shardAdded" : "shard0003", "ok" : 1 }
mongos> db.runCommand( { listshards : 1 } )
{
        "shards" : [
                {
                        "_id" : "shard0000",
                        "host" : "localhost:40001"
                },
                {
                        "_id" : "shard0001",
                        "host" : "localhost:40002"
                },
                {
                        "_id" : "shard0002",
                        "host" : "localhost:40003"
                },
                {
                        "_id" : "shard0003",
                        "host" : "localhost:40004"
                }
        ],
        "ok" : 1
}

Primary Server를 변경해 보겠습니다.
mongos> db.runCommand( { movePrimary : "test" , to : "localhost:40002"} )
{ "primary " : "shard0001:localhost:40002", "ok" : 1 }

이제 필요없는 Shard Server를 제거해 보겠습니다.
mongos> db.runCommand( { removeshard : "localhost:40004" } )
{
        "msg" : "draining started successfully",
        "state" : "started",
        "shard" : "shard0003",
        "ok" : 1
}
mongos> db.runCommand( { listshards : 1 } )
{
        "shards" : [
                {
                        "_id" : "shard0000",
                        "host" : "localhost:40001"
                },
                {
                        "_id" : "shard0001",
                        "host" : "localhost:40002"
                },
                {
                        "_id" : "shard0002",
                        "host" : "localhost:40003"
                },
                {
                        "_id" : "shard0003",
                        "host" : "localhost:40004",
                        "draining" : true
                }
        ],
        "ok" : 1
}

2.2 Chunk Size 관리

Chunk Size 확인 및 변경하는 방법 입니다.
mongos> use config
switched to db config
mongos> db.settings.find()
{ "_id" : "chunksize", "value" : 1 }
mongos> db.settings.save( { _id : "chunksize" , value : 128 } )
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
mongos> db.settings.find()
{ "_id" : "chunksize", "value" : 128 } 

하나의 Chunk Size를 둘 로 나누는 방법입니다.
mongos> sh.splitFind( "test.emp" , { "empno" : 100000 } ) // Field 값 100000 을 기준으로 Chunk를 분리합니다.
{ "ok" : 1 }
mongos> sh.splitAt( "test.emp" , { "empno" : 50000 } ) // Field 값 50000 을 기준으로 Chunk를 둘로 분리합니다.
{ "ok" : 1 }
mongos> sh.splitAt( "test.emp" , { "empno" : 50000 } ) // 이미 분리되어 있기 때문에 더이상 분리가 안됩니다.
{
        "ok" : 0,
        "errmsg" : "new split key { empno: 50000.0 } is a boundary key of existing chunk [{ empno: 50000.0 },{ empno: 50468.0 })"
}

2.3 Balancer 관리

Mongos(Balancer) Process가 Shard 에 Data를 분산하다 보면 작업의 일관성을 위하여 Lcok을 사용하기도 하는데, Lock 상태를 Monitoring 해 보겠습니다.
mongos> use config
switched to db config
mongos> db.locks.find( { _id : "balancer" } ).pretty() // Blanacer 잠금 상태 확인
{
        "_id" : "balancer",
        "state" : 0,
        "who" : "SJYUN-ATIV:50000:1439540406:41:Balancer:18467",
        "ts" : ObjectId("55cda80a4118c81f6b30484f"),
        "process" : "SJYUN-ATIV:50000:1439540406:41",
        "when" : ISODate("2015-08-14T08:34:18.514Z"),
        "why" : "doing balance round"
}
mongos> sh.getBalancerState() // Balancer 의 작동여부 확인
true

Balancer 는 Shard Server의 Data를 분산 저장하는데 Chunk Size를 적절하게 설계하지 못하면 불필요한 Migration 때문에 성능 저하 현상이 발생할 수 있습니다. 그래서 일정한 시간대에 Balancer의 작동을 중지 시키고, 특정 시간에만 동작하도록 설정이 가능합니다.
mongos> db.settings.update( { _id : "balancer" } , { $set : { activateWindow : { start : "23:00" , stop : "06:00" } } }, true )
WriteResult({ "nMatched" : 0, "nUpserted" : 1, "nModified" : 0, "_id" : "balancer" })
mongos> db.settings.update( { _id : "balancer" } , { $unset : { activateWindow : true } } )
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
mongos> sh.stopBalancer()
Waiting for active hosts...
Waiting for the balancer lock...
Waiting again for active hosts after balancer is off...
mongos> sh.startBalancer()

3. Sharding System의 문제점

3.1 하나의 Shard Server에 Data가 집중되고 균등 분산이 안 되는 경우

Shard Key로 설정된 Field의 Cardinality가 낮은 경우 설정된 Chunk Size보다 훨씬 더 큰 크기의 Chunk가 생성되기도 합니다. 기본적으로 8개 정도의 Chunk가 만들어 졌을때 Migration이 일어나는데, Chunk Size가 설정값보다 크게 된 경우에는 하나의 Shard Server에 Data가 집중되는 현상이 발생할 수 있습니다.
이럴 경우 Shard Key를 다시 설정하는게 가장 이상적이며, Shard Key가 이미 적절한데도 그렇다면 Chunk Size를 보다 작게 설정함으로 Migration 빈도를 높여 줘야 합니다.
입력되는 Data 량에 비해 Chunk Size가 너무 큰 경우에는 아무리 입력되어도 Chunk Size에 도달하지 못하기 때문에 하나의 Server에 Data가 집중됩니다.

3.2 특정 Shard Server에 IO Traffic이 증가하는 경우

동일한 Shard Key를 가진 Data는 동일한 Shard Server에 저장됩니다. 그러므로 너무 낮은 Cardinality를 가진 Field로 설정했다면 특정 Server에만 Traffic이 높게 됩니다.
집중적으로 입력, 수정, 삭제, 조회가 빈번하게 일어나는 Chunk를 Hot Chunk라고 합니다.

3.3 Shard Cluster의 Balance가 균등하지 않은 경우

- Load Balancing이 제대로 되었더라도 특정 Server의 Data를 삭제 또는 다른 공간으로 이동했다면 Balance는 깨지게 됩니다.
- Cardinality가 낮은 Shard Key로 설정한 경우에는 균등하게 분산되지 않을 수 있습니다.
- Big Data가 빠르게 입력되는 것보다 Shard Server에 분산 저장되는 속도가 늦은 경우에는 전체적인 Balance가 균등하지 않게 됩니다.
- Big Data의 빠른 저장에 비해 Chunk Migration이 네트워크 부하로 속도가 늦으면 빠르게 이동되지 못하는 경우가 발생합니다.
- 많은 사람들이 사용하고 있는 Peak Hour에 빈번한 Chunk Migration이 발생하면 성능 지연이 발생합니다.

3.4 과도한 Chunk Migration이 Cluster 작동을 멈추는 경우

- 빈번한 Chunk Migration은 일시적으로 Server 성능 지연을 유발합니다. 그럴 경우 Peak Hour에는 Balancer 작동을 중단시켜야 합니다.
- 불필요하게 큰 Chunk Size는 Network Traffic을 증가시키므로 그럴 경우는 Chunk Size를 줄여야 합니다.
- Shard Server의 Balancing이 적절하지 않다면 Shard Server 수를 늘려주는 방법도 있습니다.

3.5 쓰기 성능이 지연되고 빠른 검색이 안되는 경우

- Collection의 Extent 크기가 너무 작게 설정되어 있으면 빈번한 Extent 할당 작업이 일어나 대기 시간이 발생할 수 있습니다.
- Collection을 설계할 때 빠른 성능이 요구되는 경우에는 Rich Document로 설계하는 것이 좋습니다.
- Shard Server는 Single Node Server보다 요구되는 Memory가 더 많습니다. 더 많은 Memory가 요구됩니다.











댓글 없음:

댓글 쓰기