mongo 分片

xiaoxiao2021-02-28 39

启动集群分片：

要对一个集合分片，首先你要对这个集合的数据库启用分片，执行如下命令： sh.enableSharding("test") mydb被配置成启用分片后,配置信息是存放在配置服务器的数据库config的databases集合里! 片键：片键是集合的一个键，MongoDB根据这个键拆分数据。例如：username 。在启用分片之前，先在希望作为片键的键上创建索引： db.users.ensureIndex({"username":1}) mydb的users集合被配置成启用分片后,配置信息是存放在配置服务器的数据库config的collections集合里! 对集合分片： sh.shardCollection("test.users",{"username":1}) 路由服务器是不会存放配置信息(不用配置dbpath也是这个原因,但会缓存配置服务器上的配置!) mongos路由会在后台对各片进行负载均衡,直至各片的chunks块数量相等!。分片的balance，可以在规定时间执行这个操作，推荐在业务非繁忙的时候做。

下面来做一下数据库，在片上均衡实验（数据库为分片情况）

mongos> use mydb1 switched to db mydb1 mongos> db.mytest.insert({name:"zhang"}); WriteResult({ "nInserted" : 1 }) mongos> sh.status(); --- Sharding Status --- sharding version: { "_id" : 1, "minCompatibleVersion" : 5, "currentVersion" : 6, "clusterId" : ObjectId("57146d38f71635a4755aa902") } shards: { "_id" : "rs1", "host" : "rs1/mongodb01:10001,mongodb02:10001" } { "_id" : "rs2", "host" : "rs2/mongodb02:10002,mongodb03:10002" } { "_id" : "rs3", "host" : "rs3/mongodb01:10003,mongodb03:10003" } { "_id" : "rs4", "host" : "rs4/mongodb01:10004,mongodb02:10004" } active mongoses: "3.2.5" : 3 balancer: Currently enabled: yes Currently running: no Failed balancer rounds in last 5 attempts: 5 Last reported error: could not find host matching read preference { mode: "primary" } for set rs4 Time of Reported error: Mon Apr 18 2016 16:54:52 GMT+0800 (CST) Migration Results for the last 24 hours: No recent migrations databases: { "_id" : "mydb", "primary" : "rs2", "partitioned" : true } mydb.mycol1 shard key: { "id" : 1 } unique: false balancing: true chunks: rs2 1 { "id" : { "$minKey" : 1 } } -->> { "id" : { "$maxKey" : 1 } } on : rs2 Timestamp(1, 0) { "_id" : "sisyphus", "primary" : "rs2", "partitioned" : true } { "_id" : "mydb1", "primary" : "rs1", "partitioned" : false } mongos> use mydb2 switched to db mydb2 mongos> db.mytest.insert({name:"zhang"}); WriteResult({ "nInserted" : 1 }) mongos> sh.status(); --- Sharding Status --- sharding version: { "_id" : 1, "minCompatibleVersion" : 5, "currentVersion" : 6, "clusterId" : ObjectId("57146d38f71635a4755aa902") } shards: { "_id" : "rs1", "host" : "rs1/mongodb01:10001,mongodb02:10001" } { "_id" : "rs2", "host" : "rs2/mongodb02:10002,mongodb03:10002" } { "_id" : "rs3", "host" : "rs3/mongodb01:10003,mongodb03:10003" } { "_id" : "rs4", "host" : "rs4/mongodb01:10004,mongodb02:10004" } active mongoses: "3.2.5" : 3 balancer: Currently enabled: yes Currently running: no Failed balancer rounds in last 5 attempts: 5 Last reported error: could not find host matching read preference { mode: "primary" } for set rs4 Time of Reported error: Mon Apr 18 2016 16:54:52 GMT+0800 (CST) Migration Results for the last 24 hours: No recent migrations databases: { "_id" : "mydb", "primary" : "rs2", "partitioned" : true } mydb.mycol1 shard key: { "id" : 1 } unique: false balancing: true chunks: rs2 1 { "id" : { "$minKey" : 1 } } -->> { "id" : { "$maxKey" : 1 } } on : rs2 Timestamp(1, 0) { "_id" : "sisyphus", "primary" : "rs2", "partitioned" : true } { "_id" : "mydb1", "primary" : "rs1", "partitioned" : false } { "_id" : "mydb2", "primary" : "rs3", "partitioned" : false } 可以看到对于未启动分片的数据库，可以看出我们随便创建的数据库的集合，他可以随机分布在不同的片上，mongo用这种机制实现主的平均分布，实现数据库的均衡。

扩展一下，对于分片通常实验范围分片和hash分片，分片具体看业务情况的。而且分片以后是不能直接更改的，除非删除数据库或者collection，停业务实验mongodump重新导数据，这个代价太大，所以分片时候要谨慎。

范围分片：

1，适合普通范围查询，可以优化到让热查询定位到某个片，数据集中取出避免数据分散而走网络取数据

2，最好给分片键建立序列，实践证明依据序列查找比全片所有chunk查找快的多

3，缺点在于，如果shardkey有明显递增（或者递减）趋势，则新插入的文档多会分布到同一个chunk，无法扩展写的能力

hash分片：

1，适合大规模插入，由于范围平均可以充分利用整个集群的性能

2，适合高并发，集群的各个集群平均分担压力,

3，不能高效的服务范围查询，所有的范围查询要分发到后端所有的Shard才能找出满足条件的文档

转载请注明原文地址: https://www.6miu.com/read-1400155.html

技术

最新回复(0)