您当前的位置: 首页 > Go

大偏移量下Redis、MongoDB分页/排行性能比较

发布时间：2011-06-29 18:28:21 文章来源：www.iduyao.cn 采编人员：星星草

大偏移量下Redis、MongoDB分页/排名性能比较

题目其实并不太准确，因为数据库并不会提供分页、排名等功能，提供的只是数据的存取，分页排名这些都是我们基于数据库的实用案例而已。然而无论是Redis还是MongoDB，通常都有一些常规的做分页和排名的方法。本文就通过一些测试数据来向大家介绍Redis和MongoDB（以及传统关系型数据库）在这方面的性能差别。

分页

首先我们来做一个分页，在MongoDB中示例数据如下所未：

db.scores.find();
{lid: ObjectId("4fe506dabb2bfa742d000001"), score: 1, name: 'user_1'}
{lid: ObjectId("4fe506dabb2bfa742d000001"), score: 2, name: 'user_2'}
{lid: ObjectId("4fe506dabb2bfa742d000001"), score: 3, name: 'user_3'}
{lid: ObjectId("4fe506dabb2bfa742d000001"), score: 4, name: 'user_4'}

其中lid字段用于区分不同的纬度，主要用在筛选上，在测试collection中，一共有五个不同的lid值，每一个对应1,200,000条数据，一共6,000,000条数据。索引在lid 和 score上。（下面的查询能使用到索引）

然后我们进行下面的性能测试：

collection = Mongo::Connection.new.db('test').collection('scores')
Benchmark.bmbm do |x|
  x.report("mongo small") do
    100.times do |i|
      collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => -1}).limit(20).skip(i * 20).to_a
    end
  end
  x.report("mongo medium") do
    100.times do |i|
      collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => -1}).limit(20).skip(i * 1000).to_a
    end
  end
  x.report("mongo large") do
    100.times do |i|
      collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => -1}).limit(20).skip(i * 10000).to_a
    end
  end
end

上面分别对skip条数比较小，中等大小和非常大三种情况进行了测试。而limit指定获取的数据都一样是20条。这三种情况下的测试结果分别是：0.6 秒， 17 秒，173 秒。

我们可以看到，对MongoDB来说，skip的大小严重影响性能，应该严格避免特别大的skip操作。

下面我们将类似的数据用Redis的Sorted Sets进行存储。并进行相应的性能测试

redis = Redis.new(:driver => :hiredis)
Benchmark.bmbm do |x|
  x.report("redis small") do
    100.times do |i|
      start = i * 20
      redis.zrevrange(lids.sample, start, start + 20, :with_scores => true)
    end
  end
  x.report("redis medium") do
    100.times do |i|
      start = i * 1000
      redis.zrevrange(lids.sample, start, start + 20, :with_scores => true)
    end
  end
  x.report("redis large") do
    100.times do |i|
      start = i * 10000
      redis.zrevrange(lids.sample, start, start + 20, :with_scores => true)
    end
  end

这里skip的值和上面MongoDB中是一样的，那么Redis的表现如何呢。这三种情况下的测试结果分别是：0.028 秒， 0.025 秒， 0.028 秒。

采用类似于MongoDB的数据结构存储在PostgreSQL中并进行相同的测试，其结果比MongoDB还要差一点。具体结果如下：

mongo small   0.6
mongo medium   17
mongo large   173
redis small   0.028
redis medium   0.025
redis large   0.028
pg small   1
pg medium   122
pg large   650

排名

排名功能与分页功能类似，不同的是排名是通过计算大于某个值的条数来做的。

比如：

//sql
select count(*) from scores where lid = $1 and score > $2

//mongo
db.scores.find({lid: lid, score: {$gt: score}}).count()

由于排名和分页实现原理上类似，所以结果实际上差不多。测试结果如下：

mongo top rank   1.155847
mongo average 22.291007

redis top rank   0.169442
redis average 0.162205

pg top rank 0.714144
pg average   21.771570

结论

上面做了对比，那么本文要说一个什么问题呢？

首先，在MongoDB中，尽量避免进行比较大的skip操作，比如在分页中，如果你能知道需要获取数据的上一条score是多少，那么可能能够用下面的方法来获取你要的数据，而不是通过一次很大的skip操作。

  db.scores.find({lid: lid, score: {$lt: last_score}}).sort({score: -1}).limit(20)

另外，如果你需要进行比较大的skip操作或者count比较大的数量，那么可以考虑采用Redis的Sorted Sets来做。

后记

本文在微博上引起了一些技术朋友的讨论，对于对比的问题这里做一个说明。

我们知道，Redis是内存数据库，而MongoDB不是，所以有朋友质疑这里的对比是否只是内存与磁盘的对比。实际上这一说法不无道理，上面的测试数据出自原作者文章，其文章也并未提及MongoDB是否都在内存中。根据我个人的实验结果，当数据全部能够在内存中时，确实不会出现如本文中所说的 MongoDB性能严重差异。但是，随着skip的变大，操作时间还是在显著变长，而Redis的Sorted Sets则相对稳定。

同时也欢迎更多实验对比数据和原理分析的讨论。感谢大家。

上一篇：windows中装配mongoDB
下一篇：MongoDB:MapReduce基础及范例

友情提示：
信息收集于互联网，如果您发现错误或造成侵权，请及时通知本站更正或删除，具体联系方式见页面底部联系我们，谢谢。

其他相似内容：

ModernUI课程:定义一个Logo

ModernUI教程:定义一个Logo ModernWindow的标题栏包含了一块区域用来显示自定义的窗体Logo：这个窗体logo通过ModernWindow.LogoD...
Django忘记管理员账号和密码的解决方法

Django忘记管理员账号和密码的解决办法看着Django的教程学习搭建网站，结果忘记第一次创建的账号和密码了。结果搭建成功以后，一直...
GO语言小结(1)——基本知识

GO语言总结(1)——基本知识 1、注释（与C++一样）　　行注释：//　　块注释：/* 　　...　　*/ 2、标识符　　可以这么说，除了数字开头...
golang 惯用的文件读取方式

golang 常用的文件读取方式 Golang 的文件读取方法很多，刚上手时不知道怎么选择，所以贴在此处便后速查。一次性读取小文件推荐一...
查询深圳市通相关信息

查询深圳通相关信息用 HTTP.GET 从开放 API 中查询深圳通信息，然后将 JSON 数据存入结构体中，再格式化输出。注意：获取的并不是实...
Go语言设计模式实践：结合（Composite）

Go语言设计模式实践：组合（Composite）关于本系列这个系列首先是关于Go语言实践的。在项目中实际使用Go语言也有段时间了，一个体会就...
列出索引和遍历目录

列出目录和遍历目录获取目录列表用 ioutil.ReadDir()，遍历目录用 filepath.Walk()，使用方法请参考文章示例。示例代码： package ma...
io 包的惯用接口速记

io 包的常用接口速记我没有 C/C++ 基础，没有接口的概念，且从 Python 投奔而来，Python 的极简主义（一个结果往往只提供一个方法），让我在...
代理服务扩充

代理服务扩展之前自己实现了一个代理服务，当时考虑的是只要支持SOCKS5就好了，因为我经常用CHROME，配合着SwitchySharp，体验还是很棒...
文件的创造与打开

文件的创建与打开文件操作是个很重要的话题，使用也非常频繁，熟悉如何操作文件是必不可少的。Golang 对文件的支持是在 os package ...

大偏移量下Redis、MongoDB分页/排行性能比较

分页

排名

结论

后记

其他相似内容：

热门推荐：