Linux中国 Linux中国门户站!
设为主页 设为主页
收藏本站 收藏本站
 
当前位置 :首页 ->数据库应用 ->PostgreSQL ->正文

关于MySQL和Postgres的具体比较

来源:Linuxdby.com 作者:Webmaster 时间:2007-04-12 点击: [收藏] [投稿]

  我使用哪个数据库:PostgreSQL 或 MySQL?这个老生常谈的问题已经困惑了开发者至少两年了。我全面地接触了这两个数据库系统(MYSQL有一年,而Postgres有二年了),而且对MySQL网站提出的关于两者之间的差异非常好奇。
  
  1999年9月,当我们正开始对SoureForge架设基础的时候,我对这两个数据库作了性能测试。当时,尽管我已经习惯于使用Postgres完成所有工作,但两者的性能差异是如此之明显以至与我们不得不采用MySQL。其他的惯用MySQL的开发者也拥护这个决定。
  
  在当时,这个性能测试要胜于平时任何人为的测试。我想看看这两个数据库在网站某一具体的网页上应用的情况。所提及的这个网页是SourForge讨论区。它包括3个表的简单相关结合。每个表有20-30,000行数据。以及递归的实现和嵌套的信息,所以数据库在此页上的应用确实是一个瓶颈。
  
  开始实行,我从库中卸下了真实的数据。编辑了SQL表,并且把其导入MySQL 3.22.30和PostgreSQL7.0.2,运行在拥有1G RAM 的VA Linux quad-xeon 4100 server上的Red Hat Linux 6.2上。
  
  使我陷入的第一个问题是,在Postgres中,有一个不可思议的问题:每行数据最多只能有8K。在信息公告板上,你时常会超过每行8K的限制。所以Postgres在导入数据时阻塞。为了能继续使用,我只得把数据的"body"抛弃,并且重新导入数据。Postgres 开发小组已经意识到了这个限制,并且在7.1的版本中修改了,而且他们告诉你,你可通过重新编译Postgres使得它支持32K/每行,尽管这样做会使整个系统的性能受到影响。
  
  在这一点上,我又陷入了Postgres另一个小问题上,它的"serial"数据类型(等价于MYSQL的auto_increment)会造成一个"sequence":当它的双亲表被抛弃时,它本身不被抛弃。因此,当你想重新创建这个表时,会引起一个名字冲突。有许多新的用户被这个问题所困惑,所以这些问题使Postgres在测试中失去一些优势。相反,MySQL聪明到它可以在你导入数据的时候对auto_increment进行自动增量,然而Postgres的sequence 不可以在你导入数据时重置,从而引起新插入操作的失败。
  
  方法
  为了尽可能地真实,我从网站上选择了实际的网页,并且使它轻巧地交叉于MySQL和Postgres之间。这基本上意味着所有mysql_query()调用把被pg_exec()替换。这个页包括许多选取与连接操作,与典型的网站做的差不多。
  
  一旦这个测试页运行和调试,我便使用"AB",就是"Apache Benchmarking"应用集,从我的工作站通过我的100M局域网到达quad-xeon服务器。为了在负载的数量上得到一个概念,我使用AB进行各种并发连接的测试,从10-120,当离开了这些页后,这个数稳定在了1000上。
  
  为了更加地接近实际应用,我在脚本中安置了一个随机数生成器,它插入页面的10%的数据到数据库中。在PHPBuilder中所有讨论区页面有10%是作为发送新信息的。
  
  进一步地,就以上所说,我都使用从现成的数据中提取的数据,你得不出比此更真实的情况了。
  
  数值
  实际测试结果:
  
  并发连接 w/p:
  
  10 客户 - 10.27 页/秒333.69 kb/s
  
  20 客户 - 10.24 页/秒332.86 kb/s
  
  30 客户 - 10.25 页/秒333.01 kb/s
  
  40 客户 - 10.0 页/秒324.78 kb/s
  
  50 客户 - 10.0 页/秒324.84 kb/s
  
  75 客户 - 9.58 页/秒311.43 kb/s
  
  90 客户 - 9.48 页/秒307.95 kb/s
  
  100 客户 - 9.23 页/秒300.00 kb/s
  
  110 客户 - 9.09 页/秒295.20 kb/s
  
  120 客户 - 9.28 页/秒295.02 kb/s (2.2% 失败)
  
  <br>并发连接w/10% 插入:
  
  30 客户 - 9.97 页/秒324.11 kb/s
  
  40 客户 - 10.08 页/秒327.40 kb/s
  
  75 客户 - 9.51 页/秒309.13 kb/s
  
  <br>MySQL
  
  <br>并发连接测试 w/p:
  
  30 客户 - 16.03 页/秒 521.01 kb/s
  
  40 客户 - 15.64 页/秒 507.18 kb/s
  
  50 客户 - 15.43 页/秒 497.88 kb/s
  
  75 客户 - 14.70 页/秒 468.64 kb/s
  
  90 - mysql 崩溃
  
  110 - mysql 崩溃
  
  120 - mysql 崩溃
  
  并发连接测试w/op:
  10 客户 - 16.55 页/秒537.63 kb/s
  
  20 客户 - 15.99 页/秒519/51 kb/s
  
  30 客户 - 15.55 页/秒505.19 kb/s
  
  40 客户 - 15.46 页/秒490.01 kb/s 47 失败
  
  50 客户 - 15.59 页/秒482.24 kb/s 82 失败
  
  75 客户 - 17.65 页/秒452.08 kb/s 363 失败
  
  90 客户 - mysql 崩溃
  
  <br>并发连接 w/10% 插入运算:
  
  20 客户 - 16.37 页/秒531.79 kb/s
  
  30 客户 - 16.15 页/秒524.64 kb/s
  
  40 客户 - 22.04 页/秒453.82 kb/sec 378 失败
  
  我觉得测试结果中最有意思的事情是观察没有出错情况下已经装入运行的Postgres能负载多少。实际上,Postgres在没有错误的情况下负载好像要比MySQL高3倍。MySQL在负有40-50个并发连接时开始失常,而在没有其它影响的情况下,Postgres能使120个并发连接运行自如。我的猜测是:如果有足够的内存与够快的CPU,Postgres能够正常负载的远远不止120个并发连接。

 如果您对本文有任何疑问或者建议,请到讨论区发表您的意见: >> 论坛入口 <<



上一篇:Linux下JSP搭建(Tomcat4+jdk+postgreS)   下一篇: 客观公正地评价MySQL和PostgreSQL的优劣

文章评论】 【收藏本文】 【推荐好友】 【打印本文】 【我要投稿】 【论坛讨论
更多相关文章
Power by linux-cn.com 粤ICP备05006655号