none
如何排查exchange2010 CAS array和NLB或DAG负载的问题。 RRS feed

  • 问题

  • 我的服务器是exchange2010 SP2...一共有两台,每台都安装了全角色,两台exchange作了DAG和CAS Array(NLB)。

    现在的问题是,有时服务器会出现反应慢响应超时的情况。

    具体表现有:

    1,OWA登录的时候会提示服务器busy或响应超时。

    2,外部用户发邮件来很久才收到 或 外部用户发邮件来显示timeout 或 外部邮件服务器发邮件时会发送到我优先级低的邮件服务器去。

    3,POP用户outlook客户端弹出来密码错误的提示框,收不了邮件,但可以发送。

    4,用户发送的邮件有时对方要比较长的时间(几分钟半个小时左右)才能收到。

    出现这些情况一般只有几分种或十几分钟或半个小时左右的时间,短的时候一两分钟就恢复正常了。

    我想知道我应该如何去查找出具体的问题和原因,以便我来增加硬件或服务器来解决问题,谢谢


    学无止境

    2017年8月21日 2:03

全部回复

  • 您好,

    从您的问题描述来判断,都是与服务器性能相关系的,因为CAS Array实际上是DNS的轮询,而DAG只是用来实现数据库的高可用的,并不会影响到邮件收发投递。然而如果服务器性能出现问题的话,就会导致Exchange客户端访问,验证及邮件投递等问题。

    所以,我们建议您使用Exchange Server Performance Monitor (EMC ---> Toolbox)来监控您的Exchange服务器,由于该问题只出现在某些不定期的时间段,建议使用Exchange Server Performance Health Checker Script来检测在Application log中是否有Performance相关的Log。

    另外,我想确认下您当前的服务器硬件配置及其使用量,比如CPU, 内存及磁盘。

    Regards,

    Allen Wang


    Please remember to mark the replies as answers if they help and unmark them if they provide no help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年8月21日 11:58
  • 1,,我两台ex的性能图如下,但是其中的每一个值最高峰在多少就会影响到性能呢?


    学无止境

    2017年8月22日 1:46
  • 2,,,,性能检查脚本运行时消耗服务器的资源大吗?  大的话我安排一个比较空闲的时间运行检查。

    3,,,服务器内存是132G,但服务器一般运行时使用量都在110g左右,cpu还好。硬盘系统为RAID1,,还有200G free space。Exchange邮件数据库的盘为RAID5,,只有60G的空间了。


    学无止境

    2017年8月22日 1:56
  • 4,服务器准备再加内存。

    5,服务器还有两个空盘位,准备再各加二个硬盘,组成RAID1,然后迁移一个400多G的Database到新加的RAID1硬盘上。


    学无止境

    2017年8月22日 1:59
  • 您好,

    感谢您的更新。
    请问您的截图是否是出现问题时获取的呢?如果不是的话,建议您monitor下问题,查看下Process Monitor并与现在比较下。
    注:当前有时会出现磁盘使用率比较大的情况,常规应该在60%-75%左右。

    尽量在空闲时间再去运行脚本,而且在加大内存和磁盘之后再检测下这个问题。
    而且目前Exchange 2010 SP2已经超出微软的支持范围了,为了获取到最新的功能,强烈建议您将其更新到Exchange 2010 SP3的最新版本。

    Regards,

    Allen Wang


    Please remember to mark the replies as answers if they help and unmark them if they provide no help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年8月24日 9:53
  • 谢谢你的回复。

    上面的截图不是发生问题的时候截的。检查脚本现在没有运行,不敢运行。

    从安装上线之后,操作系统和Exchange都没有更新过,不敢更新,怕更新后产生新的问题。

    准备再增加两个硬盘作RAID1,然后迁移一个三四百G的数据库过去。

    下次出问题时再截一下图对比一下。

    我是用NLB,做的CAS Array,,,如果增加内存和硬盘后还有问题。再加一台服务器只安装CAS和HUB,,,加到现在的CAS Array可以么?


    学无止境

    2017年8月24日 10:48
  • 嗯,是可以的。

    Regards,

    Allen Wang


    Please remember to mark the replies as answers if they help and unmark them if they provide no help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年8月28日 3:40
  • 今天非常的慢,都不知应该如何着手解决了。

     rpc request outstanding Value:46000

     RPC requests   value:66000   -94000了。。。。。


    学无止境

    2017年8月30日 6:28