none
exchange server 2019 DAG 集群被动失败 RRS feed

  • 问题

  • 您好,

        我方上海有一个主域控服务器、一个辅域控服务器,一个exchange server 2019成员服务器,香港有一个exchange server 2019成员服务器构成有三个数据库的DAG集群

        现在发现其中有一个数据库被动失败,且无法恢复及更新,报错日志日下:

    “The Microsoft Exchange Replication service encountered an error while inspecting the logs and database for Mailbox Database  xxxx\xxxxxx on startup. Error: Log repair failed: An error occurred while communicating with server 'xxxxxx'. Error: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond xxxxxxx

    2020年10月5日 3:26

答案

  • 您好,

    关于这个DAG副本问题最近有什么进展吗?

    如果您对此问题有任何疑问或需要进一步的帮助,请随时回复。

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年10月16日 7:07
    版主
  • 1、一般情况下都是建议每个数据中心都有域控。

    2、 是的,仲裁模式中的大多数投票者只是指DAG成员和见证服务器,不包括域控。但如果有域控被作为见证服务器了,那也算是投票者。

    DAG成员数n是偶数时,至少n/2+1个投票者(成员服务器和见证服务器)能正常工作和相互通信,DAG才能正常工作;

    DAG成员数n是奇数时,至少(n+1)/2个DAG成员服务器要能正常工作和相互通信。

    具体介绍可查看:数据库可用性组仲裁模式,但是机器翻译会有不通顺的地方,您可以查看英文原文:Database availability group quorum models

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    • 已标记为答案 xuyueming 2020年10月26日 1:26
    2020年10月22日 6:34
    版主
  • 您好,

        确认是我们的网络问题导致的,另外关于您之前的回复,我有以下疑问:

       1>   “一般情况下都是建议每个数据中心都有域控” -------这个域控是主域控?(每个站点都要一个主域控?)

       2>  " 是的,仲裁模式中的大多数投票者只是指DAG成员和见证服务器,不包括域控。但如果有域控被作为见证服务器了,那也算是投票者。"    -------------标准默认安装设置的主域控也算见证服务器?

        我们现在的部署:上海一个主域控,一个辅域控,一个exchange 2019成员服务器,香港一个exchange 2019成员服务器

        现在网络通信都正常,把上海一台辅域控关掉、一台exchange 2019成员服务器关掉,只剩下上海一台主域控,香港一台exchange 2019成员服务器,这个DAG符合大多数吗? 事实是邮箱域名指向香港的exchange成员服务器,这个邮箱系统一样可以正常工作。



    • 已标记为答案 xuyueming 2020年11月6日 3:25
    • 已编辑 xuyueming 2020年11月9日 5:35
    2020年11月6日 3:25

全部回复

  • 您好,

    您的意思是您的DAG只有两个成员服务器,并且是跨站点的是吗?

    见证服务器在哪个站点?

    出现问题的被动副本是在哪个站点的服务器上?该服务器上有其他活动副本或被动副本吗?请查看下其他副本是否有问题。

    在您提供的信息中,“An error occurred while communicating with server 'xxxxxx'”里提到的服务器是另外一个DAG成员吗?

    请您检查下两站点之间的网络是否有问题,确保DAG成员和见证服务器之间可以正常通信。请您检查下DAG用于复制的端口是否正常工作。默认情况下,DAG使用端口64327进行复制:

    Get-DatabaseAvailabilityGroup -Identity <DAG name> |fl Identity, ReplicationPort

    重启Microsoft Exchange Replication服务。尝试删除并重新添加副本,如果在添加副本过程中有报错,您可以上传报错截图并覆盖个人信息:

    Remove-MailboxDatabaseCopy -Identity DBname\servername -Confirm:$False Add-MailboxDatabaseCopy -Identity DBname -MailboxServer servername

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年10月5日 8:08
    版主
  • 请问以上信息对您是否有帮助?如果您对此问题有任何疑问或需要进一步的帮助,请随时回复。

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年10月8日 9:20
    版主
  • 您好,

        有两个exchange邮箱系统,分别是@AAA.com  @BBB.hk,他们的主域控、辅域控,及一台exchange server 2019成员服务器都在上海,他们的另一个exchange server 2019成员服务器在香港,见证服务器在辅域控服务器上。

        @AAA.com出问题的被动数据库副本在香港(另一个好的活动数据库副本在上海),@BBB.hk出问题的被动数据库副本在上海(另一个好的活动数据库副本在香港)。

        64327 端口都是可以telnet通的,只是两个exchange成员服务器分别在上海和香港两个站点



    另,问一下,如果删除一个数据库副本会影响exchange邮箱收发邮件吗?他们的见证者安装在辅域控服务器上




    2020年10月9日 5:22
  • 请检查下两站点之间的网络连接是否有问题。

    只要活动数据库副本是正常工作的,删除被动副本不会影响邮箱收发邮件。

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年10月12日 8:30
    版主
  • 您好,

    关于这个DAG副本问题最近有什么进展吗?

    如果您对此问题有任何疑问或需要进一步的帮助,请随时回复。

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年10月16日 7:07
    版主
  • 您好,

        exchange server 2019 两个数据中心的2个3成员DAG集群,在每个数据中心都要有一个域控服务器吗(至少要有一个辅域控服务器吗)?

        DAG集群成员要符合大多数指的是exchange 成员服务器及见证服务器?不包括域控服务器?

        比如某站点数据中心符合大多数的,exchange才能提供服务,不符合大多数的站点数据中心的exchange服务都会挂掉?

    2020年10月22日 2:41
  • 1、一般情况下都是建议每个数据中心都有域控。

    2、 是的,仲裁模式中的大多数投票者只是指DAG成员和见证服务器,不包括域控。但如果有域控被作为见证服务器了,那也算是投票者。

    DAG成员数n是偶数时,至少n/2+1个投票者(成员服务器和见证服务器)能正常工作和相互通信,DAG才能正常工作;

    DAG成员数n是奇数时,至少(n+1)/2个DAG成员服务器要能正常工作和相互通信。

    具体介绍可查看:数据库可用性组仲裁模式,但是机器翻译会有不通顺的地方,您可以查看英文原文:Database availability group quorum models

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    • 已标记为答案 xuyueming 2020年10月26日 1:26
    2020年10月22日 6:34
    版主
  • 很高兴上面的回复对您有帮助,下面对这个DAG副本问题就行简单的总结。

    问题:

    上海有一个主域控服务器、一个辅域控服务器,一个exchange server 2019成员服务器,香港有一个exchange server 2019成员服务器构成有三个数据库的DAG集群

    现在发现其中有一个数据库被动失败,且无法恢复及更新,报错日志日下:

    “The Microsoft Exchange Replication service encountered an error while inspecting the logs and database for Mailbox Database  xxxx\xxxxxx on startup. Error: Log repair failed: An error occurred while communicating with server 'xxxxxx'. Error: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond xxxxxxx

    建议:

    请您检查下两站点之间的网络是否有问题,确保DAG成员和见证服务器之间可以正常通信。

    重启Microsoft Exchange Replication服务。尝试删除并重新添加副本。

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年10月26日 7:59
    版主
  • 您好,

        确认是我们的网络问题导致的,另外关于您之前的回复,我有以下疑问:

       1>   “一般情况下都是建议每个数据中心都有域控” -------这个域控是主域控?(每个站点都要一个主域控?)

       2>  " 是的,仲裁模式中的大多数投票者只是指DAG成员和见证服务器,不包括域控。但如果有域控被作为见证服务器了,那也算是投票者。"    -------------标准默认安装设置的主域控也算见证服务器?

        我们现在的部署:上海一个主域控,一个辅域控,一个exchange 2019成员服务器,香港一个exchange 2019成员服务器

        现在网络通信都正常,把上海一台辅域控关掉、一台exchange 2019成员服务器关掉,只剩下上海一台主域控,香港一台exchange 2019成员服务器,这个DAG符合大多数吗? 事实是邮箱域名指向香港的exchange成员服务器,这个邮箱系统一样可以正常工作。



    • 已标记为答案 xuyueming 2020年11月6日 3:25
    • 已编辑 xuyueming 2020年11月9日 5:35
    2020年11月6日 3:25
  • 您好,

        在吗?能否回复我以上的问题?谢谢

    2020年11月16日 7:04
  • 1> 辅域控就行,不是一定要有主域控。

    2> 见证服务器是创建DAG时手动设置的。您没有设置主域控为见证服务器,那它就不是见证服务器。

    您说的邮箱系统可以正常工作是指什么,是数据库能正常装载而且邮箱能正常收发邮件?

    有给DAG设置备用见证服务器吗?您可以使用下面的命令查看下:

    Get-DatabaseAvailabilityGroup -status|fl Name,servers,Witnessserver,WitnessDirectory,Alternate* Get-DatabaseAvailabilityGroupNetwork | ft Identity,Subnets,Interfaces -Autosize

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年11月16日 8:50
    版主
  • 您好,

        1> 每个数据中心都可以有一个主域控?一个主域控就是一个邮箱域名,那我两个数据中心就不能使用一个域名邮箱系统了?

        2> 使用您以上提供的命令,我们系统里没有备用见证服务器。那为什么在只有一个主域控、一个exchange成员服务器的情况下邮箱数据库可以正常装载,也能正常收发邮件?

    2020年11月17日 2:38
  • 您好,

        您能回复下我的问题吗?

    2020年11月18日 5:35
  • 是不是见证服务器和域控没有什么关系。DAG能不能正常工作就看你DAG成员是不是大多数在线。你能提供具体的架构图吗?可以Get-DatabaseAvailabilityGroup |fl 提供结果来分析一下,注意遮盖自己信息。

    Jayce Yang

    2020年11月18日 8:08
  • 1> 一般情况下主域控是指同时有FSMO五大角色的域控,这样的话,一个域就一个主域控,没办法让两个数据中心都有主域控。

    2> 考虑到目前这个问题和刚开始的副本问题联系不是很大,建议您重新提问,专门讨论下关于DAG成员的问题,同时您也可以给出上面命令的输出结果,或其他DAG设置信息,并注意隐藏个人信息。

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年11月18日 8:54
    版主
  • 您好,

        我是DAG仲裁失败,数据库自动卸载后,手动active装载,然后在一个主域控、一个exchange成员服务器的情况下邮箱正常提供服务的

        这是正常的是吗?(必须手动装载数据库才能继续提供服务)


    2020年11月18日 8:59
  • 根据您的情况,DAG不满足大多数成员在线时,确实是需要手动装载数据库,但是需要进行数据中心切换。具体步骤:Datacenter switchovers(英文原文)/ 数据中心切换

    请问您是从EAC直接装载数据库的,还是也有进行数据中心切换?

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年11月19日 6:53
    版主
  • 您好,

        1> 直接在exchange服务器的命令行里active装载的

        2> 然后邮箱域名从上海的数据中心的公网IP指向香港的数据中心的公网IP,之后邮箱业务正常了

        就是一个主域控、一个exchange成员服务器,在没有符合大多数的情况下依靠手工命令重新将一个运行中的exchange服务器的数据库active装载后,又正常提供服务了

        我要确认的就是没有符合大多数的情况,它也能正常提供服务,是这样的吧?



    2020年11月19日 8:55
  • 您好,

        您能回复下我的问题吗?

    2020年11月23日 2:21
  • 根据个人经验,DAG必须符合大多数的情况才能正常提供服务。

    您现在是还能复现这个情况吗?能的话检查下DAG的设置并上传运行结果,我们具体研究下这种情况下的相关设置。同时请注意覆盖IP域名等个人信息:

    Get-DatabaseAvailabilityGroup -status|fl Get-ClusterNetworkInterface | ft -AutoSize

    Get-DatabaseAvailabilityGroupNetwork | ft Identity,Subnets,Interfaces -Autosize

    此致,

    Lydia Zhou


    如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.

    2020年11月23日 8:48
    版主
  • 您好,

        目前业务不能中断测试,但事实的确是这样。

        上海有一个主域控running,一个辅域控关闭,一个 exchange server 2019成员服务器关闭,香港有一个exchange server 2019成员服务器running(但是由于上海的这个exchange server 2019关闭导致香港这台服务器的数据库mount false)

        将香港这台exchange server 2019成员服务器运行这个命令:Start-DatabaseAvailabilityGroup -Identity XXXXXX -MailboxServer XXXXXX 后这个服务器的数据库mount True了,并将域名指向香港的这台exchange服务器后正常提供邮箱服务了

        您的意思是,由于没有符合DAG大多数,香港这台exchange server 2019成员服务器是无法mount True的?





    2020年11月24日 2:19