积极答复者
exchange server 2019 DAG 集群被动失败

问题
-
您好,
我方上海有一个主域控服务器、一个辅域控服务器,一个exchange server 2019成员服务器,香港有一个exchange server 2019成员服务器构成有三个数据库的DAG集群
现在发现其中有一个数据库被动失败,且无法恢复及更新,报错日志日下:
“The Microsoft Exchange Replication service encountered an error while inspecting the logs and database for Mailbox Database xxxx\xxxxxx on startup. Error: Log repair failed: An error occurred while communicating with server 'xxxxxx'. Error: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond xxxxxxx
答案
-
您好,
关于这个DAG副本问题最近有什么进展吗?
如果您对此问题有任何疑问或需要进一步的帮助,请随时回复。
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
- 已建议为答案 Lydia ZhouMicrosoft contingent staff, Moderator 2020年10月19日 8:41
- 已标记为答案 xuyueming 2020年10月22日 2:36
-
1、一般情况下都是建议每个数据中心都有域控。
2、 是的,仲裁模式中的大多数投票者只是指DAG成员和见证服务器,不包括域控。但如果有域控被作为见证服务器了,那也算是投票者。
DAG成员数n是偶数时,至少n/2+1个投票者(成员服务器和见证服务器)能正常工作和相互通信,DAG才能正常工作;
DAG成员数n是奇数时,至少(n+1)/2个DAG成员服务器要能正常工作和相互通信。
具体介绍可查看:数据库可用性组仲裁模式,但是机器翻译会有不通顺的地方,您可以查看英文原文:Database availability group quorum models。
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
- 已标记为答案 xuyueming 2020年10月26日 1:26
-
您好,
确认是我们的网络问题导致的,另外关于您之前的回复,我有以下疑问:
1> “一般情况下都是建议每个数据中心都有域控” -------这个域控是主域控?(每个站点都要一个主域控?)
2> " 是的,仲裁模式中的大多数投票者只是指DAG成员和见证服务器,不包括域控。但如果有域控被作为见证服务器了,那也算是投票者。" -------------标准默认安装设置的主域控也算见证服务器?
我们现在的部署:上海一个主域控,一个辅域控,一个exchange 2019成员服务器,香港一个exchange 2019成员服务器
现在网络通信都正常,把上海一台辅域控关掉、一台exchange 2019成员服务器关掉,只剩下上海一台主域控,香港一台exchange 2019成员服务器,这个DAG符合大多数吗? 事实是邮箱域名指向香港的exchange成员服务器,这个邮箱系统一样可以正常工作。
全部回复
-
您好,
您的意思是您的DAG只有两个成员服务器,并且是跨站点的是吗?
见证服务器在哪个站点?
出现问题的被动副本是在哪个站点的服务器上?该服务器上有其他活动副本或被动副本吗?请查看下其他副本是否有问题。
在您提供的信息中,“An error occurred while communicating with server 'xxxxxx'”里提到的服务器是另外一个DAG成员吗?
请您检查下两站点之间的网络是否有问题,确保DAG成员和见证服务器之间可以正常通信。请您检查下DAG用于复制的端口是否正常工作。默认情况下,DAG使用端口64327进行复制:
Get-DatabaseAvailabilityGroup -Identity <DAG name> |fl Identity, ReplicationPort
重启Microsoft Exchange Replication服务。尝试删除并重新添加副本,如果在添加副本过程中有报错,您可以上传报错截图并覆盖个人信息:
Remove-MailboxDatabaseCopy -Identity DBname\servername -Confirm:$False Add-MailboxDatabaseCopy -Identity DBname -MailboxServer servername
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
- 已建议为答案 Lydia ZhouMicrosoft contingent staff, Moderator 2020年10月7日 7:39
-
请问以上信息对您是否有帮助?如果您对此问题有任何疑问或需要进一步的帮助,请随时回复。
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
-
您好,
有两个exchange邮箱系统,分别是@AAA.com @BBB.hk,他们的主域控、辅域控,及一台exchange server 2019成员服务器都在上海,他们的另一个exchange server 2019成员服务器在香港,见证服务器在辅域控服务器上。
@AAA.com出问题的被动数据库副本在香港(另一个好的活动数据库副本在上海),@BBB.hk出问题的被动数据库副本在上海(另一个好的活动数据库副本在香港)。
64327 端口都是可以telnet通的,只是两个exchange成员服务器分别在上海和香港两个站点
另,问一下,如果删除一个数据库副本会影响exchange邮箱收发邮件吗?他们的见证者安装在辅域控服务器上
- 已编辑 xuyueming 2020年10月10日 9:09
-
请检查下两站点之间的网络连接是否有问题。
只要活动数据库副本是正常工作的,删除被动副本不会影响邮箱收发邮件。
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
- 已建议为答案 Lydia ZhouMicrosoft contingent staff, Moderator 2020年10月14日 7:56
-
您好,
关于这个DAG副本问题最近有什么进展吗?
如果您对此问题有任何疑问或需要进一步的帮助,请随时回复。
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
- 已建议为答案 Lydia ZhouMicrosoft contingent staff, Moderator 2020年10月19日 8:41
- 已标记为答案 xuyueming 2020年10月22日 2:36
-
1、一般情况下都是建议每个数据中心都有域控。
2、 是的,仲裁模式中的大多数投票者只是指DAG成员和见证服务器,不包括域控。但如果有域控被作为见证服务器了,那也算是投票者。
DAG成员数n是偶数时,至少n/2+1个投票者(成员服务器和见证服务器)能正常工作和相互通信,DAG才能正常工作;
DAG成员数n是奇数时,至少(n+1)/2个DAG成员服务器要能正常工作和相互通信。
具体介绍可查看:数据库可用性组仲裁模式,但是机器翻译会有不通顺的地方,您可以查看英文原文:Database availability group quorum models。
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
- 已标记为答案 xuyueming 2020年10月26日 1:26
-
很高兴上面的回复对您有帮助,下面对这个DAG副本问题就行简单的总结。
问题:
上海有一个主域控服务器、一个辅域控服务器,一个exchange server 2019成员服务器,香港有一个exchange server 2019成员服务器构成有三个数据库的DAG集群
现在发现其中有一个数据库被动失败,且无法恢复及更新,报错日志日下:
“The Microsoft Exchange Replication service encountered an error while inspecting the logs and database for Mailbox Database xxxx\xxxxxx on startup. Error: Log repair failed: An error occurred while communicating with server 'xxxxxx'. Error: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond xxxxxxx
建议:
请您检查下两站点之间的网络是否有问题,确保DAG成员和见证服务器之间可以正常通信。
重启Microsoft Exchange Replication服务。尝试删除并重新添加副本。
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
-
您好,
确认是我们的网络问题导致的,另外关于您之前的回复,我有以下疑问:
1> “一般情况下都是建议每个数据中心都有域控” -------这个域控是主域控?(每个站点都要一个主域控?)
2> " 是的,仲裁模式中的大多数投票者只是指DAG成员和见证服务器,不包括域控。但如果有域控被作为见证服务器了,那也算是投票者。" -------------标准默认安装设置的主域控也算见证服务器?
我们现在的部署:上海一个主域控,一个辅域控,一个exchange 2019成员服务器,香港一个exchange 2019成员服务器
现在网络通信都正常,把上海一台辅域控关掉、一台exchange 2019成员服务器关掉,只剩下上海一台主域控,香港一台exchange 2019成员服务器,这个DAG符合大多数吗? 事实是邮箱域名指向香港的exchange成员服务器,这个邮箱系统一样可以正常工作。
-
1> 辅域控就行,不是一定要有主域控。
2> 见证服务器是创建DAG时手动设置的。您没有设置主域控为见证服务器,那它就不是见证服务器。
您说的邮箱系统可以正常工作是指什么,是数据库能正常装载而且邮箱能正常收发邮件?
有给DAG设置备用见证服务器吗?您可以使用下面的命令查看下:
Get-DatabaseAvailabilityGroup -status|fl Name,servers,Witnessserver,WitnessDirectory,Alternate* Get-DatabaseAvailabilityGroupNetwork | ft Identity,Subnets,Interfaces -Autosize
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
-
1> 一般情况下主域控是指同时有FSMO五大角色的域控,这样的话,一个域就一个主域控,没办法让两个数据中心都有主域控。
2> 考虑到目前这个问题和刚开始的副本问题联系不是很大,建议您重新提问,专门讨论下关于DAG成员的问题,同时您也可以给出上面命令的输出结果,或其他DAG设置信息,并注意隐藏个人信息。
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
-
根据您的情况,DAG不满足大多数成员在线时,确实是需要手动装载数据库,但是需要进行数据中心切换。具体步骤:Datacenter switchovers(英文原文)/ 数据中心切换。
请问您是从EAC直接装载数据库的,还是也有进行数据中心切换?
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
-
根据个人经验,DAG必须符合大多数的情况才能正常提供服务。
您现在是还能复现这个情况吗?能的话检查下DAG的设置并上传运行结果,我们具体研究下这种情况下的相关设置。同时请注意覆盖IP域名等个人信息:
Get-DatabaseAvailabilityGroup -status|fl Get-ClusterNetworkInterface | ft -AutoSize
Get-DatabaseAvailabilityGroupNetwork | ft Identity,Subnets,Interfaces -Autosize
此致,
Lydia Zhou
如果以上回复对您有所帮助,建议您将其“标记为答复”. 如果您对我们的论坛支持有任何的建议,可以通过此邮箱联系我们:tnsf@microsoft.com.
-
您好,
目前业务不能中断测试,但事实的确是这样。
上海有一个主域控running,一个辅域控关闭,一个 exchange server 2019成员服务器关闭,香港有一个exchange server 2019成员服务器running(但是由于上海的这个exchange server 2019关闭导致香港这台服务器的数据库mount false)
将香港这台exchange server 2019成员服务器运行这个命令:Start-DatabaseAvailabilityGroup -Identity XXXXXX -MailboxServer XXXXXX 后这个服务器的数据库mount True了,并将域名指向香港的这台exchange服务器后正常提供邮箱服务了
您的意思是,由于没有符合DAG大多数,香港这台exchange server 2019成员服务器是无法mount True的?
- 已编辑 xuyueming 2020年11月24日 2:35