none
如何排查Repadmin/replsum出现的错误 RRS feed

  • 问题

  • 在分支办公室的一台DC,DC1上运行Repadmin /rplsum与查看复制汇总,发现它和总部的DC复制异常,结果如下:

    Replication Summary Start Time: 2012-10-16 17:54:41
    Beginning data collection for replication summary, this may take awhile:

    Destination DC    largest delta    fails/total  %%  error

    HeadOfficeDC01         49d.09h:36m:53s    9 / 999    0  (1256) Can't retrieve message string 1256 (0x4e8), error 1815.

    这项好像是说总共999个复制数据中有9个复制失败,错误信息 1256和1815不知道是什么意思。另外我要如何往下排查,去解决这个问题呢。

    请大家帮帮忙,谢谢了。


    demo

    2012年10月16日 10:17

答案

  • 您好!

    根据您提供的日志判断发生此问题的原因可能是为DC在复制过程中,复制时间间隔已到,但数据复制还没进行完毕,此时又要进行下一次的复制,而每次复制的优先级决定了总是会继续复制上次没有复制完毕残留在repadmin queue里面的数据,这样就导致了其他的分区的信息一直得不到复制。

    希望您能提供以下信息:
    1. 您站点间和站点内的结构,是如何连接的
    2. 每个站点的bridge head如何配置的
    3. 同时您还可以在DC上运行 repadmin /queque来查看有那些未复制完的数据
    4. DC注册表中找到HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\NTDS\Diagnostics下的Replication Events,将其值该为3,来监视在复制过程中具体那些对象的复制出现了问题

    希望我的回答对您有所帮助,如果有什么不清楚的地方,请您告诉我。


    如果您对我们的论坛在线支持服务有任何的意见或建议,请通过邮件告诉我们。
    Description: Description: TechNet 论坛好帮手立刻免费下载  TechNet 论坛好帮手

    2012年10月17日 8:46
    版主
  • 您好!                         

    如果问题依然存在,我们建议您尝试以下步骤进行排错:

    1. 将所有台DC的主DNS服务器地址都指向PDC,察看解析是否正常。确保域名服务(DNS) 配置正确,正确的目录复制需要有正确的DNS 配置。

    2. 1DCPing另外一台DC的主机名和IP地址,察看是否能PING通,检查网络是否通畅。

    3. 使用w32tm命令,同步域内DC的时间,在命令提示符下输入:
    a. 单击开始,指向所有程序,指向附件,然后单击命令提示符。
    b. 键入 w32tm /resync,然后按 ENTER 键。

    13580警告是一个普通的NTFRS事件,如果13509事件被13508警告之后被记录,您可以安全的忽略该警告信息。我建议您做以下的测试,以便确定问题所在:

    1. DC1 Ping DC2 FQDN,测试是否能够Ping通。

    2. 请您在事件察看器的File Replication Service中检查是否有其他的错误信息,或者有信息提示在2DC经过多次连接后,最终完成了文件复制。

    您也可以在一台DC1上新建一个组策略,并在\domain\sysvol\domain\Policies\domain为您的域名)中发现一个新建的文件夹。等待几分钟后,如果您在DC2上的\domain\sysvol\domain\Policies\文件夹也发现了同样存放组策略的文件夹,说明DC之间的文件复制是正常的。


    希望我的回答对您有所帮助,如果有什么不清楚的地方,请您告诉我。


    如果您对我们的论坛在线支持服务有任何的意见或建议,请通过邮件告诉我们。
    Description: Description: TechNet 论坛好帮手立刻免费下载  TechNet 论坛好帮手

    2012年11月5日 8:36
    版主

全部回复

  • 您好!

    根据您提供的日志判断发生此问题的原因可能是为DC在复制过程中,复制时间间隔已到,但数据复制还没进行完毕,此时又要进行下一次的复制,而每次复制的优先级决定了总是会继续复制上次没有复制完毕残留在repadmin queue里面的数据,这样就导致了其他的分区的信息一直得不到复制。

    希望您能提供以下信息:
    1. 您站点间和站点内的结构,是如何连接的
    2. 每个站点的bridge head如何配置的
    3. 同时您还可以在DC上运行 repadmin /queque来查看有那些未复制完的数据
    4. DC注册表中找到HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\NTDS\Diagnostics下的Replication Events,将其值该为3,来监视在复制过程中具体那些对象的复制出现了问题

    希望我的回答对您有所帮助,如果有什么不清楚的地方,请您告诉我。


    如果您对我们的论坛在线支持服务有任何的意见或建议,请通过邮件告诉我们。
    Description: Description: TechNet 论坛好帮手立刻免费下载  TechNet 论坛好帮手

    2012年10月17日 8:46
    版主
  • 1. 目前环境中有三个站点,SiteA、SiteB和SiteC,他们都位于站点链接CNSite里面,复制频率60min,cost:10;(不方便写真实名称:)

    2. SiteA中包含2台DC,HeadOfficeDC01和HeadOfficeDC02,其中HeadOfficeDC01是bridgehead,连接方式是IP;

        SiteB中包含3台DC,DC1,DC2和DC3,其中DC1是bridgehead,连接方式是IP;

        SiteA中HeadOfficeDC01没有与DC1和DC2的<automatically generated>连接,和它们的连接是通过手动新建的。

                  HeadOfficeDC02仅有与CNIDCDC01的自动连接;

         SiteB中DC1有与CNIDCDC01的手动连接、DC2和DC3的自动连接;

    3. 在DC3上运行repadmin /queue HeadOfficeDC01 ,出现118项类似的队列信息。

       (有117项 NC DC=DomainDnsZones,DC=CONTOSO,DC=COM;

         有1项 NC DC=CONTOSO,DC=COM,还有这些项好像看不出具体出错的复制数据)

    Queue contains 118 items.
    36568] Enqueued 2012-10-17 17:17:12 at priority 90

        SYNC FROM SOURCE

        NC DC=CONTOSO,DC=COM

        DC SiteB\DC1

        DC object GUID 469f8f18-423e-44f3-b103-dbd8c43968d1

        DC transport addr 469f8f18-423e-44f3-b103-dbd8c43968d1._msdcs.CONTOSO.COM

        ASYNCHRONOUS_OPERATION WRITEABLE PERIODIC NEVER_NOTIFY

    4. 注册表键值已经添加,最新日志还没出来。但之前File Replication service日志出现过很多的NtFrs 13508警告日志,DirectorServices日志中出现过KCC 1311和1684错误日志。

    我要如何做才能清空或让它们复制完成。

    希望得到您的回复。

    谢谢!


    demo




    • 已编辑 TEERY GG 2012年10月17日 18:38
    2012年10月17日 9:36
  • 4.事件日志中

       File Replication Service没有错误日志,从昨天到现在就产生过两次NtFrs13508警告,最近的一次在昨天凌晨2:46分的时候。

       Directory Service没有产生错误或警告日志,但是日志量特别多上一分钟的日志都被下一分钟的日志覆盖了。

       System一直有大量的W32Time 22警告日志产生,这个应该可以忽略。因为组策略中有对网络服务器和网络客户端启用数字签名通信,它和Ntp Server在建立SSL连接的时候由于域中没有配置CA服务器所以才有了这个警告的(这样理解不知道对不对)。

    另外如何清空现有的队列,让他们开始重新初始化复制呢。

    还请Tom兄帮忙。


    demo




    • 已编辑 TEERY GG 2012年10月18日 6:43
    2012年10月18日 5:31
  • 您好!                         

    如果问题依然存在,我们建议您尝试以下步骤进行排错:

    1. 将所有台DC的主DNS服务器地址都指向PDC,察看解析是否正常。确保域名服务(DNS) 配置正确,正确的目录复制需要有正确的DNS 配置。

    2. 1DCPing另外一台DC的主机名和IP地址,察看是否能PING通,检查网络是否通畅。

    3. 使用w32tm命令,同步域内DC的时间,在命令提示符下输入:
    a. 单击开始,指向所有程序,指向附件,然后单击命令提示符。
    b. 键入 w32tm /resync,然后按 ENTER 键。

    13580警告是一个普通的NTFRS事件,如果13509事件被13508警告之后被记录,您可以安全的忽略该警告信息。我建议您做以下的测试,以便确定问题所在:

    1. DC1 Ping DC2 FQDN,测试是否能够Ping通。

    2. 请您在事件察看器的File Replication Service中检查是否有其他的错误信息,或者有信息提示在2DC经过多次连接后,最终完成了文件复制。

    您也可以在一台DC1上新建一个组策略,并在\domain\sysvol\domain\Policies\domain为您的域名)中发现一个新建的文件夹。等待几分钟后,如果您在DC2上的\domain\sysvol\domain\Policies\文件夹也发现了同样存放组策略的文件夹,说明DC之间的文件复制是正常的。


    希望我的回答对您有所帮助,如果有什么不清楚的地方,请您告诉我。


    如果您对我们的论坛在线支持服务有任何的意见或建议,请通过邮件告诉我们。
    Description: Description: TechNet 论坛好帮手立刻免费下载  TechNet 论坛好帮手

    2012年11月5日 8:36
    版主