none
windows Server 2008 R2 standard 云端服务器经常会自动重启

    问题

  • 我们在电信那边租用了几台云端的服务器,硬件以及平时运维都是电信负责,硬件出问题的可能性非常低,故现在出现了自动重启的问题,暂且认为是驱动或者是软件的问题,驱动都是电信方面安装,系统为windows Server 2008 R2 standard,也是电信方面安装的正版系统,调试器看到的基本信息供您参考,请帮我看下是什么原因导致的系统自动重启:

    PAGE_FAULT_IN_NONPAGED_AREA (50)
    Invalid system memory was referenced.  This cannot be protected by try-except,
    it must be protected by a Probe.  Typically the address is just plain bad or it
    is pointing at freed memory.
    Arguments:
    Arg1: fffff96000157995, memory referenced.
    Arg2: 0000000000000008, value 0 = read operation, 1 = write operation.
    Arg3: fffff96000157995, If non-zero, the instruction address which referenced the bad memory
        address.
    Arg4: 0000000000000007, (reserved)

    Debugging Details:
    ------------------


    READ_ADDRESS:  fffff96000157995 

    FAULTING_IP: 
    win32k!NtUserCallOneParam+29
    fffff960`00157995 c605ccd7210001  mov     byte ptr [win32k!gbValidateHandleForIL (fffff960`00375168)],1

    MM_INTERNAL_CODE:  7

    IMAGE_NAME:  win32k.sys

    DEBUG_FLR_IMAGE_TIMESTAMP:  581f53d9

    MODULE_NAME: win32k

    FAULTING_MODULE: fffff96000080000 win32k

    DEFAULT_BUCKET_ID:  WIN7_DRIVER_FAULT

    BUGCHECK_STR:  0x50

    PROCESS_NAME:  LogonUI.exe

    CURRENT_IRQL:  0

    ANALYSIS_VERSION: 6.3.9600.17237 (debuggers(dbg).140716-0327) x86fre

    TRAP_FRAME:  fffff880065b4920 -- (.trap 0xfffff880065b4920)
    NOTE: The trap frame does not contain all registers.
    Some register values may be zeroed or incorrect.
    rax=fffff900c1e488c0 rbx=0000000000000000 rcx=0000000000000000
    rdx=0000000000000002 rsi=0000000000000000 rdi=0000000000000000
    rip=fffff96000157995 rsp=fffff880065b4ab0 rbp=fffff880065b4b60
     r8=fffff8000161c000  r9=0000000000000000 r10=fffffffffffffffb
    r11=fffff8800205e101 r12=0000000000000000 r13=0000000000000000
    r14=0000000000000000 r15=0000000000000000
    iopl=0         nv up ei ng nz na po nc
    win32k!NtUserCallOneParam+0x29:
    fffff960`00157995 c605ccd7210001  mov     byte ptr [win32k!gbValidateHandleForIL (fffff960`00375168)],1 ds:fffff960`00375168=00
    Resetting default scope

    LAST_CONTROL_TRANSFER:  from fffff80001707c09 to fffff8000168c400

    FAILED_INSTRUCTION_ADDRESS: 
    win32k!NtUserCallOneParam+29
    fffff960`00157995 c605ccd7210001  mov     byte ptr [win32k!gbValidateHandleForIL (fffff960`00375168)],1

    STACK_TEXT:  
    fffff880`065b47b8 fffff800`01707c09 : 00000000`00000050 fffff960`00157995 00000000`00000008 fffff880`065b4920 : nt!KeBugCheckEx
    fffff880`065b47c0 fffff800`0168a52e : 00000000`00000008 fffff960`00157995 fffff880`065b4a00 00000000`000045ff : nt! ?? ::FNODOBFM::`string'+0x3a251
    fffff880`065b4920 fffff960`00157995 : 00000000`002c2288 00000000`0000000d 00000000`0130f5a0 00000000`00000000 : nt!KiPageFault+0x16e
    fffff880`065b4ab0 fffff800`0168b693 : fffffa80`0a287310 fffff880`065b4b60 00000000`00008002 00000000`00000020 : win32k!NtUserCallOneParam+0x29
    fffff880`065b4ae0 00000000`76d6a5ba : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiSystemServiceCopyEnd+0x13
    00000000`01bdf4b8 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0x76d6a5ba


    STACK_COMMAND:  kb

    FOLLOWUP_IP: 
    win32k!NtUserCallOneParam+29
    fffff960`00157995 c605ccd7210001  mov     byte ptr [win32k!gbValidateHandleForIL (fffff960`00375168)],1

    SYMBOL_STACK_INDEX:  3

    SYMBOL_NAME:  win32k!NtUserCallOneParam+29

    FOLLOWUP_NAME:  MachineOwner

    IMAGE_VERSION:  6.1.7601.23591

    FAILURE_BUCKET_ID:  X64_0x50_BAD_IP_win32k!NtUserCallOneParam+29

    BUCKET_ID:  X64_0x50_BAD_IP_win32k!NtUserCallOneParam+29

    ANALYSIS_SOURCE:  KM

    FAILURE_ID_HASH_STRING:  km:x64_0x50_bad_ip_win32k!ntusercalloneparam+29

    FAILURE_ID_HASH:  {f71202a9-b307-eb24-323b-2a410482cd19}

    2017年2月22日 2:50

全部回复

  • Hi

    根据提供的错误信息,可以判断导致问题的原因如下:

    1. 硬件故障,通常是内存故障导致
    2. 系统服务或者驱动故障
    3. 杀毒软件,或者NTFS卷损坏也会导致该问题

    建议执行以下步骤,以帮助排查故障:

    1. 查看系统日志,在对应的时间段,检查是否存在运行错误的服务或者驱动,并停止运行该服务或驱动。
    2. 运行Windows内存诊断工具,并在日志查看器中查看MemoryDiagnostics-Results,确认诊断结果,如果内存有故障,请替换内存条
    3. 停止运行杀毒软件,并查看问题是否会再次发生。
    4. 运行命令Chkdsk /f /r, 检测并修复磁盘错误。

    Best regards,
    Andy Liu

    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年2月22日 6:51
  • 您好,首先感谢您的回答。我这边按照您给的建议进行了操作。

    1.查看系统日志,在重启后,系统日志会记录一个错误事件一个关键事件,错误事件来源是EventLog,事件ID为6008,无任务类别,事件描述为“上一次系统的10:03:12在2017/2/21上的关闭是意外的”。关键事件来源是kernel-power,事件ID为41,任务类别为(63),事件描述为“系统在未首先正常关机的情况下重新启动。当系统停止响应、出现故障或意外断电时,会发生此错误”。

    因为我们的服务器是在电信云端租用的,电信那边配置有UPS,故出现意外断电的可能性非常小,而且即使出现问题,也应该是所有客户都出现问题,而我向电信那边咨询过了,只有我们的服务器有问题,故可以基本排除电源问题。所以应该是系统停止响应或者出现故障了。

    但是我们服务器重启的时间是无规律的,经常在凌晨两三点的时候重启,那个时候是没有人登录并进行操作的,服务器上也没有什么其他的软件,所以很奇怪。

    2.运行了内存诊断工具,结果是“windows内存诊断测试了计算机内存,没有检测到任何错误”。故排除内存本身的问题。

    3.我昨天将服务器上的杀毒软件直接卸载了,但今天还是出现了自动重启的情况。可能和杀毒软件关系不大。

    4.运行了chkdsk命令,现在系统重新启动过了。

    因为我们是在电信租用的云服务器,所以我们平时都是通过远程桌面连接来登录云服务器,我想请教一下:

    1.远程桌面连接对服务器会不会造成冲击导致服务器不稳定?

    2.之前那段代码指向的错误文件是win32k.sys,这个是系统文件,所以是不是windows 2008 server R2这个系统有问题?

    3.我之前也请教过其他IT人员,他们说那段代码的错误是“内存调用错误”,虽然服务器内存本身没问题,但是否有可能是服务器内存太小导致运行过程中的死机呢?

    2017年2月23日 2:54
  • Hi

    >>>1.远程桌面连接对服务器会不会造成冲击导致服务器不稳定?

    远程桌面不会对服务器造成冲击,导致其不稳定。

    >>> 2.之前那段代码指向的错误文件是win32k.sys,这个是系统文件,所以是不是windows 2008 server R2这个系统有问题?

    系统本身不会有问题,但是不排除是其它驱动程序与系统的兼容性问题

    >>> 3. 我之前也请教过其他IT人员,他们说那段代码的错误是“内存调用错误”,虽然服务器内存本身没问题,但是否有可能是服务器内存太小导致运行过程中的死机呢?

    内存太小有可能导致死机,但是目前的现象是意外关机导致系统自动重启,所以内存过小的可能性比较小,但是也不排除这种可能性,建议可以通过查看内存利用率来排查。

    这个服务器是从上线以来就有这样的问题,还是最近才发生的?如果是最近发生的话,是否安装了新的驱动,如显卡驱动等,另外,查看一下设备管理器中, 设备驱动是否都正常,有没有感叹号存在。

    Best regards,

    Andy Liu




    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年2月23日 8:05
  • 您好,感谢您的回答。

    1.我今天查看了一下设备管理器,并没有感叹号的存在,设备驱动应该全部正常。最近也没有安装什么新的驱动。

    2.服务器是开通后不久就出现问题,这个问题一直存在而且最近非常频繁,经常一天两次,且有一台服务器上的软件全部卸载空了,现在那台服务器上没有任何开通以后安装的软件,但是还是会自动重启,所以我这边是怀疑系统有问题。

    3.我们有三台云端的服务器,三台都出现过重启的问题,但是有一台自从某天重启过后一直到现在都没有问题,而且那台上面安装的软件是最多的,而另外两台安装的软件都比第一台少,但是重启的现象非但没有缓解反而愈演愈烈,所以非常非常奇怪,我这边一头雾水,完全搞不懂第一台为什么突然就好了,后两台为什么还一直会重启,三台服务器的系统和硬件配置是一模一样的,希望能有高手帮我解答一下,看看能找出什么线索。

    2017年2月24日 0:44
  • 我刚才看到了一个错误事件,事件来源是Bugcheck,事件ID是1001,事件描述是“计算机已经从检测错误后重新启动,检测错误:0x000000fc(0xfffff88001fed0b8,0x800000022d0e3963,0xfffff88005bed920,0x0000000000000002)。已将存储的数据保存至C:\Windows\MEMORY.DMP。报告ID:022317-21356-01。”

    一台服务器在昨天晚上21:48:21重启了,这个日志是21:50:02的,应该是重启以后记录了错误事件。

    请问这个事件描述的内容说的是啥?有指出具体的错误吗?

    2017年2月24日 1:34
  • Hi

    如果Windows Server 2008 R2是部署在虚拟机上面,并且是用VMWare虚拟机,建议将VMWare Tools删除后, 再看看问题是否还存在。

    另外,建议为Windows Server 2008 R2安装最新的Windows补丁程序。

    Best Regards,

    Andy Liu


    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年2月24日 5:21
  • 您好,我卸载VMWare Tools后远程桌面都连不上去了。。。。这个软件不能卸。

    windows系统自动更新我这边是关闭的,因为系统自动更新有时候会自动重启,我几乎把一切会导致系统自动重启的软件和服务都关闭了,但是系统在今天凌晨4:59分的时候还是重启了,完全找不到原因,我要崩溃了。

    2017年2月26日 6:55
  • 其中有一台服务器在开机的时候会提示kernelUpdate.exe已经停止工作。

    而且几台会重启的服务器的关键错误事件的来源也都是kernel-power,请问这是个什么程序或者文件?是因为这个文件导致系统重启的吗?

    2017年2月27日 8:28
  • Hi,

    建议你可以看一下VMWare相关的文档和论坛。

    https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2073791

    https://kb.vmware.com/selfservice/search.do?cmd=displayKC&docType=kc&docTypeID=DT_KB_1_1&externalId=1019064

    Best regards,

    Andy Liu


    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年2月28日 7:10