none
在Windows server 2012 2r系统蓝屏重启 Probably caused by : ntkrnlmp.exe ( nt!KiFloatingErrorFault+16a ) RRS feed

  • 问题

  • 具体的dmp文件分析如下,能否帮我分析下是什么原因导致的?另外这是在物理机上搭建的虚拟机,一共并行搭建了三台,其中两台物理机CPU为32核,而故障服务器中的物理机CPU为24核,发生问题时物理机严重发热 ,以下是dmp文件分析:

    ************* Symbol Path validation summary **************
    Response                         Time (ms)     Location
    Deferred                                       SRV*d:\Symbols*http://msdl.microsoft.com/download/symbols
    Symbol search path is: SRV*d:\Symbols*http://msdl.microsoft.com/download/symbols
    Executable search path is: 
    Windows 8.1 Kernel Version 9600 MP (24 procs) Free x64
    Product: Server, suite: TerminalServer SingleUserTS
    Built by: 9600.18685.amd64fre.winblue_ltsb.170427-1704
    Machine Name:
    Kernel base = 0xfffff800`7c800000 PsLoadedModuleList = 0xfffff800`7cad3670
    Debug session time: Thu Jul 20 04:03:31.486 2017 (UTC + 8:00)
    System Uptime: 7 days 18:07:03.436
    Loading Kernel Symbols
    ...............................................................
    ................................................................
    .........
    Loading User Symbols

    Loading unloaded module list
    .....
    *******************************************************************************
    *                                                                             *
    *                        Bugcheck Analysis                                    *
    *                                                                             *
    *******************************************************************************

    Use !analyze -v to get detailed debugging information.

    BugCheck 7F, {10, 80050031, 406f8, fffff8007cf913b5}

    Probably caused by : ntkrnlmp.exe ( nt!KiFloatingErrorFault+16a )

    Followup:     MachineOwner
    ---------

    14: kd> !analyze -v
    *******************************************************************************
    *                                                                             *
    *                        Bugcheck Analysis                                    *
    *                                                                             *
    *******************************************************************************

    UNEXPECTED_KERNEL_MODE_TRAP (7f)
    This means a trap occurred in kernel mode, and it's a trap of a kind
    that the kernel isn't allowed to have/catch (bound trap) or that
    is always instant death (double fault).  The first number in the
    bugcheck params is the number of the trap (8 = double fault, etc)
    Consult an Intel x86 family manual to learn more about what these
    traps are. Here is a *portion* of those codes:
    If kv shows a taskGate
            use .tss on the part before the colon, then kv.
    Else if kv shows a trapframe
            use .trap on that value
    Else
            .trap on the appropriate frame will show where the trap was taken
            (on x86, this will be the ebp that goes with the procedure KiTrap)
    Endif
    kb will then show the corrected stack.
    Arguments:
    Arg1: 0000000000000010, EXCEPTION_NPX_ERROR
    Arg2: 0000000080050031
    Arg3: 00000000000406f8
    Arg4: fffff8007cf913b5

    Debugging Details:
    ------------------


    DUMP_CLASS: 1

    DUMP_QUALIFIER: 401

    BUILD_VERSION_STRING:  9600.18685.amd64fre.winblue_ltsb.170427-1704

    SYSTEM_MANUFACTURER:  VMware, Inc.

    VIRTUAL_MACHINE:  VMware

    SYSTEM_PRODUCT_NAME:  VMware Virtual Platform

    SYSTEM_VERSION:  None

    BIOS_VENDOR:  Phoenix Technologies LTD

    BIOS_VERSION:  6.00

    BIOS_DATE:  09/21/2015

    BASEBOARD_MANUFACTURER:  Intel Corporation

    BASEBOARD_PRODUCT:  440BX Desktop Reference Platform

    BASEBOARD_VERSION:  None

    DUMP_TYPE:  1

    BUGCHECK_P1: 10

    BUGCHECK_P2: 80050031

    BUGCHECK_P3: 406f8

    BUGCHECK_P4: fffff8007cf913b5

    BUGCHECK_STR:  0x7f_10

    CPU_COUNT: 18

    CPU_MHZ: 893

    CPU_VENDOR:  GenuineIntel

    CPU_FAMILY: 6

    CPU_MODEL: 4f

    CPU_STEPPING: 1

    CPU_MICROCODE: 6,4f,1,0 (F,M,S,R)  SIG: B00001F'00000000 (cache) B00001F'00000000 (init)

    DEFAULT_BUCKET_ID:  WIN8_DRIVER_FAULT

    PROCESS_NAME:  System

    CURRENT_IRQL:  0

    ANALYSIS_SESSION_HOST:  DESKTOP-QQTMCJ6

    ANALYSIS_SESSION_TIME:  08-16-2017 23:54:04.0942

    ANALYSIS_VERSION: 10.0.15063.468 amd64fre

    LAST_CONTROL_TRANSFER:  from fffff8007c959de9 to fffff8007c94e2a0

    STACK_TEXT:  
    ffffd000`20b5b608 fffff800`7c959de9 : 00000000`0000007f 00000000`00000010 00000000`80050031 00000000`000406f8 : nt!KeBugCheckEx
    ffffd000`20b5b610 fffff800`7c9588ea : 00000000`0000000a ffffd000`20b2d180 ffffd000`20b5b7e8 fffff800`7c8da59c : nt!KiBugCheckDispatch+0x69
    ffffd000`20b5b750 fffff800`7cf913b5 : fffffff6`00000018 fffff800`7c934582 00000000`00000001 00000000`00000000 : nt!KiFloatingErrorFault+0x16a
    ffffd000`20b5b8e0 fffff800`7c850b51 : ffffd000`20b2d180 00000000`00da7a64 ffffd000`20b5ba20 ffffe000`d8aefcc0 : hal!KeQueryPerformanceCounter+0x75
    ffffd000`20b5b920 fffff800`7c850516 : ffffd000`20b2d180 ffffd000`20b5bb4c ffffd000`20b5bb50 ffffd000`20b5bb58 : nt!PpmIdleExecuteTransition+0x481
    ffffd000`20b5bb10 fffff800`7c951dbc : ffffd000`20b2d180 ffffd000`20b2d180 ffffd000`20b397c0 00000000`01860149 : nt!PoIdle+0x2f6
    ffffd000`20b5bc60 00000000`00000000 : ffffd000`20b5c000 ffffd000`20b56000 00000000`00000000 00000000`00000000 : nt!KiIdleLoop+0x2c


    STACK_COMMAND:  kb

    THREAD_SHA1_HASH_MOD_FUNC:  207f243fd6f185e30443d98f1107661c4dc5ebad

    THREAD_SHA1_HASH_MOD_FUNC_OFFSET:  cf92311be8b79e48d69e76a46674f1be1f31528c

    THREAD_SHA1_HASH_MOD:  e2266a530ca7fbace00cfa9add8dc0ac4504d759

    FOLLOWUP_IP: 
    nt!KiFloatingErrorFault+16a
    fffff800`7c9588ea 90              nop

    FAULT_INSTR_CODE:  6666c390

    SYMBOL_STACK_INDEX:  2

    SYMBOL_NAME:  nt!KiFloatingErrorFault+16a

    FOLLOWUP_NAME:  MachineOwner

    MODULE_NAME: nt

    IMAGE_NAME:  ntkrnlmp.exe

    DEBUG_FLR_IMAGE_TIMESTAMP:  59029782

    BUCKET_ID_FUNC_OFFSET:  16a

    FAILURE_BUCKET_ID:  0x7f_10_nt!KiFloatingErrorFault

    BUCKET_ID:  0x7f_10_nt!KiFloatingErrorFault

    PRIMARY_PROBLEM_CLASS:  0x7f_10_nt!KiFloatingErrorFault

    TARGET_TIME:  2017-07-19T20:03:31.000Z

    OSBUILD:  9600

    OSSERVICEPACK:  0

    SERVICEPACK_NUMBER: 0

    OS_REVISION: 0

    SUITE_MASK:  272

    PRODUCT_TYPE:  3

    OSPLATFORM_TYPE:  x64

    OSNAME:  Windows 8.1

    OSEDITION:  Windows 8.1 Server TerminalServer SingleUserTS

    OS_LOCALE:  

    USER_LCID:  0

    OSBUILD_TIMESTAMP:  2017-04-28 09:14:42

    BUILDDATESTAMP_STR:  170427-1704

    BUILDLAB_STR:  winblue_ltsb

    BUILDOSVER_STR:  6.3.9600.18685.amd64fre.winblue_ltsb.170427-1704

    ANALYSIS_SESSION_ELAPSED_TIME:  5eb

    ANALYSIS_SOURCE:  KM

    FAILURE_ID_HASH_STRING:  km:0x7f_10_nt!kifloatingerrorfault

    FAILURE_ID_HASH:  {7ebb9791-0e36-02ab-f569-65078e12217f}

    Followup:     MachineOwner

    2017年8月16日 17:03

全部回复

  • Hi,

    >BugCheck 7F, {10, 80050031, 406f8, fffff8007cf913b5}
    Bug check 0x7F typically occurs after you install a faulty or mismatched hardware (especially memory) or if installed hardware fails.

    更多详细的可以参考 - Bug Check 0x7F: UNEXPECTED_KERNEL_MODE_TRAP:
    https://docs.microsoft.com/ZH-CN/windows-hardware/drivers/debugger/bug-check-0x7f--unexpected-kernel-mode-trap

    >Probably caused by : ntkrnlmp.exe ( nt!KiFloatingErrorFault+16a )
    ntkrnlmp.exe为Windows Server系统的进程文件,根据您的描述,出现蓝屏问题的是Windows Server 2012 R2 virtual OS,而对应的物理设备有发热严重等问题。

    需要和您确认以下情况:
    1. 该物理设备上是否还有其他虚拟机?是否有相同的问题发生呢?

    2. 是启用Hyper-V配置的虚拟机,还是其他虚拟化软件?

    3. 物理设备所安装的系统是什么版本?

    4. 问题发生之前是否有过更改操作?

    建议先打开对应的物理机,建议检查下资源(CPU, MEMORY, DISK等)的使用情况,如果是资源占用异常,可能会导致类似的情况。此外,如果物理设备是Windows Server系统,建议检查并且安装可用的Windows Update/Hotfix,这在一定程度上可以有效的解决一些已知问题,并且提高系统的性能。同时,建议检查并且升级硬件驱动到最新的适用版本,包括BIOS和Firmware。

    此外,如果还可以登录虚拟机的话,建议检查下Event Viewer,根据蓝屏的时间确认下是不是有相关的事件日志。

    Best Regards,
    Eve Wang

    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年8月17日 7:46
    版主
  • 感谢你的回复

    之前故障强制重启物理机和虚拟机才得以恢复,这台物理机是只有这一台虚拟机,独占整个资源;另外是启用VMware vSphere Client配置的版本,物理机是XEN;今天下午又发生故障了,可以确定没有进行人为操作。

    虚拟机中的日志分析发现并没有其他意外报错,监控系统中也没有任何报错,请问排查不出具体故障的情况下,重装系统并重新安装应用软件可以吗?

    再次感谢你的回复

    2017年8月17日 15:33
  • 另外您提供的链接我去看过,因为本人不太懂DUMP文件的具体分析,能否通过我上面的分析内容判断出是软件问题,还是硬件问题,或者如7F错误代码中列举的内核堆栈不足、CPU超频或者硬件不兼容等问题;

    我有疑惑的是如果硬件驱动问题如BIOS或者Firmware等,为什么在安装过程中没有出现问题,之后系统也没进行过任何更新,那这样会不会是在服务器上的应用软件导致这一故障呢?

    希望您能提出宝贵的建议,也感谢你付出的宝贵时间

    2017年8月17日 15:41
  • 您好,

    如果是硬件相关(硬件本身)导致的问题,重装并不能解决问题。如果是硬件驱动,软件或者系统方面的因素导致的问题,可以尝试重新安装。

    以上建议是根据dump文件的初步建议(根据bugcheck和probably caused by部分的字段)。对dump文件做进一步的分析,一般是可以找到问题原因,或者对问题做进一步的排查并缩减范围。

    详细或者进一步的dump文件分析已经超出了该论坛的支持范围,跟抱歉无法为您提供更加详尽的分析和解释。

    您可以通过电话联系微软的客户服务代表(Microsoft Customer Support and Services),联系Microsoft资深的技术支持人员为您做进一步的dump分析。

    全球客户服务电话号码:
    https://support.microsoft.com/zh-cn/help/13948/global-customer-service-phone-numbers

    系统或者软件的运行过程也会涉及调用/使用驱动/系统文件,不能确保文件已知处于初始状态。此外,一般会建议及时安装update/hotfix,这将有助于解决一些已知的问题(这些问题并不都是在安装初始出现,系统运行一段时间后也会出现)。

    Best Regards,
    Eve Wang

    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年8月23日 10:08
    版主
  • 您好!

    请问现在情况如何?

    如果您需要我们的继续协助,您可以随时在该帖下回复。

    Best Regards,
    Eve Wang

    Please remember to mark the replies as answers if they help.
    If you have feedback for TechNet Subscriber Support, contact tnmff@microsoft.com.

    2017年9月6日 9:43
    版主