关于bomblab

This article was last updated on <span id="expire-date"></span> days ago, the information described in the article may be outdated.

今天看了csapp的第三章，打算做做bomblab。之前在课上，教授其实或多或少都讲过关于bomblab的介绍，我在之前也看过别人的弹幕，据说很难。因此也做好了心理准备。但是没想到这么难。

万事开头难

在csapp网站上下载到了提供自学的lab，然后放到我的wsl里。显然，我已经忘记了tar命令的操作了，一番查找。输入:

tar -xvf bomb.tar
bomb/
bomb/bomb
bomb/bomb.c
bomb/README
cd bomb/

终于进入了实验室,得到了bomb文件夹下的三个文件。hooray!

打开README.

This is an x86-64 bomb for self-study students.

在这里我得不到什么帮助，只能打开bomb.c文件，试图找到一点头绪。但是，里面似乎只是一长段奇怪的代码，以及莫名其妙的DR.EVIL的故事。

/***********************************************************
 * Dr. Evil's Insidious Bomb, Version 1.1
 * Copyright 2011, Dr. Evil Incorporated. All rights reserved.
 *
 * LICENSE:
 *
 * Dr. Evil Incorporated (the PERPETRATOR) hereby grants you (the
 * VICTIM) explicit permission to use this bomb (the BOMB).  This is a
 * time limited license, which expires on the death of the VICTIM.
 * The PERPETRATOR takes no responsibility for damage, frustration,
 * insanity, bug-eyes, carpal-tunnel syndrome, loss of sleep, or other
 * harm to the VICTIM.  Unless the PERPETRATOR wants to take credit,
 * that is.  The VICTIM may not distribute this bomb source code to
 * any enemies of the PERPETRATOR.  No VICTIM may debug,
 * reverse-engineer, run "strings" on, decompile, decrypt, or use any
 * other technique to gain knowledge of and defuse the BOMB.  BOMB
 * proof clothing may not be worn when handling this program.  The
 * PERPETRATOR will not apologize for the PERPETRATOR's poor sense of
 * humor.  This license is null and void where the BOMB is prohibited
 * by law.
 ***********************************************************/

最后只能百度，一番查找过后，才知道原来还有Writeup。在里面，总算得到一点提示。

You can also run it under a debugger, watch what it does step by step, and use this information to defuse it. This is probably the fastest way of defusing it.

里面提到了gdb。自然，我去查找了一番gdb的使用方法，至此。终于可以开始解决bomblab了。

bomblab的解决过程

当然，像我这样的菜鸡，并不具备独自解决问题的能力。只能参考已有的博客。根据博客上的说法，我只需要用gdb的disas命令，反汇编第一阶段的代码就能得到线索，我当然遵从。其实看了眼bomb.c的源代码，里面有很明显的提示，但是我一开始没有意识到.

/* Hmm...  Six phases must be more secure than one phase! */
input = read_line();             /* Get input                   */
phase_1(input);                  /* Run the phase               */
phase_defused();                 /* Drat!  They figured it out!
      * Let me know how they did it. */
printf("Phase 1 defused. How about the next one?\n");

因此，为了解决问题，首先就是要解决phase_1()。

phase_1()

在windows terminal中用gdb打开bomb，然后用disas命令反汇编。

1
2
3

gdb bomb //打开bomb
--------------
(gdb) disas phase_1

得到如下的代码:

Dump of assembler code for function phase_1:
   0x0000000000400ee0 <+0>:     sub    $0x8,%rsp
   0x0000000000400ee4 <+4>:     mov    $0x402400,%esi
   0x0000000000400ee9 <+9>:     call   0x401338 <strings_not_equal>
   0x0000000000400eee <+14>:    test   %eax,%eax
   0x0000000000400ef0 <+16>:    je     0x400ef7 <phase_1+23>
   0x0000000000400ef2 <+18>:    call   0x40143a <explode_bomb>
   0x0000000000400ef7 <+23>:    add    $0x8,%rsp
   0x0000000000400efb <+27>:    ret
End of assembler dump.

让我们来分析分析。首先是第0行，我们知道%rsp是保存指向栈顶的指针的寄存器，而对他进行自减，就是为了给栈帧开辟0x8个字节的空间。第1行，将立即数0x402400保存到%esi中，然后调用了一个 <strings_not_equal>的方法。在第3行，test了%eax的内容，如果相等,则跳转到第6行，即出栈，返回，函数结束;如果不相等，则跳转到 <explode_bomb> ，显然就是炸弹爆炸了。我们知道，%eax是32位系统中的返回值，容易料想到是保存了<strings_not_equal>的返回值。自此，分析结束。
%esi中保存的是用于比较的参数，很可能就是要输入的字串.也就是立即数0x402400是字符串的首地址。于是用gdb命令查看.

1 2	(gdb) x 0x402400 0x402400: 0x64726f42

结果比较诡异，应该是输出了字符串首地址的指针地址。显然，我还是不懂gdb。一番查找，得到正确的x命令参数.

1 2	(gdb) x/s 0x402400 0x402400: "Border relations with Canada have never been better."

得到了phase_1()的答案。也就是:

Border relations with Canada have never been better.

phase_2()

接下去是phase_2()。有了之前打下的基础，phase_2()就不会那么没有头绪了。首先，依旧是使用命令disas phase_2。得到:

0x0000000000400efc <+0>:     push   %rbp
0x0000000000400efd <+1>:     push   %rbx
0x0000000000400efe <+2>:     sub    $0x28,%rsp
0x0000000000400f02 <+6>:     mov    %rsp,%rsi
0x0000000000400f05 <+9>:     call   0x40145c <read_six_numbers>
0x0000000000400f0a <+14>:    cmpl   $0x1,(%rsp)
0x0000000000400f0e <+18>:    je     0x400f30 <phase_2+52>
0x0000000000400f10 <+20>:    call   0x40143a <explode_bomb>
0x0000000000400f15 <+25>:    jmp    0x400f30 <phase_2+52>
0x0000000000400f17 <+27>:    mov    -0x4(%rbx),%eax
0x0000000000400f1a <+30>:    add    %eax,%eax
0x0000000000400f1c <+32>:    cmp    %eax,(%rbx)
0x0000000000400f1e <+34>:    je     0x400f25 <phase_2+41>
0x0000000000400f20 <+36>:    call   0x40143a <explode_bomb>
0x0000000000400f25 <+41>:    add    $0x4,%rbx
0x0000000000400f29 <+45>:    cmp    %rbp,%rbx
0x0000000000400f2c <+48>:    jne    0x400f17 <phase_2+27>
0x0000000000400f2e <+50>:    jmp    0x400f3c <phase_2+64>
0x0000000000400f30 <+52>:    lea    0x4(%rsp),%rbx
0x0000000000400f35 <+57>:    lea    0x18(%rsp),%rbp
0x0000000000400f3a <+62>:    jmp    0x400f17 <phase_2+27>
0x0000000000400f3c <+64>:    add    $0x28,%rsp
0x0000000000400f40 <+68>:    pop    %rbx
0x0000000000400f41 <+69>:    pop    %rbp
0x0000000000400f42 <+70>:    ret

这段显然比phase_1要长一些，但是分析的流程不会变.
首先是 push %rbp 和 push %rbx。这两个命令我不是很懂，大约就是压入了两个寄存器。后来一番查找，得到结论：

push %esi //将程序的入口地址压入栈中
push %ebx //将被调用者保存寄存器中的值压入栈中，以便在返回前可以恢复它们

总之，这两句对我们分析没有什么关联，继续看。sub $0x28,%rsp栈指针分配了0x28即40_d。然后就是将栈指针赋给%rsi。查书p120。可知%rsi用于函数的第二个参数.随后调用了<read_six_numbers>方法。让我们来看看这个方法。和phase_2类似，输入:disas read_six_numbers，得到如下代码：

0x000000000040145c <+0>:     sub    $0x18,%rsp
0x0000000000401460 <+4>:     mov    %rsi,%rdx
0x0000000000401463 <+7>:     lea    0x4(%rsi),%rcx
0x0000000000401467 <+11>:    lea    0x14(%rsi),%rax
0x000000000040146b <+15>:    mov    %rax,0x8(%rsp)
0x0000000000401470 <+20>:    lea    0x10(%rsi),%rax
0x0000000000401474 <+24>:    mov    %rax,(%rsp)
0x0000000000401478 <+28>:    lea    0xc(%rsi),%r9
0x000000000040147c <+32>:    lea    0x8(%rsi),%r8
0x0000000000401480 <+36>:    mov    $0x4025c3,%esi
0x0000000000401485 <+41>:    mov    $0x0,%eax
0x000000000040148a <+46>:    call   0x400bf0 <__isoc99_sscanf@plt>
0x000000000040148f <+51>:    cmp    $0x5,%eax
0x0000000000401492 <+54>:    jg     0x401499 <read_six_numbers+61>
0x0000000000401494 <+56>:    call   0x40143a <explode_bomb>
0x0000000000401499 <+61>:    add    $0x18,%rsp
0x000000000040149d <+65>:    ret

整个流程大约是：将栈指针赋给%rdx，将栈指针+0x4的值（内存地址）所指向的值赋给%rcx,将栈指针+0x14的值（内存地址）所指向的值赋给%rax，%rax是返回值。随后，将%rax的值（内存地址）赋值给*%rsp+0x8（内存地址）所指向的值。随后，将栈指针+0x10的值所指向的值赋给%rax。随后，将%rax的值赋给%rsp。……有点长，接下去的也是类似的操作。
不过，经过整理后，可以看出，这些代码把各个寄存器的值所指向的地址设置为栈指针* + 0，4，8，12，16，20。此刻应该有点感觉了。在调用sscanf之前，看到有将立即数$0x4025c3放到%esi中。根据之前的经验，可以通过x/s 0x4025c3来看它所指向的值。

1 2	(gdb) x/s 0x4025c3 0x4025c3: "%d %d %d %d %d %d"

因此，<read_six_numbers>方法显然正如他表示的，是读取六个数字。并且根据上文的格式，可知这个数字是整数。好，接下来让我们回到phase_2()中。

那么我们继续看下去。接下去执行的是 cmpl $0x1,(%rsp)和je 0x400f30 <phase_2+52>。显然，判断%rsp即栈指针内存指向的值是否为1，如果是，则跳转到+52行，不是，则炸弹爆炸。回想到<read_six_numbers>将读取到的数字分别存到栈指针+0、+4、+8、+12、+16、+20上去。因此，这段汇编代码告诉我们，输入的那六个数字中，第一个必须是0x1，即1_d。

接下去是lea 0x4(%rsp),%rbx和lea 0x18(%rsp),%rbp。将栈指针下移0x4的内存地址赋给%rbx，将栈指针下移0x18的内存地址赋给%rbp。然后，代码又跳回去。执行mov -0x4(%rbx),%eax、add %eax,%eax、cmp %eax,(%rbx)。即将栈指针指向的值赋给%eax，随后将%eax的值 * 2，比较%eax和%rbx的值。根据上文lea 0x4(%rsp),%rbx可知，%rbx存的是第二个数字。因此，这段代码就是将第一个数字和第二个数字进行比较，判断第二个数字是否为第一个数字的两倍。如果相等，则跳转执行 add $0x4,%rbx，cmp %rbp,%rbx，将%rbx继续下移0x4，随后与%rbx比较。根据之前的代码可知，%rbx存的是最后一个数字的地址。所以，如果不相等，继续下移，相等，则意味着遍历结束，函数结束。

至此，整个phase_2()的代码逻辑已经十分了然了。我们甚至可以用C写出类似逻辑的代码来：

int a[6];
read_six_numbers(a);				//得到六个数字.
if(a[0] != 1) explode_bomb();		//不为1，炸弹爆炸。
else {
	for(int i =1;i<6;i++){
		if(a[i] != 2*a[i-1]) 
			explode_bomb();			//后数不为两倍，炸弹爆炸。
	}
}

于是，我们可以得到数字序列：1 2 4 8 16 32。运行bomb。得到:

*hooray again!*接下去是第三个.

phase_3()

执行disas phase_3得到:

0x0000000000400f43 <+0>:     sub    $0x18,%rsp
0x0000000000400f47 <+4>:     lea    0xc(%rsp),%rcx
0x0000000000400f4c <+9>:     lea    0x8(%rsp),%rdx
0x0000000000400f51 <+14>:    mov    $0x4025cf,%esi
0x0000000000400f56 <+19>:    mov    $0x0,%eax
0x0000000000400f5b <+24>:    call   0x400bf0 <__isoc99_sscanf@plt>
0x0000000000400f60 <+29>:    cmp    $0x1,%eax
0x0000000000400f63 <+32>:    jg     0x400f6a <phase_3+39>
0x0000000000400f65 <+34>:    call   0x40143a <explode_bomb>
0x0000000000400f6a <+39>:    cmpl   $0x7,0x8(%rsp)
0x0000000000400f6f <+44>:    ja     0x400fad <phase_3+106>
0x0000000000400f71 <+46>:    mov    0x8(%rsp),%eax
0x0000000000400f75 <+50>:    jmp    *0x402470(,%rax,8)
0x0000000000400f7c <+57>:    mov    $0xcf,%eax
0x0000000000400f81 <+62>:    jmp    0x400fbe <phase_3+123>
0x0000000000400f83 <+64>:    mov    $0x2c3,%eax
0x0000000000400f88 <+69>:    jmp    0x400fbe <phase_3+123>
0x0000000000400f8a <+71>:    mov    $0x100,%eax
0x0000000000400f8f <+76>:    jmp    0x400fbe <phase_3+123>
0x0000000000400f91 <+78>:    mov    $0x185,%eax
0x0000000000400f96 <+83>:    jmp    0x400fbe <phase_3+123>
0x0000000000400f98 <+85>:    mov    $0xce,%eax
0x0000000000400f9d <+90>:    jmp    0x400fbe <phase_3+123>
0x0000000000400f9f <+92>:    mov    $0x2aa,%eax
0x0000000000400fa4 <+97>:    jmp    0x400fbe <phase_3+123>
0x0000000000400fa6 <+99>:    mov    $0x147,%eax
0x0000000000400fab <+104>:   jmp    0x400fbe <phase_3+123>
0x0000000000400fad <+106>:   call   0x40143a <explode_bomb>
0x0000000000400fb2 <+111>:   mov    $0x0,%eax
0x0000000000400fb7 <+116>:   jmp    0x400fbe <phase_3+123>
0x0000000000400fb9 <+118>:   mov    $0x137,%eax
0x0000000000400fbe <+123>:   cmp    0xc(%rsp),%eax
0x0000000000400fc2 <+127>:   je     0x400fc9 <phase_3+134>
0x0000000000400fc4 <+129>:   call   0x40143a <explode_bomb>
0x0000000000400fc9 <+134>:   add    $0x18,%rsp
0x0000000000400fcd <+138>:   ret

随着实验进程的推进，我们的经验越来越丰富了，当然，问题的难度应该也逐渐递增。从汇编代码的长度也可以看出来这一点。老样子，先分析一波汇编代码。

首先将%rcx赋值为%rsp+0xc的内存地址、%rdx赋值为%rsp+0x8的内存地址。随后，将立即数0x4025cf赋值给%esi。随后执行输入方法。显然老样子，输入x/s 0x4025cf看看格式。
0x4025cf: "%d %d".看来这次的输入是两个整数。cmp $0x1,%eax的目的是判断输入是否成功，失败则炸弹爆炸。而cmpl $0x7,0x8(%rsp)则是判断原%rdx指向的内存地址是否大于7.观察后续代码可知，如果大于，则炸弹爆炸。看来第一个数字应该小于7。随后的代码mov 0x8(%rsp),%eax则是给%eax赋值（输入的第一个数字）。以上逻辑可以用这张图片来表示：

接下去看到了奇怪的代码：jmp *0x402470(,%rax,8)。于是，让我们来手动算算。假设我输入的第一个数字是0，那么%rax的值也是0.接下去就只需要看看*0x402470的值是什么.

后记

其实后来继续看书，发现这句话实际上就是很典型的switch()语句，后面的也是典型的跳转表结构，当时没有认出来。

1 2	(gdb) print *(0x402470) $1 = 4198268

可以看到是一个奇怪的数字。我到这里就卡住了。后来看了别人的解释，才发现原来需要转换成十六进制。于是：

1 2	(gdb) print/x *(0x402470) $4 = 0x400f7c

这个数字就比较眼熟了。

1 2	0x0000000000400f81 <+62>: jmp 0x400fbe <phase_3+123> 0x0000000000400f7c <+57>: mov $0xcf,%eax

原来如此，合理推断，剩下的汇编代码中，几个类似结构就是对应不同的输入跳转到不同的代码。目前已知，当x1=0时，x2应该是0xcf，即207_d。剩下的只是类似的操作而已，不赘。

测试一波。

$ ./bomb
Welcome to my fiendish little bomb. You have 6 phases with
which to blow yourself up. Have a nice day!
Border relations with Canada have never been better.
Phase 1 defused. How about the next one?
1 2 4 8 16 32
That's number 2.  Keep going!
0 207
Halfway there!

phase_3()完成，对我来说，比前两个要容易不少。接下去是phase_4。

phase_4()

仍然是老三套，得到phase_4()的反汇编代码：

0x000000000040100c <+0>:     sub    $0x18,%rsp
0x0000000000401010 <+4>:     lea    0xc(%rsp),%rcx
0x0000000000401015 <+9>:     lea    0x8(%rsp),%rdx
0x000000000040101a <+14>:    mov    $0x4025cf,%esi
0x000000000040101f <+19>:    mov    $0x0,%eax
0x0000000000401024 <+24>:    call   0x400bf0 <__isoc99_sscanf@plt>
0x0000000000401029 <+29>:    cmp    $0x2,%eax
0x000000000040102c <+32>:    jne    0x401035 <phase_4+41>
0x000000000040102e <+34>:    cmpl   $0xe,0x8(%rsp)
0x0000000000401033 <+39>:    jbe    0x40103a <phase_4+46>
0x0000000000401035 <+41>:    call   0x40143a <explode_bomb>
0x000000000040103a <+46>:    mov    $0xe,%edx
0x000000000040103f <+51>:    mov    $0x0,%esi
0x0000000000401044 <+56>:    mov    0x8(%rsp),%edi
0x0000000000401048 <+60>:    call   0x400fce <func4>
0x000000000040104d <+65>:    test   %eax,%eax
0x000000000040104f <+67>:    jne    0x401058 <phase_4+76>
0x0000000000401051 <+69>:    cmpl   $0x0,0xc(%rsp)
0x0000000000401056 <+74>:    je     0x40105d <phase_4+81>
0x0000000000401058 <+76>:    call   0x40143a <explode_bomb>
0x000000000040105d <+81>:    add    $0x18,%rsp
0x0000000000401061 <+85>:    ret

将%rcx指向%rsp即栈指针的+0xc位置，%rdx指向%rsp+0x8。随后将立即数0x4025cf赋值给%esi。依旧是老套路了。看到0x4025cf的值是%d %d。这次又是输入两个整数,和phase_3几乎一模一样。

cmpl $0xe,0x8(%rsp) 将0xe与第一个数字进行比较。若第一个数字>0xe，则炸弹爆炸。否则，则跳转执行mov $0xe,%edx将0xe赋值给%edx.$0x0,%esi 将0赋值给%esi。mov 0x8(%rsp),%edi将第一个输入的数赋值给%edi。根据寄存器的设定，可知前三个参数被设置为：第一个输入的数、0x0、0xe。随后，执行func4()。让我们看看。得到：

0x0000000000400fce <+0>:     sub    $0x8,%rsp
0x0000000000400fd2 <+4>:     mov    %edx,%eax
0x0000000000400fd4 <+6>:     sub    %esi,%eax
0x0000000000400fd6 <+8>:     mov    %eax,%ecx
0x0000000000400fd8 <+10>:    shr    $0x1f,%ecx
0x0000000000400fdb <+13>:    add    %ecx,%eax
0x0000000000400fdd <+15>:    sar    %eax
0x0000000000400fdf <+17>:    lea    (%rax,%rsi,1),%ecx
0x0000000000400fe2 <+20>:    cmp    %edi,%ecx
0x0000000000400fe4 <+22>:    jle    0x400ff2 <func4+36>
0x0000000000400fe6 <+24>:    lea    -0x1(%rcx),%edx
0x0000000000400fe9 <+27>:    call   0x400fce <func4>
0x0000000000400fee <+32>:    add    %eax,%eax
0x0000000000400ff0 <+34>:    jmp    0x401007 <func4+57>
0x0000000000400ff2 <+36>:    mov    $0x0,%eax
0x0000000000400ff7 <+41>:    cmp    %edi,%ecx
0x0000000000400ff9 <+43>:    jge    0x401007 <func4+57>
0x0000000000400ffb <+45>:    lea    0x1(%rcx),%esi
0x0000000000400ffe <+48>:    call   0x400fce <func4>
0x0000000000401003 <+53>:    lea    0x1(%rax,%rax,1),%eax
0x0000000000401007 <+57>:    add    $0x8,%rsp
0x000000000040100b <+61>:    ret

这个函数就不细说了，大致逻辑是。用第三个参数减去第二个参数，将结果存到%ecx中，将其算数右移0x1f，即右移31_d ，再把右移的结果%eax中。随后再对%eax进行逻辑右移。这样得到的似乎是最大的整数。然后，将加上%rsi（值为0x0），设为%ecx的值。再比较%edi和%ecx，也就是第一个输入的值和最大整数进行比较。如果小于等于，则跳转执行，将%eax设为0.比较edi输入的值。这一段把我绕晕了，看了别人的解析，原来这段逻辑可以写成下面的代码：

def func(a, c, d):
    b = d < c ? (d+c+1)/2 : (d+c)/2
    if b < a:
        return func(a, b+d, d)*2 + 1
    else if b > a:
        return func(a, c, b-1)*2
    else:
        return 0

看来我的汇编代码阅读能力还需要提高啊。总之，知道了func4()，我们就很容易解出答案了。d1 = 7，d2 =0.

phase_5()

phase_5()的汇编代码如下：

0x0000000000401062 <+0>:     push   %rbx
0x0000000000401063 <+1>:     sub    $0x20,%rsp
0x0000000000401067 <+5>:     mov    %rdi,%rbx
0x000000000040106a <+8>:     mov    %fs:0x28,%rax
0x0000000000401073 <+17>:    mov    %rax,0x18(%rsp)
0x0000000000401078 <+22>:    xor    %eax,%eax
0x000000000040107a <+24>:    call   0x40131b <string_length>
0x000000000040107f <+29>:    cmp    $0x6,%eax
0x0000000000401082 <+32>:    je     0x4010d2 <phase_5+112>
0x0000000000401084 <+34>:    call   0x40143a <explode_bomb>
0x0000000000401089 <+39>:    jmp    0x4010d2 <phase_5+112>
0x000000000040108b <+41>:    movzbl (%rbx,%rax,1),%ecx
0x000000000040108f <+45>:    mov    %cl,(%rsp)
0x0000000000401092 <+48>:    mov    (%rsp),%rdx
0x0000000000401096 <+52>:    and    $0xf,%edx
0x0000000000401099 <+55>:    movzbl 0x4024b0(%rdx),%edx
0x00000000004010a0 <+62>:    mov    %dl,0x10(%rsp,%rax,1)
0x00000000004010a4 <+66>:    add    $0x1,%rax
0x00000000004010a8 <+70>:    cmp    $0x6,%rax
0x00000000004010ac <+74>:    jne    0x40108b <phase_5+41>
0x00000000004010ae <+76>:    movb   $0x0,0x16(%rsp)
0x00000000004010b3 <+81>:    mov    $0x40245e,%esi
0x00000000004010b8 <+86>:    lea    0x10(%rsp),%rdi
0x00000000004010bd <+91>:    call   0x401338 <strings_not_equal>
0x00000000004010c2 <+96>:    test   %eax,%eax
0x00000000004010c4 <+98>:    je     0x4010d9 <phase_5+119>
0x00000000004010c6 <+100>:   call   0x40143a <explode_bomb>
0x00000000004010cb <+105>:   nopl   0x0(%rax,%rax,1)
0x00000000004010d0 <+110>:   jmp    0x4010d9 <phase_5+119>
0x00000000004010d2 <+112>:   mov    $0x0,%eax
0x00000000004010d7 <+117>:   jmp    0x40108b <phase_5+41>
0x00000000004010d9 <+119>:   mov    0x18(%rsp),%rax
0x00000000004010de <+124>:   xor    %fs:0x28,%rax
0x00000000004010e7 <+133>:   je     0x4010ee <phase_5+140>
0x00000000004010e9 <+135>:   call   0x400b30 <__stack_chk_fail@plt>
0x00000000004010ee <+140>:   add    $0x20,%rsp
0x00000000004010f2 <+144>:   pop    %rbx
0x00000000004010f3 <+145>:   ret

大致分析一波。前面大约是一系列保存操作，随后调用<string_length>，可见判断的是字符串的长度是否为0x6.然后再把返回值清零，跳回+41；可以看出，下面是一个循环。随后，将栈底指向的内存地址赋值给%ecx。随后将%cl的值赋值给栈指针%rsp；再将%cl的值所指向的值赋值给%rdx。再用0xf对%edx做与运算。

这里需要稍微留意一下。%edx共有32位，那么0xf可写成：0000 0000 0000 0000 0000 0000 0000 1111_b。显然，这个与运算就是将%eax保存的值，除了低四位外，全部清零。随后进行的操作是将经过与运算之后的%rdx的值再加上偏移0x4024b0，复制到%edx当中。让我们先来看看0x4024b0里是什么东西。

1 2	(gdb) x/s 0x4024b0 0x4024b0 <array.3449>: "maduiersnfotvbylSo you think you can stop the bomb with ctrl-c, do you?"

嗯。。。前面的几个字母maduiersnfotvbyl共16个，很容易联想到之前取低四位的操作。接下去，又把%dl的值赋给栈指针的后16个内存地址，再将返回值自增，随后比较返回值和6的大小，如果小于，则继续循环。可见，这个循环要进行六次，和之前输入的六个字符能够对上，很好理解。如果等于6，则将栈指针后24位内存地址赋值为0，将立即数0x40245e赋值给%esi，再将%rdi赋值位栈指针后16位的值。随后调用<strings_not_equal>方法。如果相等，则phase_5()结束。分析结束！hooray!!

那么我们只需要来看看0x40245e指向的字符串是什么就可以知道答案了.

1 2	(gdb) x/s 0x40245e 0x40245e: "flyers"

得到flyers。也就是说，之前得到的maduiersnfotvbyl，再结合我们输入的六个字符，其低四位当作偏移，输出的结果应该依次为flyers。找找各自对应的位置。得到1001(9)、1111(15)、1110(14)、0101(5)、0110(6)、0111(7)，即我们输入的六个字符的低四位应该是这些。简单点，直接搜索ascii的二进制码。得到)/.%Fg，尝试一下，可以，剩下的是最后一个.

QQ截图20210804173456

phase_6()

phase_6()的汇编代码长得一页都放不下了。

phase_6()的汇编代码

   0x00000000004010f4 <+0>:     push   %r14
   0x00000000004010f6 <+2>:     push   %r13
   0x00000000004010f8 <+4>:     push   %r12
   0x00000000004010fa <+6>:     push   %rbp
   0x00000000004010fb <+7>:     push   %rbx
   0x00000000004010fc <+8>:     sub    $0x50,%rsp
   0x0000000000401100 <+12>:    mov    %rsp,%r13
   0x0000000000401103 <+15>:    mov    %rsp,%rsi
   0x0000000000401106 <+18>:    call   0x40145c <read_six_numbers>
   0x000000000040110b <+23>:    mov    %rsp,%r14
   0x000000000040110e <+26>:    mov    $0x0,%r12d
   0x0000000000401114 <+32>:    mov    %r13,%rbp
   0x0000000000401117 <+35>:    mov    0x0(%r13),%eax
   0x000000000040111b <+39>:    sub    $0x1,%eax
   0x000000000040111e <+42>:    cmp    $0x5,%eax
   0x0000000000401121 <+45>:    jbe    0x401128 <phase_6+52>
   0x0000000000401123 <+47>:    call   0x40143a <explode_bomb>
   0x0000000000401128 <+52>:    add    $0x1,%r12d
   0x000000000040112c <+56>:    cmp    $0x6,%r12d
   0x0000000000401130 <+60>:    je     0x401153 <phase_6+95>
   0x0000000000401132 <+62>:    mov    %r12d,%ebx
   0x0000000000401135 <+65>:    movslq %ebx,%rax
   0x0000000000401138 <+68>:    mov    (%rsp,%rax,4),%eax
   0x000000000040113b <+71>:    cmp    %eax,0x0(%rbp)
   0x000000000040113e <+74>:    jne    0x401145 <phase_6+81>
   0x0000000000401140 <+76>:    call   0x40143a <explode_bomb>
   0x0000000000401145 <+81>:    add    $0x1,%ebx
   0x0000000000401148 <+84>:    cmp    $0x5,%ebx
   0x000000000040114b <+87>:    jle    0x401135 <phase_6+65>
   0x000000000040114d <+89>:    add    $0x4,%r13
   0x0000000000401151 <+93>:    jmp    0x401114 <phase_6+32>
   0x0000000000401153 <+95>:    lea    0x18(%rsp),%rsi
   0x0000000000401158 <+100>:   mov    %r14,%rax
   0x000000000040115b <+103>:   mov    $0x7,%ecx
   0x0000000000401160 <+108>:   mov    %ecx,%edx
   0x0000000000401162 <+110>:   sub    (%rax),%edx
   0x0000000000401164 <+112>:   mov    %edx,(%rax)
   0x0000000000401166 <+114>:   add    $0x4,%rax
   0x000000000040116a <+118>:   cmp    %rsi,%rax
   0x000000000040116d <+121>:   jne    0x401160 <phase_6+108>
   0x000000000040116f <+123>:   mov    $0x0,%esi
   0x0000000000401174 <+128>:   jmp    0x401197 <phase_6+163>
   0x0000000000401176 <+130>:   mov    0x8(%rdx),%rdx
   0x000000000040117a <+134>:   add    $0x1,%eax
   0x000000000040117d <+137>:   cmp    %ecx,%eax
   0x000000000040117f <+139>:   jne    0x401176 <phase_6+130>
   0x0000000000401181 <+141>:   jmp    0x401188 <phase_6+148>
   0x0000000000401183 <+143>:   mov    $0x6032d0,%edx
   0x0000000000401188 <+148>:   mov    %rdx,0x20(%rsp,%rsi,2)
   0x000000000040118d <+153>:   add    $0x4,%rsi
   0x0000000000401191 <+157>:   cmp    $0x18,%rsi
   0x0000000000401195 <+161>:   je     0x4011ab <phase_6+183>
   0x0000000000401197 <+163>:   mov    (%rsp,%rsi,1),%ecx
--Type <RET> for more, q to quit, c to continue without paging--
   0x000000000040119a <+166>:   cmp    $0x1,%ecx
   0x000000000040119d <+169>:   jle    0x401183 <phase_6+143>
   0x000000000040119f <+171>:   mov    $0x1,%eax
   0x00000000004011a4 <+176>:   mov    $0x6032d0,%edx
   0x00000000004011a9 <+181>:   jmp    0x401176 <phase_6+130>
   0x00000000004011ab <+183>:   mov    0x20(%rsp),%rbx
   0x00000000004011b0 <+188>:   lea    0x28(%rsp),%rax
   0x00000000004011b5 <+193>:   lea    0x50(%rsp),%rsi
   0x00000000004011ba <+198>:   mov    %rbx,%rcx
   0x00000000004011bd <+201>:   mov    (%rax),%rdx
   0x00000000004011c0 <+204>:   mov    %rdx,0x8(%rcx)
   0x00000000004011c4 <+208>:   add    $0x8,%rax
   0x00000000004011c8 <+212>:   cmp    %rsi,%rax
   0x00000000004011cb <+215>:   je     0x4011d2 <phase_6+222>
   0x00000000004011cd <+217>:   mov    %rdx,%rcx
   0x00000000004011d0 <+220>:   jmp    0x4011bd <phase_6+201>
   0x00000000004011d2 <+222>:   movq   $0x0,0x8(%rdx)
   0x00000000004011da <+230>:   mov    $0x5,%ebp
   0x00000000004011df <+235>:   mov    0x8(%rbx),%rax
   0x00000000004011e3 <+239>:   mov    (%rax),%eax
   0x00000000004011e5 <+241>:   cmp    %eax,(%rbx)
   0x00000000004011e7 <+243>:   jge    0x4011ee <phase_6+250>
   0x00000000004011e9 <+245>:   call   0x40143a <explode_bomb>
   0x00000000004011ee <+250>:   mov    0x8(%rbx),%rbx
   0x00000000004011f2 <+254>:   sub    $0x1,%ebp
   0x00000000004011f5 <+257>:   jne    0x4011df <phase_6+235>
   0x00000000004011f7 <+259>:   add    $0x50,%rsp
   0x00000000004011fb <+263>:   pop    %rbx
   0x00000000004011fc <+264>:   pop    %rbp
   0x00000000004011fd <+265>:   pop    %r12
   0x00000000004011ff <+267>:   pop    %r13
   0x0000000000401201 <+269>:   pop    %r14
   0x0000000000401203 <+271>:   ret

不过分析起来依旧是老套路。首先压入了大量的寄存器，可以预见在接下来的代码中很可能会用到它们。然后又是<read_six_numbers>，读取六个数字。将返回值%eax设定为栈指针指向的内存…………本来是想继续写的，但是这个长度实在是让人绝望。我直接放弃了，看了别人的解析。

原来这么长一段汇编代码大约就做了如下的事情(图也是偷来的)：

这段代码表示了一个链表。并且我们知道了每个链表的值，因此只需要顺序输入答案5、6、1、4、3、2即可。

后记

大体写完了，尽管phase_6()我实际上并没有花多少时间做就放弃了（实在是太长了）。总的来说，这个bomb总体的难度是不低的，虽然在做了一两个后就有感觉，实际上的观感难度并不是特别大，但是每道题都有其巧思在，也很好的用到了课上的各种知识，如果真的让我独立完成，恐怕要多花十倍的时间才行。这套实验据说还有一个隐藏关卡，开启条件是在phase_4()的答案后面加上DREVIL。不过我对汇编实在是不感兴趣，做这套实验的目的也只是检验一下我之前学习的成果（看来成果很一般），因此也不打算做了。接下去我会继续看csapp，不过速度要加快了，毕竟我再也回不到大一大二了。没必要在这样基础的课程上花太多时间。

updated at 2023-05-09

# csapp # 汇编