2015-11-26 2 views
4

Кажется, что двоичные файлы, созданные с gcc 4.9.2 на Linux (Ubuntu 15.04, 32-bit), содержат несколько тысяч неиспользуемых байтов между разделами .eh_frame и .init_array. Пример вывода из objdump -h для простого исполняемого файла:Почему между секциями ELF не используется пустое пространство?

Sections: 
Idx Name   Size  VMA  LMA  File off Algn 
[...] 
16 .eh_frame  000000c0 080484ac 080484ac 000004ac 2**2 
        CONTENTS, ALLOC, LOAD, READONLY, DATA 
17 .init_array 00000004 08049f08 08049f08 00000f08 2**2 
        CONTENTS, ALLOC, LOAD, DATA 
[...] 

.eh_frame заканчивается в файле смещения 0x56c но .init_array начинается в 0xf08 оставляя отверстие 0x99c = 2460 байт. Все остальные разделы начинаются сразу же после окончания предыдущего раздела.

Размер неиспользованного пространства варьируется, что затрудняет наблюдение за тем, как определенные изменения влияют на размер кода.

Откуда это отверстие? Есть ли способ избежать этого?

Update: Выход ld --verbose:

$ cat so.c 

int main() { 
    return 0; 
} 

$ gcc so.c -Wl,--verbose -o so 
GNU ld (GNU Binutils for Ubuntu) 2.25 
    Supported emulations: 
    elf_i386 
    i386linux 
    elf32_x86_64 
    elf_x86_64 
    elf_l1om 
    elf_k1om 
    i386pep 
    i386pe 
using internal linker script: 
================================================== 
/* Script for -z combreloc: combine and sort reloc sections */ 
/* Copyright (C) 2014 Free Software Foundation, Inc. 
    Copying and distribution of this script, with or without modification, 
    are permitted in any medium without royalty provided the copyright 
    notice and this notice are preserved. */ 
OUTPUT_FORMAT("elf32-i386", "elf32-i386", 
       "elf32-i386") 
OUTPUT_ARCH(i386) 
ENTRY(_start) 
SEARCH_DIR("=/usr/i686-linux-gnu/lib32"); SEARCH_DIR("=/usr/local/lib32"); SEARCH_DIR("=/lib32"); SEARCH_DIR("=/usr/lib32"); SEARCH_DIR("=/usr/i686-linux-gnu/lib"); SEARCH_DIR("=/usr/local/lib/i386-linux-gnu"); SEARCH_DIR("=/usr/local/lib"); SEARCH_DIR("=/lib/i386-linux-gnu"); SEARCH_DIR("=/lib"); SEARCH_DIR("=/usr/lib/i386-linux-gnu"); SEARCH_DIR("=/usr/lib"); 
SECTIONS 
{ 
    /* Read-only sections, merged into text segment: */ 
    PROVIDE (__executable_start = SEGMENT_START("text-segment", 0x08048000)); . = SEGMENT_START("text-segment", 0x08048000) + SIZEOF_HEADERS; 
    .interp   : { *(.interp) } 
    .note.gnu.build-id : { *(.note.gnu.build-id) } 
    .hash   : { *(.hash) } 
    .gnu.hash  : { *(.gnu.hash) } 
    .dynsym   : { *(.dynsym) } 
    .dynstr   : { *(.dynstr) } 
    .gnu.version : { *(.gnu.version) } 
    .gnu.version_d : { *(.gnu.version_d) } 
    .gnu.version_r : { *(.gnu.version_r) } 
    .rel.dyn  : 
    { 
     *(.rel.init) 
     *(.rel.text .rel.text.* .rel.gnu.linkonce.t.*) 
     *(.rel.fini) 
     *(.rel.rodata .rel.rodata.* .rel.gnu.linkonce.r.*) 
     *(.rel.data.rel.ro .rel.data.rel.ro.* .rel.gnu.linkonce.d.rel.ro.*) 
     *(.rel.data .rel.data.* .rel.gnu.linkonce.d.*) 
     *(.rel.tdata .rel.tdata.* .rel.gnu.linkonce.td.*) 
     *(.rel.tbss .rel.tbss.* .rel.gnu.linkonce.tb.*) 
     *(.rel.ctors) 
     *(.rel.dtors) 
     *(.rel.got) 
     *(.rel.bss .rel.bss.* .rel.gnu.linkonce.b.*) 
     *(.rel.ifunc) 
    } 
    .rel.plt  : 
    { 
     *(.rel.plt) 
     PROVIDE_HIDDEN (__rel_iplt_start = .); 
     *(.rel.iplt) 
     PROVIDE_HIDDEN (__rel_iplt_end = .); 
    } 
    .init   : 
    { 
    KEEP (*(SORT_NONE(.init))) 
    } 
    .plt   : { *(.plt) *(.iplt) } 
    .text   : 
    { 
    *(.text.unlikely .text.*_unlikely .text.unlikely.*) 
    *(.text.exit .text.exit.*) 
    *(.text.startup .text.startup.*) 
    *(.text.hot .text.hot.*) 
    *(.text .stub .text.* .gnu.linkonce.t.*) 
    /* .gnu.warning sections are handled specially by elf32.em. */ 
    *(.gnu.warning) 
    } 
    .fini   : 
    { 
    KEEP (*(SORT_NONE(.fini))) 
    } 
    PROVIDE (__etext = .); 
    PROVIDE (_etext = .); 
    PROVIDE (etext = .); 
    .rodata   : { *(.rodata .rodata.* .gnu.linkonce.r.*) } 
    .rodata1  : { *(.rodata1) } 
    .eh_frame_hdr : { *(.eh_frame_hdr) } 
    .eh_frame  : ONLY_IF_RO { KEEP (*(.eh_frame)) } 
    .gcc_except_table : ONLY_IF_RO { *(.gcc_except_table 
    .gcc_except_table.*) } 
    /* These sections are generated by the Sun/Oracle C++ compiler. */ 
    .exception_ranges : ONLY_IF_RO { *(.exception_ranges 
    .exception_ranges*) } 
    /* Adjust the address for the data segment. We want to adjust up to 
    the same address within the page on the next page up. */ 
    . = ALIGN (CONSTANT (MAXPAGESIZE)) - ((CONSTANT (MAXPAGESIZE) - .) & (CONSTANT (MAXPAGESIZE) - 1)); . = DATA_SEGMENT_ALIGN (CONSTANT (MAXPAGESIZE), CONSTANT (COMMONPAGESIZE)); 
    /* Exception handling */ 
    .eh_frame  : ONLY_IF_RW { KEEP (*(.eh_frame)) } 
    .gcc_except_table : ONLY_IF_RW { *(.gcc_except_table .gcc_except_table.*) } 
    .exception_ranges : ONLY_IF_RW { *(.exception_ranges .exception_ranges*) } 
    /* Thread Local Storage sections */ 
    .tdata   : { *(.tdata .tdata.* .gnu.linkonce.td.*) } 
    .tbss   : { *(.tbss .tbss.* .gnu.linkonce.tb.*) *(.tcommon) } 
    .preinit_array  : 
    { 
    PROVIDE_HIDDEN (__preinit_array_start = .); 
    KEEP (*(.preinit_array)) 
    PROVIDE_HIDDEN (__preinit_array_end = .); 
    } 
    .init_array  : 
    { 
    PROVIDE_HIDDEN (__init_array_start = .); 
    KEEP (*(SORT_BY_INIT_PRIORITY(.init_array.*) SORT_BY_INIT_PRIORITY(.ctors.*))) 
    KEEP (*(.init_array EXCLUDE_FILE (*crtbegin.o *crtbegin?.o *crtend.o *crtend?.o) .ctors)) 
    PROVIDE_HIDDEN (__init_array_end = .); 
    } 
    .fini_array  : 
    { 
    PROVIDE_HIDDEN (__fini_array_start = .); 
    KEEP (*(SORT_BY_INIT_PRIORITY(.fini_array.*) SORT_BY_INIT_PRIORITY(.dtors.*))) 
    KEEP (*(.fini_array EXCLUDE_FILE (*crtbegin.o *crtbegin?.o *crtend.o *crtend?.o) .dtors)) 
    PROVIDE_HIDDEN (__fini_array_end = .); 
    } 
    .ctors   : 
    { 
    /* gcc uses crtbegin.o to find the start of 
     the constructors, so we make sure it is 
     first. Because this is a wildcard, it 
     doesn't matter if the user does not 
     actually link against crtbegin.o; the 
     linker won't look for a file to match a 
     wildcard. The wildcard also means that it 
     doesn't matter which directory crtbegin.o 
     is in. */ 
    KEEP (*crtbegin.o(.ctors)) 
    KEEP (*crtbegin?.o(.ctors)) 
    /* We don't want to include the .ctor section from 
     the crtend.o file until after the sorted ctors. 
     The .ctor section from the crtend file contains the 
     end of ctors marker and it must be last */ 
    KEEP (*(EXCLUDE_FILE (*crtend.o *crtend?.o) .ctors)) 
    KEEP (*(SORT(.ctors.*))) 
    KEEP (*(.ctors)) 
    } 
    .dtors   : 
    { 
    KEEP (*crtbegin.o(.dtors)) 
    KEEP (*crtbegin?.o(.dtors)) 
    KEEP (*(EXCLUDE_FILE (*crtend.o *crtend?.o) .dtors)) 
    KEEP (*(SORT(.dtors.*))) 
    KEEP (*(.dtors)) 
    } 
    .jcr   : { KEEP (*(.jcr)) } 
    .data.rel.ro : { *(.data.rel.ro.local* .gnu.linkonce.d.rel.ro.local.*) *(.data.rel.ro .data.rel.ro.* .gnu.linkonce.d.rel.ro.*) } 
    .dynamic  : { *(.dynamic) } 
    .got   : { *(.got) *(.igot) } 
    . = DATA_SEGMENT_RELRO_END (SIZEOF (.got.plt) >= 12 ? 12 : 0, .); 
    .got.plt  : { *(.got.plt) *(.igot.plt) } 
    .data   : 
    { 
    *(.data .data.* .gnu.linkonce.d.*) 
    SORT(CONSTRUCTORS) 
    } 
    .data1   : { *(.data1) } 
    _edata = .; PROVIDE (edata = .); 
    . = .; 
    __bss_start = .; 
    .bss   : 
    { 
    *(.dynbss) 
    *(.bss .bss.* .gnu.linkonce.b.*) 
    *(COMMON) 
    /* Align here to ensure that the .bss section occupies space up to 
     _end. Align after .bss to ensure correct alignment even if the 
     .bss section disappears because there are no input sections. 
     FIXME: Why do we need it? When there is no .bss section, we don't 
     pad the .data section. */ 
    . = ALIGN(. != 0 ? 32/8 : 1); 
    } 
    . = ALIGN(32/8); 
    . = SEGMENT_START("ldata-segment", .); 
    . = ALIGN(32/8); 
    _end = .; PROVIDE (end = .); 
    . = DATA_SEGMENT_END (.); 
    /* Stabs debugging sections. */ 
    .stab   0 : { *(.stab) } 
    .stabstr  0 : { *(.stabstr) } 
    .stab.excl  0 : { *(.stab.excl) } 
    .stab.exclstr 0 : { *(.stab.exclstr) } 
    .stab.index 0 : { *(.stab.index) } 
    .stab.indexstr 0 : { *(.stab.indexstr) } 
    .comment  0 : { *(.comment) } 
    /* DWARF debug sections. 
    Symbols in the DWARF debugging sections are relative to the beginning 
    of the section so we begin them at 0. */ 
    /* DWARF 1 */ 
    .debug   0 : { *(.debug) } 
    .line   0 : { *(.line) } 
    /* GNU DWARF 1 extensions */ 
    .debug_srcinfo 0 : { *(.debug_srcinfo) } 
    .debug_sfnames 0 : { *(.debug_sfnames) } 
    /* DWARF 1.1 and DWARF 2 */ 
    .debug_aranges 0 : { *(.debug_aranges) } 
    .debug_pubnames 0 : { *(.debug_pubnames) } 
    /* DWARF 2 */ 
    .debug_info  0 : { *(.debug_info .gnu.linkonce.wi.*) } 
    .debug_abbrev 0 : { *(.debug_abbrev) } 
    .debug_line  0 : { *(.debug_line .debug_line.* .debug_line_end) } 
    .debug_frame 0 : { *(.debug_frame) } 
    .debug_str  0 : { *(.debug_str) } 
    .debug_loc  0 : { *(.debug_loc) } 
    .debug_macinfo 0 : { *(.debug_macinfo) } 
    /* SGI/MIPS DWARF 2 extensions */ 
    .debug_weaknames 0 : { *(.debug_weaknames) } 
    .debug_funcnames 0 : { *(.debug_funcnames) } 
    .debug_typenames 0 : { *(.debug_typenames) } 
    .debug_varnames 0 : { *(.debug_varnames) } 
    /* DWARF 3 */ 
    .debug_pubtypes 0 : { *(.debug_pubtypes) } 
    .debug_ranges 0 : { *(.debug_ranges) } 
    /* DWARF Extension. */ 
    .debug_macro 0 : { *(.debug_macro) } 
    .gnu.attributes 0 : { KEEP (*(.gnu.attributes)) } 
    /DISCARD/ : { *(.note.GNU-stack) *(.gnu_debuglink) *(.gnu.lto_*) } 
} 


================================================== 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/../../../i386-linux-gnu/crt1.o succeeded 
/usr/lib/gcc/i686-linux-gnu/4.9/../../../i386-linux-gnu/crt1.o 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/../../../i386-linux-gnu/crti.o succeeded 
/usr/lib/gcc/i686-linux-gnu/4.9/../../../i386-linux-gnu/crti.o 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/crtbegin.o succeeded 
/usr/lib/gcc/i686-linux-gnu/4.9/crtbegin.o 
attempt to open /tmp/ccQ0fTTK.o succeeded 
/tmp/ccQ0fTTK.o 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/libgcc.so failed 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/libgcc.a succeeded 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/libgcc_s.so succeeded 
-lgcc_s (/usr/lib/gcc/i686-linux-gnu/4.9/libgcc_s.so) 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/libc.so failed 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/libc.a failed 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/../../../i386-linux-gnu/libc.so succeeded 
opened script file /usr/lib/gcc/i686-linux-gnu/4.9/../../../i386-linux-gnu/libc.so 
opened script file /usr/lib/gcc/i686-linux-gnu/4.9/../../../i386-linux-gnu/libc.so 
attempt to open /lib/i386-linux-gnu/libc.so.6 succeeded 
/lib/i386-linux-gnu/libc.so.6 
attempt to open /usr/lib/i386-linux-gnu/libc_nonshared.a succeeded 
(/usr/lib/i386-linux-gnu/libc_nonshared.a)elf-init.oS 
attempt to open /lib/i386-linux-gnu/ld-linux.so.2 succeeded 
/lib/i386-linux-gnu/ld-linux.so.2 
/lib/i386-linux-gnu/ld-linux.so.2 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/libgcc.so failed 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/libgcc.a succeeded 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/libgcc_s.so succeeded 
-lgcc_s (/usr/lib/gcc/i686-linux-gnu/4.9/libgcc_s.so) 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/crtend.o succeeded 
/usr/lib/gcc/i686-linux-gnu/4.9/crtend.o 
attempt to open /usr/lib/gcc/i686-linux-gnu/4.9/../../../i386-linux-gnu/crtn.o succeeded 
/usr/lib/gcc/i686-linux-gnu/4.9/../../../i386-linux-gnu/crtn.o 
ld-linux.so.2 needed by /lib/i386-linux-gnu/libc.so.6 
found ld-linux.so.2 at /lib/i386-linux-gnu/ld-linux.so.2 
+0

Вывод 'ld --verbose'? Обратите внимание, что '.eh_frame' является' READONLY', а '.init_array' - нет. '.init_array', вероятно, позиционируется так, что перестановки, которые могут быть исправлены при загрузке, могут позже быть отмечены только для чтения, см. http://unix.stackexchange.com/questions/8062/dtors-looks-writable-but-attempts -to-write-segfault – ninjalj

+0

@ninjalj См. редактирование. – nwellnhof

ответ

3

Есть три области памяти, чтобы рассмотреть здесь:

  • только для чтения данных.
  • Нелатные перестановки, которые можно зафиксировать во время загрузки.
  • Данные.

Теперь раздел .eh_frame обозначен READONLY, поэтому он переходит в первый раздел.

.init_array - это массив указателей на функции инициализации, которые могут быть разрешены к их абсолютным адресам при загрузке программы/библиотеки, а затем помечены только для чтения (запись указателей на функции - это распространенный способ использования уязвимостей) поэтому он переходит во второй регион.

Соответствующие части сценария линкера являются:

[...] 
.eh_frame  : ONLY_IF_RO { KEEP (*(.eh_frame)) } 
[...] 
/* Adjust the address for the data segment. We want to adjust up to 
    the same address within the page on the next page up. */ 
. = ALIGN (CONSTANT (MAXPAGESIZE)) - ((CONSTANT (MAXPAGESIZE) - .) & (CONSTANT (MAXPAGESIZE) - 1)); 
. = DATA_SEGMENT_ALIGN (CONSTANT (MAXPAGESIZE), CONSTANT (COMMONPAGESIZE)); 
[...] 
.init_array  : 
[...] 
.got   : { *(.got) *(.igot) } 
. = DATA_SEGMENT_RELRO_END (SIZEOF (.got.plt) >= 12 ? 12 : 0, .); 
.got.plt  : { *(.got.plt) *(.igot.plt) } 
.data   : 
[...] 
. = DATA_SEGMENT_END (.); 

Вы можете обратиться к документации для встроенных функций для GNU л.д. компоновщика скриптов на https://sourceware.org/binutils/docs/ld/Builtin-Functions.html. Но будьте осторожны, что документация DATA_SEGMENT_ALIGN неверна, о чем сообщил Стивен Келл в binutils bug #19203: "DATA_SEGMENT_ALIGN documentation is not consistent with behaviour", по-видимому, сЯкуба Джелинка. DATA_SEGMENT_ALIGN сам был представлен в списке рассылки binutils под названием [RFC PATCH] Smarter aligning of data segment.

Каким-то образом, следующее:

. = ALIGN (CONSTANT (MAXPAGESIZE)) - ((CONSTANT (MAXPAGESIZE) - .) & (CONSTANT (MAXPAGESIZE) - 1)); 
. = DATA_SEGMENT_ALIGN (CONSTANT (MAXPAGESIZE), CONSTANT (COMMONPAGESIZE)); 

вызывает 1-страничный скачок, который в вашем примере двигаться бы вас от 0x0804856c к 0x0804956c.

Когда опция линкера -z relro используются, запрашивая переезды устроились во время загрузки будет отмечен только для чтения, DATA_SEGMENT_RELRO_END вызывает предыдущий DATA_SEGMENT_ALIGN добавить достаточно отступов, чтобы вызвать сумму два аргументов DATA_SEGMENT_RELRO_END быть выровнен к новая страница.

Итак, если у .got.plt есть как минимум три указателя, то первые три указателя (которые сразу используются загрузчиком) будут находиться во второй области, а остальная часть .got.plt на третьем.

Прокладка, добавленная DATA_SEGMENT_ALIGN, перемещает вас от 0x0804956c до 0x08049f08. Когда все, что может быть защищено только для чтения после исцеления, вы будете на 0x0804a000, на новой странице, которая будет храниться в режиме чтения-записи.

+1

Теперь вы согласны с тем, что они совпадают с «тем же адресом на странице на следующей странице вверх», а не только на следующей странице в 0x08049000? Это значит, что в адресах меньше изменений? – viraptor

+2

@viraptor: только угадывание, но я думаю, что это сделано таким образом, чтобы не переходить на следующую «страницу» на образ файла, при этом «смещения» по-прежнему соответствуют файлу и памяти. – ninjalj

+0

Это имеет смысл, спасибо. – viraptor

Смежные вопросы