动态链接器(九):.init和.init_array

ELF文件中的.init和.init_array段是程序初始化阶段的重要组成部分,用于在main函数执行前完成必要的初始化操作。

1 .init段和.init_array 段

1.1 作用

.init段包含编译器生成的初始化代码,通常由运行时环境(如C标准库的启动例程)直接调用。这些代码负责执行基础的初始化任务,例如设置全局异常处理、初始化堆栈或准备程序运行环境。

.init_array是一个函数指针数组,存储了所有需要在main之前执行的初始化函数。这些函数通常由用户通过__attribute__((constructor))显式定义,或由编译器隐式生成(如C++全局对象的构造函数)。它支持多个初始化函数,按优先级顺序执行。GCC允许通过__attribute__((constructor(priority)))指定优先级(数值越小越早执行),链接器会按优先级合并到.init_array的子段(如.init_array.0、.init_array.1)中。

PS:在早期的ELF实现中,用户可以通过_init()函数定义初始化逻辑,但现代工具链更推荐使用.init_array。

1.2 执行

对于可执行程序,在程序入口(如_start)调用main函数之前,.init中的代码会首先执行,在.init段代码执行后,.init_array中的函数会按顺序依次执行。musl中的libc_start_init函数就是负责执行.init和.init_array中的代码的:

static void libc_start_init(void)
{_init();uintptr_t a = (uintptr_t)&__init_array_start;for (; a<(uintptr_t)&__init_array_end; a+=sizeof(void(*)()))(*(void (**)(void))a)();
}

注意这个_init()函数就是1.1中所说的用户定义的_init()函数,它是一个弱符号,如果用户没有定义_init()函数,它就会使用musl中的默认实现(一个空函数,什么也不做):

static void dummy(void) {}
weak_alias(dummy, _init);

当然不光可执行程序有这两个段,动态库中也有这两个段:

对于动态库,这两个段中的函数是由动态链接器进行调用的。在动态链接器完成对动态库的加载和重定位后,就会调用这两个段中的函数。


上面都是对单一的elf文件(动态库、可执行文件)来说,但通常来说elf文件都会有自己的依赖库,此时elf文件和其依赖库的初始化(即调用.init和.init_array中的函数,下文会多次使用初始化这个词语)顺序要满足拓扑排序(先调用依赖库的初始化函数,再调用自身的初始化函数),就像下面这个图所示(这是由动态链接器自主完成的,用户不需要操心):

具体细节可以参考:

https://refspecs.linuxfoundation.org/elf/elf.pdf

2 一个由Glibc的独家秘方导致的Bug

按照规范来说.init和.init_array中的函数是不需要传递参数的,但glibc做了扩展,它会向这些函数传递三个参数:argc,argv,envp。

PS:我猜测它这样做的目的是为了让动态库也能够直接使用argc,argv,不这样做的话动态库是没法直接拿到argc和argv的,除非导出一个函数,由可执行程序传递。(envp是可以拿到的,通过environ全局变量)。下面是glibc中执行.init和.init_array段中函数的代码,可以看到它传了这三个参数:

  ElfW(Dyn) *init_array = l->l_info[DT_INIT_ARRAY];if (init_array != NULL){unsigned int j;unsigned int jm;ElfW(Addr) *addrs;jm = l->l_info[DT_INIT_ARRAYSZ]->d_un.d_val / sizeof (ElfW(Addr));addrs = (ElfW(Addr) *) (init_array->d_un.d_ptr + l->l_addr);for (j = 0; j < jm; ++j)((dl_init_t) addrs[j]) (argc, argv, env);}

在我实现动态链接器时,我主要参考的是musl的代码,我并不知道glibc对初始化函数做了扩展,于是Bug就产生了。在gnu linux环境下Rust std会使用到glibc的这个扩展,这导致我的动态链接器加载的动态库使用std::env::args()函数时会出错。下面就是Rust std中使用到这个特性的地方:

/// glibc passes argc, argv, and envp to functions in .init_array, as a non-standard extension.
/// This allows `std::env::args` to work even in a `cdylib`, as it does on macOS and Windows.
#[cfg(all(target_os = "linux", target_env = "gnu"))]
#[used]
#[link_section = ".init_array.00099"]
static ARGV_INIT_ARRAY: extern "C" fn(crate::os::raw::c_int,*const *const u8,*const *const u8,
) = {extern "C" fn init_wrapper(argc: crate::os::raw::c_int,argv: *const *const u8,_envp: *const *const u8,) {unsafe {really_init(argc as isize, argv);}}init_wrapper
};

简单来说,Rust std会使用glibc的这个特性,在动态库初始化时设置几个全局变量,这几个全局变量中保存的就是argc,argv,envp的值。而我实现的动态链接器在调用初始化函数时不会传递这几个值,所以在动态链接器执行上面这段代码中的init_wrapper函数(它在.init_array中,是一个初始化函数)时,argc和argv传进来的都是垃圾值,而std::env::args()函数又会使用init_wrapper函数设置的全局变量,于是在被加载进来的动态库执行std::env::args()函数时,程序就崩溃了。

Bug发现和修复的细节可以看下面这个链接:

std::env::args seems to require billions of bytes · Issue #3 · weizhiao/dlopen-rs · GitHubHi, I'm playing around with your crate and I noticed that if you create a file that looks like this: #[unsafe(no_mangle)] fn test() { let args = std::env::args(); } and a file main.rs that looks like this: use dlopen_rs::{ElfLibrary, Ope...https://github.com/weizhiao/dlopen-rs/issues/3

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23988.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ollama微调

Ollama是一款开源工具&#xff0c;其目标是简化大语言模型在本地环境的部署和使用。它支持多种流行的开源大语言模型&#xff0c;如 Llama 2、Qwen2.5等。在上一篇文章中我们部署Ollama&#xff0c;并使用简单命令管理Ollama。接下来我们学习Ollama的高级应用。通过Ollama的Mod…

DeepSeek开源周Day1:FlashMLA引爆AI推理性能革命!

项目地址&#xff1a;GitHub - deepseek-ai/FlashMLA 开源日历&#xff1a;2025-02-24起 每日9AM(北京时间)更新&#xff0c;持续五天&#xff01; ​ 一、开源周震撼启幕 继上周预告后&#xff0c;DeepSeek于北京时间今晨9点准时开源「FlashMLA」&#xff0c;打响开源周五连…

(七)懒加载预加载

&#xff08;一&#xff09;懒加载 1. 什么是懒加载 懒加载&#xff0c;即延迟加载。在访问页面时&#xff0c;先将 img 元素或其他元素的背景图片路径替换为占位图&#xff08;通常是 1*1px 的小图片&#xff09;&#xff0c;仅当元素进入浏览器可视区域时&#xff0c;才设置…

Revisiting Reverse Distillation for Anomaly Detection

重新审视反向蒸馏在异常检测中的应用 文章链接&#xff1a;点这里 源码链接&#xff1a;点这里 前言 此篇文章是在 Anomaly detection via reverse distillation from one-class embedding 这篇的基础上改进创新的。重新审视了反向蒸馏&#xff08;KD&#xff09;这一想法&am…

Windows CMD 命令大全(Complete List of Windows CMD Commands)

Windows CMD 命令大全&#xff1a; Windows CMD 是 Windows 系统内置的命令行工具&#xff0c;用于执行各种命令和管理任务。 称为Command Prompt。它提供了一个通过键入命令来与计算机系统进行交互的方式&#xff0c;类似于早期的DOS操作系统。以下是 CMD 的基础知识和常用命…

hot100-二叉树

二叉树 二叉树递归 相当于这个的顺序来回调换 class Solution {private List<Integer> res new ArrayList<>();public List<Integer> inorderTraversal(TreeNode root) {if(root null)return res;inorderTraversal(root.left);res.add(root.val);inorde…

【JavaWeb13】了解ES6的核心特性,对于提高JavaScript编程效率有哪些潜在影响?

文章目录 &#x1f30d;一. ES6 新特性❄️1. ES6 基本介绍❄️2. 基本使用2.1 let 声明变量2.2 const 声明常量/只读变量2.3 解构赋值2.4 模板字符串2.5 对象拓展运算符2.6 箭头函数 &#x1f30d;二. Promise❄️1. 基本使用❄️2. 如何解决回调地狱问题2.1回调地狱问题2.2 使…

ROS的action通信——实现阶乘运算(三)

在ROS中除了常见的话题(topic&#xff09;通信、服务(server)通信等方式&#xff0c;还有action通信这一方式&#xff0c;由于可以实时反馈任务完成情况&#xff0c;该通信方式被广泛运用于机器人导航等任务中。本文将通过三个小节的分享&#xff0c;实现基于action通信的阶乘运…

centos系统MBR格式转换成gpt格式 (华为云)

在华为云上的centos7.9系统MBR格式转换成GPT格式的步骤 华为云上关于转换的步骤 这个链接里面 gdisk -g /dev/vda 是不对的&#xff0c;-g参数是新创建一个分区&#xff0c;慎用 自己步骤如下&#xff1a;&#xff08;已经试验过&#xff09; 1、gdisk /dev/sda (这里是盘 不…

【Microsoft PowerPoint for Mac】2分钟配置-MAC一键删除PPT中的所有备注

MAC一键删除PPT中的所有备注 1.搜索自动操作2.点击快速操作3.搜索并运行AppleScript4.输入代码&#xff0c;并选择只应用于Microsoft PowerPoint for Mac【右上角】5. CRTLS保存为“清除当前文稿中的所有备注”&#xff0c;PPT中应用。 MAC没自带&#xff0c;需要自己配置 1.搜…

uni-app 开发 App 、 H5 横屏签名(基于lime-signature)

所用插件&#xff1a;lime-signature 使用到 CSS 特性 绝对定位transform 旋转transform-origin transform 原点 复习一下定位元素&#xff08;相对定位、绝对定位、粘性定位&#xff09; 代码# <template><view class"signature-page"><view clas…

【Linux探索学习】第三十一弹——线程互斥与同步(下):深入理解确保线程安全的机制

线程互斥与同步&#xff08;上&#xff09;&#xff1a;【Linux探索学习】第三十弹——线程互斥与同步&#xff08;上&#xff09;&#xff1a;深入理解线程保证安全的机制-CSDN博客 Linux探索学习&#xff1a; https://blog.csdn.net/2301_80220607/category_12805278.html?…

《Effective Objective-C》阅读笔记(中)

目录 接口与API设计 用前缀避免命名空间冲突 提供“全能初始化方法” 实现description方法 尽量使用不可变对象 使用清晰而协调的命名方式 方法命名 ​编辑类与协议命名 为私有方法名加前缀 理解OC错误模型 理解NSCopying协议 协议与分类 通过委托与数据源协议进行…

python-leetcode-每日温度

739. 每日温度 - 力扣&#xff08;LeetCode&#xff09; class Solution:def dailyTemperatures(self, temperatures: List[int]) -> List[int]:n len(temperatures)answer [0] * nstack [] # 存储索引for i, temp in enumerate(temperatures):while stack and temperat…

山东大学软件学院nosql实验三

实验题目&#xff1a; 用Java做简单查询(2学时) 实验内容 用API方式&#xff0c;做简单查询。 实验要求 在以下要求中选择至少2个&#xff0c;使用Java语言实现数据查询&#xff0c;最终把数据输出到前端界面。 &#xff08;1&#xff09;找出年龄小于20岁的所有学生 &…

【Linux】初探信号的奥秘

目录 一、引入信号&#xff1a; 1、什么是信号&#xff1a; 二、前后台进程&#xff1a; 三、信号的处理方式&#xff1a; 四、键盘数据与信号&#xff1a; 前言&#xff1a; 在Linux系统编程中&#xff0c;信号&#xff08;Signal&#xff09;是一种至关重要的进程间通信…

Bugku CTF CRYPTO

Bugku CTF CRYPTO 文章目录 Bugku CTF CRYPTO聪明的小羊ok[-<>]散乱的密文.!? 聪明的小羊 描 述: 一只小羊翻过了2个栅栏 fa{fe13f590lg6d46d0d0} 分 析&#xff1a;栅栏密码&#xff0c;分2栏&#xff0c;一个栏里有11个 ①手动解密 f a { f e 1 3 f 5 9 0 l g 6 d 4 …

数据库的基本操作

目录 一、查看所有的数据库&#xff1a; 二、创建数据库&#xff1a; if not exists : 字符编码集&#xff1a; 排序规则&#xff1a; 三、查看创建的库&#xff1a; 四、修改数据库&#xff1a; 五、删除数据库&#xff1a; if exists&#xff1a; 前言&#xff1a; 在…

IDEA集成DeepSeek,通过离线安装解决无法安装Proxy AI插件问题

文章目录 引言一、安装Proxy AI1.1 在线安装Proxy AI1.2 离线安装Proxy AI 二、Proxy AI中配置DeepSeek2.1 配置本地部署的DeepSeek&#xff08;Ollama方式&#xff09;2.2 通过第三方服务商提供的API进行配置 三、效果测试 引言 许多开发者尝试通过安装Proxy AI等插件将AI能力…

Java+SpringBoot+Vue+数据可视化的音乐推荐与可视化平台(程序+论文+讲解+安装+调试+售后)

感兴趣的可以先收藏起来&#xff0c;还有大家在毕设选题&#xff0c;项目以及论文编写等相关问题都可以给我留言咨询&#xff0c;我会一一回复&#xff0c;希望帮助更多的人。 系统介绍 在互联网技术以日新月异之势迅猛发展的浪潮下&#xff0c;5G 通信技术的普及、云计算能力…