Skip to content

详解内存布局

本文详细介绍了 Rust 中各种数据类型的内存布局特点和原理。

重要说明:本文描述的是一般情况下的内存布局,实际情况可能因编译器优化、目标平台和系统环境而有所差异。Rust 在编译时需要知道每个类型所占用的内存空间,具体的内存分配和布局由 Rust 运行时和操作系统的内存管理机制负责管理。

基础概念

在深入了解内存布局之前,我们需要理解一些基础概念:

符号说明

  • []:1 个字节(byte)
  • [4]:4 个字节
  • [ptr]:指针大小,在 64 位系统上为 8 个字节,32 位系统上为 4 个字节
  • ptr(pointer):usize 类型,指向数据起始地址的指针
  • cap(capacity):表示可变长度类型(如 VecString)的内部缓冲区容量
  • len(length):usize 类型,记录数据的长度,以字节为单位

关于容量(capacity)的说明

  • 对于 &str 类型:它是不可变的字符串切片,长度和内容固定,因此没有容量概念
  • &str 可以看作是指向字符数据的指针和长度信息的组合
  • 容量通常只存在于可变长度的拥有型类型中,如 StringVec<T>

内存布局概述

Rust 的内存布局是指各种数据类型在内存中的存储方式。虽然 Rust 没有严格定义其内存模型规范,但遵循一些基本原则:

数据对齐(Data Alignment)

  • 每种类型都有一个对齐属性(alignment)
  • 类型的大小必须是其对齐属性的整数倍
  • 这确保了数组中元素的偏移量都是类型大小的整数倍,便于按偏移量索引

结构体对齐规则

  • 结构体的对齐属性等于所有成员中对齐属性的最大值
  • 编译器会在必要位置填充空白数据(padding)以满足对齐要求
  • 整个类型的大小必须是对齐属性的整数倍

编译器优化

  • Rust 编译器会进行内存布局优化
  • 对于泛型结构体,字段顺序可能被重新排列以减少内存占用
  • 可以使用 #[repr(C)] 等属性控制内存布局

内存大小计算: 使用 std::mem 模块可以获取类型信息:

  • size_of::<T>():获取类型 T 的大小
  • size_of_val(&value):获取值的大小
  • align_of::<T>():获取类型 T 的对齐要求

基础类型内存布局

Rust 基础类型的内存占用如下表所示:

类型大小(字节)内存表示
bool/u8/i81[]
u16/i162[][]
u32/i32/f324[][][][]
u64/i64/f648[][][][][][][][]
u128/i12816[][][][][][][][][][][][][][][][]
char4[][][][](UTF-32 编码)

特殊整数类型

  • isizeusize:平台相关的指针大小整数类型
    • 32 位系统:4 字节
    • 64 位系统:8 字节
    • 主要用于表示指针大小、数组索引等

机器字(Machine Word): 机器字是计算机体系结构中处理和存储数据的基本单元,大小取决于计算机架构:

  • 16 位系统:2 字节
  • 32 位系统:4 字节
  • 64 位系统:8 字节

示例代码

rust
use std::mem;

fn main() {
    println!("bool: {} bytes", mem::size_of::<bool>());
    println!("u32: {} bytes", mem::size_of::<u32>());
    println!("usize: {} bytes", mem::size_of::<usize>());
    println!("char: {} bytes", mem::size_of::<char>());
}

栈(Stack)和堆(Heap)

理解栈和堆是掌握 Rust 内存管理的基础。

栈(Stack)

特点

  • 固定大小的内存区域
  • 存储局部变量和函数调用信息
  • 快速的分配和释放
  • 自动管理生命周期
  • 遵循后进先出(LIFO)原则

存储内容

  • 函数参数
  • 局部变量
  • 返回地址
  • 基础类型数据

堆(Heap)

特点

  • 动态分配的内存区域
  • 需要显式分配和释放
  • 访问速度相对较慢
  • 灵活的大小和生命周期
  • 通过指针间接访问

存储内容

  • 动态分配的数据
  • 大型数据结构
  • 通过 Box<T>Vec<T> 等分配的数据

内存布局示意图

高地址 ↑
┌─────────────┐
│    栈区     │ ← 函数调用、局部变量
│    (向下增长)  │
├─────────────┤
│     ↓       │
│             │
│    空闲     │
│             │
│     ↑       │
├─────────────┤
│    堆区     │ ← 动态分配数据
│   (向上增长)   │
├─────────────┤
│   数据段    │ ← 全局变量、静态变量
├─────────────┤
│   代码段    │ ← 程序指令
└─────────────┘
低地址 ↓

性能比较

特性
分配速度极快(移动指针)较慢(搜索空间)
访问速度快(缓存友好)慢(间接访问)
内存管理自动手动(Rust 自动)
大小限制有限(通常几 MB)大(系统内存)

Rust 中的数据分布

rust
fn example() {
    let x = 42;                    // 栈上
    let s = String::from("hello"); // s 在栈上,数据在堆上
    let v = vec![1, 2, 3];         // v 在栈上,数据在堆上
    let boxed = Box::new(100);     // boxed 在栈上,100 在堆上
}

元组(Tuple)内存布局

让我们通过一个具体例子来理解元组的内存布局:

rust
use std::mem;

let a: (char, u8, i32) = ('a', 7, 354);
println!("大小: {} bytes", mem::size_of::<(char, u8, i32)>()); // 12
println!("对齐: {} bytes", mem::align_of::<(char, u8, i32)>()); // 4

内存布局分析

初步计算

  • char: 4 字节
  • u8: 1 字节
  • i32: 4 字节
  • 总计: 4 + 1 + 4 = 9 字节

对齐要求

  • 元组的对齐值 = 成员中最大的对齐值 = 4 字节(来自 char 和 i32)
  • 总大小必须是对齐值的整数倍

实际布局

txt
图示:(Rust 可能会重排字段顺序)
     char   |  u8   | padding |  i32
   +--------+-------+---------+--------+
a  │   [4]  │  [1]  │   [3]   │   [4]  │
   +--------+-------+---------+--------+
   |<-------------- 12 bytes ---------->|

重要说明

  • Rust 默认使用自己的内存布局策略,可能重排字段以优化内存使用
  • 填充(padding)位置不固定,编译器会选择最优方案
  • 可以使用 #[repr(C)] 强制使用 C 语言的字段顺序

不同 repr 的影响

rust
#[repr(C)]
struct CStyleTuple(char, u8, i32);

// 默认 Rust 风格可能重排为 (char, i32, u8) 以减少填充
struct RustStyleTuple(char, u8, i32);

引用(Reference)内存布局

引用是 Rust 内存安全的重要组成部分,让我们看看它们的内存布局:

rust
let a: i8 = 6;
let b: &i8 = &a;

内存布局图示

txt
图示:引用指向原始数据
                 a                      b
         +------+              +-------------+
    ... │  [1]  │ ............ │    [ptr]    │ ...
         +---^--+              +------│------+
stack        │<-----------------------│
─────────────────────────────────────────────────
heap

解释

  1. a 是一个 i8 类型,占用 1 字节,存储在栈上
  2. b 是指向 a 的引用,存储 a 的内存地址
  3. 引用本身占用一个指针大小的空间(64 位系统上 8 字节)
  4. &T&mut T 的内存布局相同,区别在于使用规则和编译器检查

引用的特点

内存占用

  • 在 64 位系统:8 字节
  • 在 32 位系统:4 字节

安全性保证

  • 引用总是有效的(不能为空)
  • 编译时检查生命周期
  • 借用检查确保内存安全

示例代码

执行结果:

00 00 00 00 00 00 00 00
F0 59 7A 26 6E 55 00 00
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
03 00 00 00 00 00 00 00 F0 59 7A 26 6E 55 00 00 03 00 00 00 00 00 00 00

可以明显看到,使用 Box 带来的内存优化差异。

预期输出(64 位系统):

普通枚举大小: 16 bytes
Option<Box<i32>> 大小: 8 bytes
Box<i32> 大小: 8 bytes
None 的大小: 8 bytes
Some 的大小: 8 bytes

哪些类型享有此优化

编译器会对以下类型的 Option<T> 进行空指针优化:

  1. 非空指针类型

    • Box<T>
    • &T&mut T(引用永远非空)
    • fn() 函数指针
    • NonNull<T>
  2. 复合类型

    • Option<&T> → 8 字节(而不是 16 字节)
    • Option<Box<T>> → 8 字节(而不是 16 字节)

内存布局图示

txt
Option<Box<i32>> 的两种状态:

None 状态:
┌─────────────────┐
│ 0x0000000000000000 │  ← 空指针表示 None
└─────────────────┘

Some(Box::new(42)) 状态:
┌─────────────────┐
│ 0x7f8b2c004010   │  ── 指向堆上的数据
└─────────────────┘


   ┌─────┐
   │ 42  │  ← 堆上的实际数据
   └─────┘

安全性保证

这种优化并不会影响 Rust 的安全性:

  1. 类型安全:编译器确保你不能访问 None 的内容
  2. 模式匹配:必须显式处理 None 情况
  3. 零成本抽象:运行时性能等同于 C 语言的指针,但编译时安全
rust
fn safe_access(opt: Option<Box<i32>>) -> i32 {
    match opt {
        Some(boxed) => *boxed,  // 安全访问
        None => 0,              // 必须处理空值情况
    }
}

这种优化使得 Rust 的 Option<T> 在保证内存安全的同时,还能达到与传统指针相同的性能表现。

基本用法

rust
let x = 5;                    // 栈上分配
let y = Box::new(5);          // 堆上分配

内存布局对比

让我们通过一个复杂的例子来理解:

rust
let t: (i32, String) = (5, "Hello".to_string());
let b: Box<(i32, String)> = Box::new(t);

栈上分配的元组

txt
图示:普通元组的内存布局(省略 padding)

              +──────+────────────+────────+────────+────────+
           t  │ [4]  │ [padding]  │ [ptr]  │ [cap]  │ [len]  │
              +──────+────────────+────│───+────────+────────+
stack                                  │
───────────────────────────────────────│─────────────────────
heap                                   │
                                   +───▼───+───+───+───+───+
                                   │   H   │ e │ l │ l │ o │
                                   +───────+───+───+───+───+

Box 包装后的内存布局

rust
let t: (i32, String) = (5, "Hello".to_string());
let b = Box::new(t);
txt
图示:Box 将数据移到堆上

           +────────+
        b  │ [ptr]  │  ── 栈上只存储指针
           +────│───+
stack           │
────────────────│───────────────────────────────────────────
heap            │
            +───▼───+────────────+────────+────────+────────+
         t  │  [4]  │ [padding]  │ [ptr]  │ [cap]  │ [len]  │
            +───────+────────────+────│───+────────+────────+

                                 +───▼───+───+───+───+───+
                                 │   H   │ e │ l │ l │ o │
                                 +───────+───+───+───+───+

Box 的特点

  1. 独占所有权:Box 拥有其内容的唯一所有权
  2. 自动清理:当 Box 超出作用域时,自动释放堆内存
  3. 零成本抽象:运行时没有额外开销
  4. 递归类型支持:可以用于定义递归数据结构

实际应用场景

1. 大型数据结构

rust
// 避免栈溢出
struct LargeData {
    data: [u8; 1024 * 1024], // 1MB 数据
}

let large = Box::new(LargeData { data: [0; 1024 * 1024] });
// 栈上只存储 8 字节指针,而不是 1MB 数据

2. 递归数据结构

rust
// 链表节点定义
enum List<T> {
    Nil,
    Cons(T, Box<List<T>>),  // Box 使递归成为可能
}

// 二叉树定义
struct TreeNode<T> {
    value: T,
    left: Option<Box<TreeNode<T>>>,
    right: Option<Box<TreeNode<T>>>,
}

3. 特征对象

rust
trait Animal {
    fn speak(&self);
}

struct Dog;
impl Animal for Dog {
    fn speak(&self) { println!("Woof!"); }
}

// Box 允许存储不同大小的特征对象
let animal: Box<dyn Animal> = Box::new(Dog);

内存使用分析

rust
use std::mem;

fn main() {
    let stack_data = (42i32, String::from("hello"));
    let heap_data = Box::new((42i32, String::from("hello")));

    println!("栈上元组大小: {} bytes", mem::size_of_val(&stack_data));
    println!("Box 指针大小: {} bytes", mem::size_of_val(&heap_data));
    println!("Box 内容大小: {} bytes", mem::size_of_val(&*heap_data));

    // 获取堆地址
    let heap_ptr = Box::into_raw(heap_data);
    println!("堆地址: {:p}", heap_ptr);

    // 重要:需要重新包装以避免内存泄漏
    let _recovered = unsafe { Box::from_raw(heap_ptr) };
}

性能考虑

优势

  • 减少栈内存使用
  • 支持动态大小的数据
  • 零运行时成本的所有权转移

劣势

  • 堆分配比栈分配慢
  • 间接访问可能影响缓存性能
  • 额外的内存碎片

与其他语言的对比

txt
C/C++:    malloc/new → 手动 free/delete
Java:     new Object() → 垃圾回收
Rust:     Box::new() → 自动清理(所有权)

Box<T> 提供了 C/C++ 的性能优势,同时具备 Java 的内存安全性,是 Rust 零成本抽象的典型例子。

Copy 和 Move 语义的内存布局

Rust 的所有权系统通过 Copy 和 Move 语义来管理内存,这两种语义在内存布局上有根本性的区别。

Copy 语义

实现了 Copy trait 的类型在赋值或传参时会进行按位复制(bitwise copy),原数据仍然有效。

Copy 类型的特征

rust
// 基础类型都实现了 Copy
let x = 5;
let y = x;  // x 仍然有效,发生了复制
println!("x: {}, y: {}", x, y);  // ✅ 正常工作

// 包含所有 Copy 字段的结构体也可以实现 Copy
#[derive(Copy, Clone)]
struct Point {
    x: i32,
    y: i32,
}

let p1 = Point { x: 1, y: 2 };
let p2 = p1;  // 按位复制
println!("p1: ({}, {})", p1.x, p1.y);  // ✅ p1 仍然有效

Copy 类型的内存布局

txt
Copy 发生前:
栈地址    变量    内容
0x1000    x      [5, 0, 0, 0]  (i32)

Copy 发生后:
栈地址    变量    内容
0x1000    x      [5, 0, 0, 0]  (原始数据,仍然有效)
0x1004    y      [5, 0, 0, 0]  (完全独立的副本)

Move 语义

没有实现 Copy trait 的类型在赋值或传参时会发生移动,原变量失效,所有权转移。

Move 的基本示例

rust
let s1 = String::from("hello");
let s2 = s1;  // s1 的所有权移动到 s2
// println!("{}", s1);  // ❌ 编译错误:s1 已被移动
println!("{}", s2);     // ✅ 正常工作

Move 的内存布局详解

移动前的内存状态

txt
栈地址    变量    内容
0x1000    s1     [ptr: 0x2000, cap: 5, len: 5]

堆地址    内容
0x2000    ['h', 'e', 'l', 'l', 'o']

移动后的内存状态

txt
栈地址    变量    内容
0x1000    s1     [无效]  ← 编译器确保不能再访问
0x1008    s2     [ptr: 0x2000, cap: 5, len: 5]  ← 所有权转移

堆地址    内容
0x2000    ['h', 'e', 'l', 'l', 'o']  ← 堆数据没有复制

深拷贝 vs 浅拷贝 vs 移动

rust
use std::mem;

fn main() {
    // 1. Copy:按位复制(适用于简单类型)
    let num1 = 42i32;
    let num2 = num1;  // 完整复制 4 字节

    // 2. Clone:深拷贝(手动调用)
    let s1 = String::from("hello");
    let s2 = s1.clone();  // 堆数据也被复制

    // 3. Move:所有权转移(默认行为)
    let s3 = String::from("world");
    let s4 = s3;  // 只复制栈上的元数据,不复制堆数据

    println!("Copy: num1={}, num2={}", num1, num2);
    println!("Clone: s1={}, s2={}", s1, s2);
    println!("Move: s4={}", s4);
    // println!("s3={}", s3);  // ❌ s3 已被移动
}

性能影响对比

操作类型栈操作堆操作性能开销内存使用
Copy复制数据最低增加栈使用
Move复制元数据很低无额外开销
Clone复制元数据分配+复制大幅增加

实际测量示例

rust
use std::time::Instant;

fn test_copy() {
    let start = Instant::now();
    let x = [1u8; 1024];  // 1KB 数组,实现了 Copy
    for _ in 0..1000000 {
        let _y = x;  // Copy:复制 1KB 数据
    }
    println!("Copy 耗时: {:?}", start.elapsed());
}

fn test_move() {
    let start = Instant::now();
    for _ in 0..1000000 {
        let s = String::with_capacity(1024);  // 1KB 容量
        let _t = s;  // Move:只复制 24 字节元数据
    }
    println!("Move 耗时: {:?}", start.elapsed());
}

fn test_clone() {
    let start = Instant::now();
    let s = "x".repeat(1024);  // 1KB 字符串
    for _ in 0..1000000 {
        let _t = s.clone();  // Clone:分配+复制 1KB 数据
    }
    println!("Clone 耗时: {:?}", start.elapsed());
}

何时选择哪种语义

使用 Copy

  • 小型、简单的数据类型
  • 频繁复制的场景
  • 性能敏感的代码

使用 Move

  • 大型数据结构
  • 资源管理(文件句柄、网络连接等)
  • 避免不必要的内存分配

使用 Clone

  • 需要真正的数据副本
  • 多个变量需要独立修改同一数据
  • 明确需要深拷贝的场景

引用计数智能指针

除了 Box<T> 外,Rust 还提供了引用计数智能指针 Rc<T>Arc<T>,它们允许多个所有者共享同一份数据。

Rc<T> - 单线程引用计数

Rc<T> (Reference Counted) 是一种单线程场景下的引用计数智能指针。

基本用法

rust
use std::rc::Rc;

let data = Rc::new(String::from("shared data"));
let data1 = Rc::clone(&data);  // 增加引用计数
let data2 = Rc::clone(&data);  // 再次增加引用计数

println!("引用计数: {}", Rc::strong_count(&data));  // 输出:3

Rc<T> 的内存布局

txt
Rc<T> 在堆上的数据结构:

┌─────────────────┬─────────────────┬─────────────────┐
│  strong_count   │  weak_count     │     data        │
│      8 字节     │     8 字节      │    T 的大小     │
└─────────────────┴─────────────────┴─────────────────┘

栈上的 Rc 指针:
┌─────────────────┐
│   heap_ptr      │  → 指向上述堆结构
│     8 字节      │
└─────────────────┘

详细内存分析

rust
use std::rc::Rc;
use std::mem;

fn main() {
    let data = Rc::new(String::from("Hello, Rc!"));

    println!("Rc<String> 大小: {} bytes", mem::size_of_val(&data));
    println!("String 数据大小: {} bytes", mem::size_of_val(&*data));
    println!("引用计数: {}", Rc::strong_count(&data));

    {
        let data2 = Rc::clone(&data);
        println!("克隆后引用计数: {}", Rc::strong_count(&data));

        // 两个 Rc 指向相同的堆地址
        println!("data 地址: {:p}", &*data);
        println!("data2 地址: {:p}", &*data2);  // 相同地址
    } // data2 在此处销毁,引用计数减 1

    println!("作用域结束后引用计数: {}", Rc::strong_count(&data));
}

循环引用问题

rust
use std::rc::{Rc, Weak};
use std::cell::RefCell;

#[derive(Debug)]
struct Node {
    value: i32,
    children: RefCell<Vec<Rc<Node>>>,
    parent: RefCell<Weak<Node>>,  // 使用 Weak 避免循环引用
}

fn main() {
    let parent = Rc::new(Node {
        value: 1,
        children: RefCell::new(vec![]),
        parent: RefCell::new(Weak::new()),
    });

    let child = Rc::new(Node {
        value: 2,
        children: RefCell::new(vec![]),
        parent: RefCell::new(Rc::downgrade(&parent)),  // 弱引用
    });

    parent.children.borrow_mut().push(Rc::clone(&child));

    println!("parent 引用计数: {}", Rc::strong_count(&parent));  // 1
    println!("child 引用计数: {}", Rc::strong_count(&child));   // 2
}

Arc<T> - 原子引用计数

Arc<T> (Atomic Reference Counted) 是 Rc<T> 的线程安全版本。

基本用法

rust
use std::sync::Arc;
use std::thread;

let data = Arc::new(String::from("shared across threads"));

let handles: Vec<_> = (0..3).map(|i| {
    let data = Arc::clone(&data);
    thread::spawn(move || {
        println!("线程 {} 访问: {}", i, data);
    })
}).collect();

for handle in handles {
    handle.join().unwrap();
}

Arc<T> 的内存布局

txt
Arc<T> 的堆布局与 Rc<T> 类似,但使用原子操作:

┌─────────────────┬─────────────────┬─────────────────┐
│ atomic_strong   │ atomic_weak     │     data        │
│     8 字节      │     8 字节      │    T 的大小     │
└─────────────────┴─────────────────┴─────────────────┘
        ↑                 ↑
   原子计数器         原子计数器

性能对比

rust
use std::sync::Arc;
use std::rc::Rc;
use std::time::Instant;

fn benchmark_rc() {
    let start = Instant::now();
    let data = Rc::new(vec![1; 1000]);

    for _ in 0..1000000 {
        let _clone = Rc::clone(&data);
    }

    println!("Rc 克隆耗时: {:?}", start.elapsed());
}

fn benchmark_arc() {
    let start = Instant::now();
    let data = Arc::new(vec![1; 1000]);

    for _ in 0..1000000 {
        let _clone = Arc::clone(&data);
    }

    println!("Arc 克隆耗时: {:?}", start.elapsed());
}

fn main() {
    benchmark_rc();   // 通常更快
    benchmark_arc();  // 由于原子操作,稍慢
}

智能指针选择指南

指针类型所有权线程安全性能使用场景
Box<T>独占最高堆分配、递归类型
Rc<T>共享单线程共享数据
Arc<T>共享中等多线程共享数据

内存泄漏预防

rust
use std::rc::{Rc, Weak};
use std::cell::RefCell;

// ❌ 可能导致内存泄漏的循环引用
struct BadNode {
    children: RefCell<Vec<Rc<BadNode>>>,
    parent: RefCell<Option<Rc<BadNode>>>,  // 强引用形成环
}

// ✅ 正确的设计:使用弱引用打破循环
struct GoodNode {
    children: RefCell<Vec<Rc<GoodNode>>>,
    parent: RefCell<Weak<GoodNode>>,  // 弱引用,不影响引用计数
}

实际应用示例

rust
use std::sync::Arc;
use std::thread;
use std::sync::Mutex;

// 多线程共享的计数器
let counter = Arc::new(Mutex::new(0));
let mut handles = vec![];

for _ in 0..10 {
    let counter = Arc::clone(&counter);
    let handle = thread::spawn(move || {
        let mut num = counter.lock().unwrap();
        *num += 1;
    });
    handles.push(handle);
}

for handle in handles {
    handle.join().unwrap();
}

println!("最终计数: {}", *counter.lock().unwrap());  // 输出:10

引用计数智能指针提供了在保证内存安全的前提下共享数据的能力,是 Rust 并发编程的重要工具。

Rust 类型选择决策树

在 Rust 中选择合适的类型对内存效率和程序安全性至关重要。下面的决策树帮助你快速做出正确的选择:

txt
需要内部共享数据?
├─ 否 ──> 需要堆分配?
│         ├─ 否 ──> 需要内部可变性?
│         │         ├─ 否 ──> 需要所有权?
│         │         │         ├─ 否 ──> &T (不可变借用)
│         │         │         └─ 是 ──> T (直接所有权)
│         │         └─ 是 ──> 线程安全?
│         │                   ├─ 否 ──> 内部引用?
│         │                   │         ├─ 否 ──> Cell<T>
│         │                   │         └─ 是 ──> RefCell<T>
│         │                   └─ 是 ──> 内部引用?
│         │                             ├─ 否 ──> AtomicT
│         │                             ├─ 单个 ─> Mutex<T>
│         │                             └─ 多个 ─> RwLock<T>
│         └─ 是 ──> Box<T> (堆分配独占所有权)

└─ 是 ──> 需要堆分配?
          ├─ 否 ──> &T (多个不可变借用)
          └─ 是 ──> 线程安全?
                    ├─ 否 ──> Rc<T> (单线程引用计数)
                    └─ 是 ──> Arc<T> (多线程引用计数)

详细类型说明

1. 直接所有权:T

使用场景

  • 简单数据类型
  • 栈上分配
  • 明确的所有权
rust
let name = String::from("Alice");  // 直接所有权
let age = 25;                      // Copy 类型,直接所有权

内存特点

  • 栈分配(如果类型允许)
  • 零运行时开销
  • 编译时检查所有权

2. 不可变借用:&T

使用场景

  • 需要读取但不拥有数据
  • 函数参数传递
  • 避免不必要的复制
rust
fn print_name(name: &str) {  // 借用,不获取所有权
    println!("Name: {}", name);
}

let name = String::from("Alice");
print_name(&name);  // name 仍然有效

内存特点

  • 指针大小(8 字节在 64 位系统)
  • 编译时生命周期检查
  • 零运行时开销

3. 可变借用:&mut T

使用场景

  • 需要修改但不拥有数据
  • 独占访问保证
rust
fn update_name(name: &mut String) {
    name.push_str(" Smith");
}

let mut name = String::from("Alice");
update_name(&mut name);

安全保证

  • 同时只能有一个可变借用
  • 可变借用期间不能有其他借用

4. 堆分配:Box<T>

使用场景

  • 大型数据结构
  • 递归类型
  • 动态大小类型
rust
// 递归类型必须使用 Box
enum List {
    Cons(i32, Box<List>),
    Nil,
}

// 大型数据避免栈溢出
let large_data = Box::new([0u8; 1024 * 1024]);

内存特点

  • 堆分配,栈上存储指针
  • 独占所有权
  • 自动内存管理

5. 内部可变性:Cell<T>RefCell<T>

Cell<T> - 适用于 Copy 类型:

rust
use std::cell::Cell;

let data = Cell::new(5);
data.set(10);  // 内部可变性
println!("{}", data.get());

RefCell<T> - 适用于非 Copy 类型:

rust
use std::cell::RefCell;

let data = RefCell::new(String::from("hello"));
{
    let mut borrowed = data.borrow_mut();
    borrowed.push_str(" world");
}
println!("{}", data.borrow());

运行时检查

  • 借用规则在运行时检查
  • 违反规则会 panic
  • 允许在不可变上下文中进行可变操作

6. 线程安全的内部可变性

Mutex<T> - 互斥锁:

rust
use std::sync::Mutex;

let counter = Mutex::new(0);
{
    let mut num = counter.lock().unwrap();
    *num += 1;
}  // 锁在此处释放

RwLock<T> - 读写锁:

rust
use std::sync::RwLock;

let data = RwLock::new(String::from("hello"));

// 多个读取者
let r1 = data.read().unwrap();
let r2 = data.read().unwrap();

drop(r1);
drop(r2);

// 单个写入者
let mut w = data.write().unwrap();
w.push_str(" world");

原子类型 - 无锁操作:

rust
use std::sync::atomic::{AtomicUsize, Ordering};

let counter = AtomicUsize::new(0);
counter.fetch_add(1, Ordering::SeqCst);

7. 共享所有权

Rc<T> - 单线程引用计数:

rust
use std::rc::Rc;

let data = Rc::new(String::from("shared"));
let data1 = Rc::clone(&data);
let data2 = Rc::clone(&data);
// 三个所有者共享同一份数据

Arc<T> - 多线程引用计数:

rust
use std::sync::Arc;
use std::thread;

let data = Arc::new(String::from("shared"));
let data_clone = Arc::clone(&data);

thread::spawn(move || {
    println!("{}", data_clone);
}).join().unwrap();

性能对比表

类型内存开销运行时开销线程安全使用复杂度
T最小取决于 T简单
&T指针大小简单
&mut T指针大小中等
Box<T>指针+堆分配/释放简单
Cell<T>包装开销很小中等
RefCell<T>包装+计数运行时检查中等
Rc<T>指针+计数引用计数中等
Arc<T>指针+原子计数原子操作中等
Mutex<T>包装+OS 锁锁操作复杂

实际选择建议

  1. 默认选择:优先使用直接所有权 T 和借用 &T
  2. 大型数据:使用 Box<T> 避免栈溢出
  3. 共享只读数据:单线程用 Rc<T>,多线程用 Arc<T>
  4. 共享可变数据Arc<Mutex<T>>Arc<RwLock<T>>
  5. 内部可变性:优先 Cell<T>,必要时用 RefCell<T>

这个决策树帮助你在复杂的 Rust 类型系统中快速找到最适合的解决方案。

其他知识点

  1. 内存对齐(Memory Alignment): 内存对齐是指数据在内存中的存储位置需要满足特定的对齐要求。大多数计算机体系结构要求某些数据类型的地址必须是特定大小的整数倍。 在 Rust 中,通常为了优化内存访问的效率和对齐的要求,编译器会自动进行内存对齐操作。你也可以使用 #repr(align(n)) 注解来手动控制结构体或枚举的对齐方式。

  2. 堆栈溢出(Stack Overflow): 栈的大小是有限的,在递归调用或者过多的局部变量声明等情况下,可能会导致栈空间耗尽,从而发生堆栈溢出错误。 为了避免这种情况,可以通过优化递归算法,减少对栈空间的依赖,或者增加栈的大小限制。

  3. 进程虚拟地址空间: 在现代操作系统中,每个进程都有自己的虚拟地址空间,用于存储代码、数据和堆栈等。 不同进程的虚拟地址空间是相互独立的,这使得每个进程都可以使用相同的地址来访问其私有内存区域。操作系统通过地址转换技术将虚拟地址映射到物理内存上。

  4. 动态内存分配和释放: 在一些情况下,需要在程序运行时动态地分配和释放内存,这就涉及到了堆的管理。 在 Rust 中,可以使用 Box<T>Vec<T> 等类型进行堆分配,并使用 drop() 方法手动释放内存。 为了避免内存泄漏和悬垂指针等问题,需要合理地管理动态分配的内存。

  5. 内存安全与所有权机制: Rust 通过引入所有权机制来保证内存安全。在 Rust 中,每个值都有一个对应的所有者,只能有一个所有者,当所有者超出作用域时,该值会被自动释放。 这种所有权机制消除了使用非法指针和内存泄漏等常见的内存安全问题。

size_ofsize_of_valalign_of

在 Rust 中,size_ofalign_of 是两个用于获取类型大小和对齐方式的函数,它们都属于 std::mem 模块。

具体来说:

  • mem::size_of 函数可以用来获取指定类型占用的字节数(size),不包括填充字节:
  • mem::size_of_val 函数用来返回所指向值的大小(以字节为单位),包括填充字节在内的大小:

这个函数通常与std::mem::size_of::<T>()返回相同的结果,但当 T 没有静态已知大小时(例如,切片[T]或特征对象),可以使用size_of_val来获取动态已知大小。

比如获取 String 类型的静态大小 mem::size_of::<String>(): 因为 String 的实现结构中包含了三个字段:指向字符串数据的指针(ptr)、字符串的长度(len)和字符串的容量(cap)。 对于 64 位系统来说,一个指针的大小通常为 8 字节。因此,ptr字段占用了 8 字节的空间。 len字段和cap字段都是 usize 类型,表示无符号整数,它的大小与平台相关。在 64 位系统上,usize 是 8 字节大小。 所以 String 类型的静态大小通常为 24 字节(在 64 位系统上)。 需要注意的是,这里的静态大小只是 String 结构本身所占用的内存大小,并不包括字符串数据本身。字符串数据是在堆上分配的,并由ptr字段指向。 这里提到的大小是一种典型情况,具体的大小可能根据编译器、操作系统以及 Rust 版本等因素有所不同。

  • align_of 函数可以用来获取指定类型所需的最大对齐方式(alignment)。对齐方式是指变量在内存中存储时必须满足的对齐要求,例如某些架构要求变量必须按照 4 字节或 8 字节对齐。

以下是一个简单的示例,演示了如何使用 size_ofalign_of 函数:

rust
use std::mem;

struct Example {
    a: i32,
    b: bool,
    c: u16,
}

fn main() {
    let example = Example { a: 10, b: true, c: 20 };
    let size = mem::size_of::<Example>();
    let align = mem::align_of::<Example>();
    println!("Size of Example is {} bytes, alignment is {} bytes", size, align);
}

在上述代码中,首先定义了一个结构体 Example,其中包含一个 i32 类型字段、一个 bool 类型字段和一个 u16 类型字段。 接着,在 main 函数中创建了一个 Example 类型的变量 example。 使用 mem::size_of 函数和 mem::align_of 函数分别求出 Example 类型的大小和对齐方式,并输出到控制台。

在这个例子中,我们可以看到,Example 类型的大小为 8 字节,而其对齐方式为 4 字节(在本地测试中)。 这是因为 i32 类型和 u16 类型各自占用 4 字节和 2 字节,加起来总共 10 字节,需要在内部填充 2 字节的空间,才能满足 4 字节的对齐要求。

获取填充的字节大小

我们可以使用 Rust 标准库中的 mem::size_of_val()mem::align_of_val(),来计算上个例子中 padding(填充)字节大小。具体来说,需要执行以下步骤:

  1. 调用 mem::size_of_val(&example) 函数获取 example 实例的总大小,包括 padding 字节。
  2. 调用 mem::align_of_val(&example) 函数获取 example 实例的对齐方式,并计算出该对齐方式下的 padding 字节大小。
  3. 用总大小减去实际占用空间大小,即可得到 padding 字节大小。

代码如下:

rust
use std::mem;

struct Example {
    a: i32,
    b: bool,
    c: u16,
}

fn main() {
    let example = Example { a: 10, b: true, c: 20 };
    let size = mem::size_of_val(&example);
    let align = mem::align_of_val(&example);
    let used = mem::size_of::<Example>();
    let padding = size - used;
    println!("Padding bytes of Example is {} bytes", padding);
}

在运行该程序时,输出结果为:

txt
Padding bytes of Example is 0 bytes

说明 Example 结构体中不存在 padding 字节。这是因为,在默认情况下,Rust 编译器会尝试以最紧凑的方式排列结构体中的成员变量,从而避免不必要的内存浪费。 如果需要手动控制结构体成员变量的排列顺序和对齐方式,可以使用 Rust 提供的一些属性如 #[repr(C)]#[repr(packed)] 等。

内存对齐

对齐(alignment)是指内存中变量的存储位置必须满足的一种要求。 在现代计算机架构中,变量的存储位置必须按照一定的规则进行对齐,其目的是为了提高内存读写速度和处理器性能。

对于某些数据类型,如 i32f64 等,它们需要以固定的字节格式存储,因此内存地址必须按照特定的字节数进行对齐,否则可能会导致读写操作无法正常进行,甚至出现程序崩溃等问题。 另一方面,某些计算机体系结构可以通过直接读取内存中的连续字节来提高处理速度,对齐要求也是为了支持这种优化。

在 Rust 中,对齐方式和内存布局有关。在内存中,每个变量都要占用一定的空间。 当内存中出现多个变量时,不同的对齐方式会影响它们的布局方式,进而影响内存的占用情况和读写效率。

在 Rust 中,默认情况下,数据类型的对齐方式是与其大小相对应的。

通常按照以下默认对齐规则进行:

  • u8i8boolchar 类型对齐到 1 字节边界。
  • u16i16 类型对齐到 2 字节边界。
  • u32i32f32 和指针类型对齐到 4 字节边界。
  • u64i64f64 类型对齐到 8 字节边界。

通常来说,一个数据类型的对齐方式是它包含的成员变量中对齐要求最高的那个。Rust 语言标准规定,任何变量都必须满足其类型的对齐要求,否则系统会强制对齐。

Rust 中,默认按照数据类型的大小进行对齐。通过 #[repr(packed)] 属性可以手动设置紧凑对齐方式。 在实际应用中,也可以通过调整数据结构布局和对齐方式来优化程序性能。

总结

通过本文的详细讲解,我们深入了解了 Rust 的内存布局机制。以下是关键要点的总结:

🎯 核心概念

  1. 栈 vs 堆

    • 栈:快速、自动管理、LIFO、大小限制
    • 堆:灵活、手动管理、随机访问、性能较慢
  2. 所有权系统

    • Copy:按位复制,适用于简单类型
    • Move:所有权转移,避免深拷贝
    • 借用:安全的引用机制
  3. 内存对齐

    • 提高访问性能
    • 避免硬件限制
    • 编译器自动优化

📊 类型选择速查表

需求推荐类型内存特点性能
简单值T栈分配最快
只读访问&T借用很快
可变访问&mut T独占借用很快
大型数据Box<T>堆分配
单线程共享Rc<T>引用计数中等
多线程共享Arc<T>原子计数中等
内部可变性RefCell<T>运行时检查稍慢
线程安全可变Mutex<T>锁机制最慢

⚡ 性能优化建议

  1. 优先使用栈分配:避免不必要的 Box<T>
  2. 选择合适的字符串类型
    • &str 用于字面量和借用
    • String 用于动态构建
    • Cow<str> 用于条件性拥有
  3. 合理使用智能指针
    • 单一所有权:Box<T>
    • 共享只读:Rc<T>/Arc<T>
    • 共享可变:RefCell<T>/Mutex<T>
  4. 避免循环引用:使用 Weak<T> 打破循环

🛡️ 安全性保证

Rust 的内存管理提供了以下安全保证:

  1. 内存安全:无空指针解引用、无缓冲区溢出
  2. 线程安全:编译时防止数据竞争
  3. 零成本抽象:安全性不牺牲性能
  4. 自动管理:无需手动释放内存

🔧 调试工具

在实际开发中,可以使用以下工具检查内存布局:

rust
use std::mem;

// 检查类型大小和对齐
println!("size: {}, align: {}",
    mem::size_of::<T>(),
    mem::align_of::<T>()
);

// 检查值的实际大小
println!("size_of_val: {}", mem::size_of_val(&value));

// 获取指针地址
println!("address: {:p}", &value);

🚀 进阶学习

掌握了基础内存布局后,建议继续学习:

  1. 异步编程FuturePin 的内存模型
  2. 并发原语ChannelAtomic 的实现
  3. 内存映射mmap、零拷贝技术
  4. 性能分析:使用 perfvalgrind 等工具
  5. 嵌入式开发no_std 环境下的内存优化

Rust 的内存管理系统是其核心竞争力,理解这些概念将帮助你编写更高效、更安全的代码。记住:安全、速度、并发 - Rust 让你不必在这三者之间做出妥协。

参考

【Rust 笔记】浅聊 Rust 程序内存布局

兔子写代码 - Rust 内存布局

Is repr(C) a preprocessor directive?

Data Layout

用了这么多年 Rust 终于搞明白了内存分布!

What and where are the stack and heap?

rust-memory-container-cs

rust-cheatsheet

通过编写太多的链表来学习 Rust

Released under the MIT License