内存管理¶
约 7303 个字 6 张图片 预计阅读时间 37 分钟
MMU负责把虚拟地址转换成物理地址
程序的装入与链接¶
用户程序要在系统中运行,必须先将程序和数据装入内存。主要经过以下三个步骤:
-
编译 (Compile):将源代码编译成目标模块。
-
链接 (Link):将目标模块和库函数链接成装入模块。
- 装入 (Load):将装入模块装入内存。
装入方式¶
-
绝对装入 (Absolute Loading)
-
特点:编译时就确定了绝对地址。
-
适用:单道程序环境。
-
-
可重定位装入 (Static Relocation)
-
特点:在装入时一次性完成地址转换。
-
缺点:作业装入后不能移动,也不能动态申请内存。
-
-
动态运行时装入 (Dynamic Relocation)
-
特点:在程序执行时才进行地址转换。
-
硬件支持:需要重定位寄存器。
-
优点:允许程序移动(便于紧凑),支持动态申请内存,便于共享。
-
链接方式¶
-
静态链接 (Static Linking)
- 运行前链接成完整程序。
-
装入时动态链接 (Load-time Dynamic Linking)
- 边装入边链接。便于更新和共享。
-
运行时动态链接 (Run-time Dynamic Linking)
-
执行到该模块时才进行链接。
-
优点:加快装入,节省内存(未用到的模块不装入)。
-
Swapping (交换技术)¶
交换技术的原理非常简单:进程可以暂时从内存中被调出 (Swap Out) 到磁盘的交换区,在之后需要运行的时候再加载回内存 (Swap In)。
Info
-
交换区 (Backing Store)
- 通常是磁盘上的一个独立分区(如 Linux Swap)。
- 为了追求速度,通常直接管理磁盘块,不经过普通文件系统。
-
性能开销
-
主要瓶颈是磁盘 I/O 传输时间。
-
传输时间与被交换出的内存大小成正比。
-
优化:只在内存吃紧时启动;只交换阻塞/睡眠状态的进程。
-
-
挂起的 I/O (Pending I/O) 问题
-
场景:进程 A 正在等待 I/O(如读磁盘数据到缓冲区),此时若将 A 换出,内存分给进程 B。I/O 设备回来写数据时,会错误地写入 B 的空间。
-
解决方案:
- 禁止交换:有挂起 I/O 的进程不准换出。
- 双重缓冲 (Double Buffering):I/O 操作使用内核缓冲区。数据先到内核,再拷贝到用户进程。这样用户进程随时可换出。
-
-
现代 OS 的交换
-
标准交换(移动整个进程)已很少使用。
-
现代系统多结合分页,只交换页面 (Pages)。
-
移动端 (iOS/Android):通常不支持交换(闪存寿命 & 空间限制),内存不足时直接杀后台进程。
-
连续内存分配¶
连续内存分配指的是为用户进程分配一个连续的内存空间来运行
单一连续分配¶
在本方法中,内存被分为两部分,低地址的系统区与高地址的用户区.
其中:
-
基址寄存器保存了最低的物理地址
-
限长寄存器保存了地址范围
在一个用户程序访问内存时,MMU会根据基址寄存器和限长寄存器来判断访问是否合法,并将访问的地址转换为物理地址.
这种方法的缺点是只适用于单道程序环境,无法实现进程的隔离.
固定分区分配¶
这种方法的思想是,把内存空间划分为一个个固定的块,每个块可以容纳一个进程.
划分分区时有两种不同的方法。
-
分区大小相等。程序太小会造成浪费,程序太大又无法装入。
-
分区大小不等。划分为多个较小的分区、适量的中等分区和少量大分区。
显然,这个方法会带来内部碎片的问题.当程序小于固定的分区大小时,会浪费掉剩余的空间.
动态分区分配¶
动态分区分配不预先划分内存,而是在进程装入内存时,根据进程的实际大小,动态地建立分区。
-
特点:分区的大小和数目是可变的。
-
缺点:会产生外部碎片(内存中存在许多细小的空闲块,但无法利用)。
虽然外部碎片可以通过紧凑技术(Compaction)来解决,但紧凑技术会带来额外的开销。
Definition
-
内部碎片(Internal Fragmentation):在进程内存空间中的未利用的碎片.例如,一个进程需要 100KB 的内存,但分配到的分区大小是 128KB,那么 28KB 就是内部碎片。
-
外部碎片(External Fragmentation):在进程分配到的内存之间的碎片.
例子:系统总空闲内存 70MB,但被分为不连续的 40MB 和 30MB 两块。此时若有进程需要 50MB,虽然总空闲够,但无法满足,这 40MB 和 30MB 就是外部碎片。
数据结构¶
操作系统需要记录哪些内存是空闲的,常用的数据结构有:
- 空闲分区表 (Free Partition Table):每个表项记录一个空闲分区的起始地址和长度。
- 空闲分区链 (Free Partition List):将空闲分区通过指针连成链表。
分配算法 (Allocation Algorithms)¶
分配算法负责选择一个空闲分区来分配给作业。
| 算法 | 策略 | 优点 | 缺点 |
|---|---|---|---|
| 首次适应 (First Fit) | 从低地址开始查找,找到第一个能满足大小的空闲分区。 | 最快(通常性能最好);保留了高地址的大块空闲区。 | 低地址部分容易产生细小碎片;每次查找都从头开始,增加查找开销。 |
| 最佳适应 (Best Fit) | 查找满足要求且最小的空闲分区。 | 每次分配后剩余的碎片最小。 | 产生大量无法利用的微小碎片(外部碎片);需要对空闲区排序(按大小递增)。 |
| 最坏适应 (Worst Fit) | 查找满足要求且最大的空闲分区。 | 每次分配后剩余的空闲区仍较大,可能还能用。 | 大块空闲区被迅速拆散,后续大作业来了没地放;需要排序(按大小递减)。 |
| 邻近适应 (Next Fit) | 从上次查找结束的位置开始继续查找(循环扫描)。 | 减少查找开销;空闲分区分布更均匀。 | 高地址的大块空闲区也被拆散了。 |
紧凑 (Compaction)¶
为了解决外部碎片问题,可以将内存中所有作业移动到一端,使原本分散的空闲小分区拼接成一个大分区。
-
前提:系统必须支持动态重定位(运行时动态装入)。
-
代价:需要移动大量数据,CPU 开销大。
分页分配¶
固定分区分配会产生内部碎片,而动态分区分配又会产生外部碎片。
分页技术 (Paging) 的主要目标是解决外部碎片问题。
-
无外部碎片:因为物理内存被划分为固定大小的页框,任何空闲的页框都可以分配给任何需要页面的进程,不需要连续的物理空间。
-
存在内部碎片:一页可能装不满
-
页框 (Frames):
- 将物理内存划分为固定大小的块,称为页框(或帧、物理块)。
-
大小通常是 2 的幂,介于 512 字节到 8192 字节之间。
-
实例:Linux 和 Windows (x86) 通常使用 4KB。
-
页 (Pages):
- 将逻辑内存划分为与页框大小相同的块,称为页。
地址转换的逻辑在很多课里都学过,流程为:
-
分解逻辑地址:CPU 生成的逻辑地址被自动划分为两部分:
-
页号 (Page Number, p):用于索引页表。
-
页内偏移量 (Page Offset, d):表示该地址在页内的位置(不改变)。
-
-
查页表 (Lookup Page Table):以页号 \(p\) 为索引,去查找页表。
-
获取页框号:从对应的页表项中取出该页所在的物理页框号 (Frame Number, f)。
-
合成物理地址:将物理页框号 \(f\) 与页内偏移量 \(d\) 拼接(或者说:物理地址 = \(f \times \text{页大小} + d\))。
TLB的内容就不多讲了,在这里
TLB 有效访问时间 (EAT) 计算¶
-
Associative Lookup = \(\epsilon\) time unit (快表访问时间)
-
Memory cycle time = \(t\) (内存访问时间)
-
Hit ratio (命中率) = \(\alpha\)
-
Percentage of times that a page number is found in the associative registers.
-
Ratio related to number of associative registers.
-
Effective Access Time (EAT):
-
Hit: \((t + \epsilon)\)
-
Miss: \((t + t + \epsilon)\) (查快表 + 查页表 + 访问数据)
共享页 (Shared Pages)¶
-
共享代码 (Shared Code):
-
一份只读 (read-only) 的代码副本(即重入代码/Reentrant Code或纯代码/Pure Code)在多个进程间共享。
-
典型的例子包括文本编辑器、编译器、窗口系统等。
-
共享代码必须出现在所有进程逻辑地址空间的相同位置。
-
-
私有代码和数据 (Private Code and Data):
-
每个进程保存一份独立的代码和数据副本。
-
私有代码和数据的页面可以出现在逻辑地址空间的任意位置。
-
Structure of Page Table¶
Hierarchical Paging (分级页表)¶
为什么需要分级页表?
考虑一个典型的 32 位系统:
-
逻辑地址空间: \(2^{32}\) Bytes (4GB).
-
页面大小: 4KB (\(2^{12}\) Bytes).
-
页表项大小: 4 Bytes.
计算单级页表的大小:
-
页表项数量: \(\frac{2^{32}}{2^{12}} = 2^{20}\) (1 Million entries).
-
页表总大小: \(2^{20} \times 4 \text{ Bytes} = 4 \text{ MB}\).
问题: 这就要求系统为每个进程分配 4MB 的连续内存空间 来存放页表。
-
在内存紧张或碎片化严重时,找到 4MB 的连续空间是困难的。
-
大多数程序只使用了一小部分地址空间,分配完整的 4MB 页表是巨大的浪费。
解决方案: 将页表再分页,形成多级页表 (Multilevel Page Table)。这样页表就可以分散在内存中,不需要连续存放,且可以按需分配。
RISC-V 分页机制实例 (Sv32 & Sv39)
Sv32 用于 32 位 RISC-V 系统,采用 二级页表 结构。
-
虚拟地址结构 (32位):
- VPN[1] (10 bits):一级页号 (Page Directory Index)。
- VPN[0] (10 bits):二级页号 (Page Table Index)。
- Offset (12 bits):页内偏移 (对应 4KB 页面)。
-
物理地址 (34位):支持 16GB 物理内存。
-
页表项 (PTE):4 Bytes。
-
寻址步骤:
-
satp 寄存器: 获取一级页表(页目录)的物理基地址。
-
一级查找: 使用 VPN[1] 索引一级页表,找到二级页表的物理基地址 (PPN)。
-
二级查找: 使用 VPN[0] 索引二级页表,找到最终物理页框号 (PPN)。
-
物理地址合成: 将最终 PPN 与 Offset 拼接,得到物理地址。
-
Sv39 用于 64 位 RISC-V 系统,采用 三级页表 结构。
-
虚拟地址结构 (39位):
- 虽然寄存器是 64 位的,但 Sv39 只使用低 39 位作为有效虚拟地址。
- VPN[2] (9 bits):一级页号。
- VPN[1] (9 bits):二级页号。
- VPN[0] (9 bits):三级页号。
- Offset (12 bits):页内偏移。
-
寻址步骤:
-
satp 寄存器: 获取一级页表(根页表)的物理基地址。
-
一级查找: 使用 VPN[2] 索引一级页表,找到二级页表的物理基地址。
-
二级查找: 使用 VPN[1] 索引二级页表,找到三级页表的物理基地址。
-
三级查找: 使用 VPN[0] 索引三级页表,找到最终物理页框号 (PPN)。
-
物理地址合成: 将最终 PPN 与 Offset 拼接,得到物理地址。
-
小tips
- 每级页表索引为 9 位,对应 \(2^9 = 512\) 个页表项。
- 在 64 位系统中,每个页表项 (PTE) 大小为 8 Bytes。
- 因此,一个页表的大小 = \(512 \times 8 \text{ Bytes} = 4096 \text{ Bytes} = 4\text{KB}\)。
- 结论:一个页表的大小正好等于一个物理页面的大小,这使得内存管理非常方便。
Hashed Page Table (哈希页表)¶
适用场景:
哈希页表主要用于地址空间非常大(例如 > 32位)的系统。在这些系统中,如果使用传统的分级页表,页表的级数会非常多,导致访问开销过大。
工作原理:
-
哈希函数: 使用虚拟页号 (Virtual Page Number, VPN) 作为哈希值,通过哈希函数映射到哈希表的一个条目。
-
链表结构: 哈希表的每个条目包含一个链表(因为可能存在哈希冲突)。
-
链表元素: 每个链表元素包含三个字段:
- (1) 虚拟页号 (VPN)。
- (2) 映射的物理页框号 (Frame Number)。
- (3) 指向链表中下一个元素的指针。
-
查找过程:
- 根据虚拟地址中的 VPN 计算哈希值。
- 在哈希表中找到对应的链表。
- 遍历链表,比较链表元素的 VPN 与目标 VPN。
- 如果匹配,取出对应的物理页框号,结合页内偏移量形成物理地址。
Inverted Page Table (反向页表)¶
传统页表的问题: 每个进程都有自己的页表。如果进程数很多,或者虚拟地址空间很大,页表本身会占用大量物理内存。
反向页表的设计:
-
全局唯一: 整个系统只有一个页表 (Inverted Page Table)。
-
面向物理内存: 表中的每一个条目对应物理内存中的一个页框 (Frame)。
- 如果有 1GB 内存,4KB 一页,则表中有 256K 个条目。
- 条目内容: 每个条目包含:
- 拥有该页面的进程 ID (pid)。
- 该页面的虚拟页号 (p)。
地址转换过程:
- CPU 生成虚拟地址
(pid, p, d)。 - 系统在反向页表中搜索,寻找匹配
(pid, p)的条目。 - 如果找到,该条目的索引
i就是物理页框号。 - 物理地址 = \(i \times \text{页大小} + d\)。
优缺点:
-
优点:
- 大幅节省内存:页表大小只与物理内存大小有关,与进程数量和虚拟地址空间大小无关。
-
缺点:
-
查找慢:因为表是按物理地址排序的,而我们是按虚拟地址查找,最坏情况可能需要遍历整个表。
-
共享困难:因为一个物理页框在表中只有一个条目,很难实现多个虚拟地址(不同进程)映射到同一个物理地址(共享内存)。
-
解决查找慢的方法:通常使用哈希表来加速查找。
-
分段 (Segmentation)¶
分段管理方式提供了一个用户视图的内存管理方案。逻辑地址空间是由一组段(Segments)构成的。
-
逻辑地址 (Logical Address):
- 由两部分组成:
<segment-number, offset>(段号, 段内偏移)。
- 由两部分组成:
-
段表 (Segment Table):
-
用于将二维的逻辑地址映射为物理地址。
-
每个段表项包含:
-
Base (基址): 该段在物理内存中的起始地址。
-
Limit (限长): 该段的长度。
-
-
-
硬件支持:
- Segment-table base register (STBR, 段表基址寄存器): 指向段表在内存中的位置。
-
Segment-table length register (STLR, 段表限长寄存器): 指示程序所使用的段的数量。
-
合法性检查: 对于段号
s,如果s < STLR,则该段号是合法的;否则产生越界中断。
段页式存储管理¶
分页存储管理能有效地提高内存利用率,而分段存储管理能反映程序的逻辑结构并有利于段 的共享和保护。
将这两种存储管理方法结合起来,便形成了段页式存储管理方式。
基本原理:
-
分段: 先将用户程序分成若干个段(反映逻辑结构)。
-
分页: 再把每个段分成若干个页(便于内存管理)。
-
内存分配: 以页为单位进行离散分配。
逻辑地址结构:
由三部分组成:<段号 S, 页号 P, 页内偏移 W>
数据结构:
-
段表: 每个段表项记录该段的页表始址和页表长度。
-
页表: 每个页表项记录该页对应的物理块号。
地址变换过程:
-
根据段号 \(S\) 查段表,得到该段对应的页表始址。
-
根据页号 \(P\) 查页表,得到该页对应的物理块号 \(f\)。
-
将物理块号 \(f\) 与页内偏移 \(W\) 拼接,形成物理地址。
虚拟内存¶
为了实现对虚拟内存的管理,有三种方法:
-
请求分页存储管理
-
请求分段存储管理
-
请求段页式存储管理
请求分页存储管理¶
请求分页也即是我们在Lab5中实现的,和懒加载类似,在没有用到的时候,进程仅拥有页表,而没有实际的内存空间,当需要访问的时候,才会将页面调入内存。
在运行过程中,如果程序访问的页面不在内存中,系统会触发缺页中断,由操作系统负责将缺失的页面从外存调入内存。如果内存已满,还需要利用页面置换算法将暂时不用的页面换出。
为了实现这一机制,系统需要在硬件层面提供更复杂的支持,主要包括扩展的页表机制、缺页中断机构和地址变换机构。
页表机制¶
在请求分页系统中,页表不仅要完成逻辑地址到物理地址的映射,还需要记录页面的状态(是否在内存、是否被修改等),以支持调页和置换。因此,页表项(PTE)在基本分页的基础上增加了若干字段:
| 页号 | 物理块号 | 状态位 P | 访问字段 A | 修改位 M | 外存地址 |
|---|---|---|---|---|---|
各字段含义如下:
-
状态位 (Present/Valid Bit, P):
- 用于标记该页是否已调入内存。
- \(P=1\):表示页面在内存中,可直接访问。
- \(P=0\):表示页面在外存中,访问时会触发缺页中断。
-
访问字段 (Accessed/Reference Bit, A):
- 记录页面最近是否被访问过,或者记录访问次数。
- 作用:供页面置换算法(如 LRU)参考,决定哪些页面是"最近未被使用"的,从而优先淘汰。
-
修改位 (Modified/Dirty Bit, M):
- 标记页面调入内存后是否被修改过。
- 作用:置换页面时,如果 \(M=1\),说明页面数据已变,必须将其写回外存以更新副本;如果 \(M=0\),说明页面未变,直接覆盖即可,无需写回,从而减少 I/O 开销。
-
外存地址:
- 指出该页在外存(通常是磁盘交换区)中的物理位置,以便在缺页时能找到并调入该页。
缺页中断机构 (Page Fault Mechanism)¶
当进程试图访问一个状态位 \(P=0\) 的页面时,硬件会产生缺页中断(Page Fault)。这是一种内部异常(Exception),其处理过程如下:
- 保护现场:CPU 暂停当前指令的执行,保存上下文。
-
分析原因:操作系统分析中断原因,确认是缺页。
-
查找空闲物理块:
-
若内存有空闲块,直接分配。
-
若内存已满,依据置换算法选择一个受害者页面(Victim Page)换出。如果该页被修改过(\(M=1\)),需先写回外存。
-
-
调入页面:启动磁盘 I/O,将所需页面读入选定的物理块。
-
更新页表:修改页表项,将状态位 \(P\) 置为 1,填入物理块号。
-
恢复执行:更新快表(TLB),恢复上下文,重新执行刚才那条产生缺页中断的指令。
Info
缺页中断与普通中断的一个重要区别是,缺页中断是在指令执行期间产生的,处理完成后需要重新执行该指令;而普通中断通常在指令执行结束后响应。
写时复制 (Copy on Write)¶
机制介绍
正如我们在实验5中所做的,写时复制实际上也是懒加载的一种表现.
-
当父进程调用
fork()创建子进程时,我们并不立刻为子进程分配页表 -
而是共享父进程的页表,但是所有页面都是只读的
-
当两个进程中有一个进程尝试写入这些只读页时,会触发一个缺页错误
-
OS会分配新的物理页,并将原页面的内容拷贝过去,并更新页表,将该页面的权限修改为可读写.
graph LR
style Stage1 fill:#f9f9f9,stroke:#333,stroke-dasharray: 5 5
style Stage2 fill:#f9f9f9,stroke:#333,stroke-dasharray: 5 5
style Stage3 fill:#f9f9f9,stroke:#333,stroke-dasharray: 5 5
subgraph Stage1 [阶段1: Fork后共享]
direction TB
P1[父页表] & P2[子页表] -->|只读| PageA[物理页A]
end
subgraph Stage2 [阶段2: 写入触发异常]
direction TB
WriteOp[写入尝试] -.->|缺页中断| Handler[OS复制]
end
subgraph Stage3 [阶段3: 复制并分离]
direction TB
P1_N[父页表] -->|读写| PageA_O[物理页A]
P2_N[子页表] -->|读写| PageB[物理页B,来自A的复制]
end
Stage1 -.-> Stage2 -.-> Stage3
页面置换算法¶
由于内存是有限的,所以当内存已满时,需要选择一个页面换出.
FIFO (先进先出算法)¶
基本思想:
选择在内存中驻留时间最长的页面进行置换。也就是说,最早进入内存的页面最先被淘汰。
实现:
系统维护一个链表,记录所有在内存中的页面。新调入的页面插到队尾,需要置换时淘汰队头的页面。
特点:
- 优点:实现简单,开销小。
- 缺点:性能较差。因为它没有考虑页面的访问频率,可能会淘汰经常被访问的页面(例如常用的全局变量或循环体代码),导致缺页率增加。
Belady 异常 (Belady's Anomaly):
FIFO 算法存在一个著名的反直觉现象:当分配给进程的物理帧数增加时,缺页次数反而可能增加。
Belady 异常示例
假设访问序列为:1, 2, 3, 4, 1, 2, 5, 1, 2, 3, 4, 5
- 3 个帧时:发生 9 次缺页。
- 4 个帧时:发生 10 次缺页。
注意:栈式算法(Stack Algorithms,如 LRU)绝不会出现 Belady 异常。只有 FIFO 这种基于队列的算法才会出现。
Optimal (最优置换算法 / OPT)¶
基本思想: 选择在最长时间内不再被访问的页面(Longest time until next reference)进行置换。
例如:对于访问序列为1, 2, 3, 4, 1, 2, 5, 1, 2, 3, 4, 5的进程,
当内存大小为3时,我们在第一次访问4时,替换3,因为3相比于1,2,下一次被访问的时间更远.
特点: * 理论最佳:该算法保证了最低的缺页率。 * 无法实现:因为它需要预知未来的页面访问序列,这在实际运行的系统中是不可能的。
作用: OPT算法常被用作其他置换算法的理论上限,帮助我们评估算法的性能。
LRU (最近最少使用算法 / Least Recently Used)¶
基本思想: 选择最长时间没有被访问的页面进行置换。
LRU 是对 OPT 算法的一种近似。虽然我们无法预知未来(OPT),但我们认为过去是未来的一个很好的预测指标(局部性原理):如果一个页面刚刚被访问过,那么它在不久的将来很可能再次被访问;反之,如果一个页面很久没被访问了,那么它在将来也很可能不会被访问。
实现: LRU 需要硬件支持来记录页面最近访问的时间,主要有两种实现方式:
-
计数器 (Counters):
- 给每个页表项添加一个时间字段。
- CPU 增加一个全局逻辑时钟或计数器。每次访问内存时,计数器递增。
- 每次访问页面时,将当前时钟值复制到该页的时间字段中。
- 置换时,查找时间字段最小的页面。
-
栈 (Stack):
- 维护一个页号栈。
- 每次访问一个页面,就将它从栈中取出(如果它已在栈中)并压入栈顶。
- 这样,栈底永远是最近最少使用的页面(置换目标),而栈顶是最近刚使用的页面。
- 注:可以用双向链表实现,更新如同移动节点,开销较小。
近似 LRU:附加引用位算法 (Additional-Reference-Bits Algorithm)¶
背景: 真正的 LRU 需要记录精确的访问顺序,硬件开销很大。很多系统只提供简单的引用位 (Reference Bit)。本算法利用引用位来近似 LRU 的行为。
原理:
-
历史记录:为每个内存页面在 OS 中保留一个 8位 (或其他大小) 的字节(移位寄存器),用于记录一段时间内的访问历史。
-
定期更新:
-
设置一个定时器中断(例如每 100ms)。
-
中断产生时,操作系统将每个页面的寄存器右移 (Right Shift) 一位(丢弃最早的那次记录)。
-
将该页面当前的 引用位 (Reference Bit) 的值,复制到寄存器的 最高位 (Most Significant Bit)。
- 随后将引用位清零。
-
-
置换决策:
-
将这 8 位寄存器看作一个无符号整数。
-
值越小,说明该页面在最近的这段时间内被访问的次数越少(或者访问时间越久远),因此它是 LRU 的极佳替补。
- 选择值最小的页面进行淘汰。
-
示例:
假设寄存器为 8 位,当前时刻:
-
页面 A:
11000100(值较大,最近经常用) -
页面 B:
01000000 -
页面 C:
00001100(值最小,最近没怎么用 -> 淘汰)
这种方法保留了最近 8 个时间周期的访问信息。
Clock 算法 (二次机会算法 / Second-Chance Algorithm)¶
基本思想: Clock 算法是 FIFO 的一种改进,旨在避免 FIFO 淘汰常用页面的问题。它使用 引用位 (Reference Bit) 来给那些最近被访问过的页面一次“重生的机会”。
数据结构: 将所有在内存中的页面组织成一个循环队列 (Circular Queue),并有一个指针(类似时钟的指针)指向下一个要检查的页面。
算法流程: 当需要置换页面时,指针开始扫描:
-
检查引用位:
-
如果当前页面的引用位为 0:说明它最近没被用过,直接淘汰,新页面占用此位置,指针移动到下一页。
-
如果当前页面的引用位为 1:说明它最近被用过,给它第二次机会。
-
将引用位清零 (置 0)。
-
指针移动到下一页,继续检查。
-
-
-
循环:
- 如果所有页面的引用位都是 1,指针会转一圈把它们都清零,最终回到起点时必定能找到一个引用位为 0 的页面进行淘汰(这就退化成了 FIFO)。
特点:
-
近似 LRU:虽然不记录准确时间,但能有效保留热点数据。
-
开销极低:只需很少的硬件支持(1位)和简单的逻辑。
-
是现代操作系统(如 Unix, Linux, Windows)中广泛使用的基础算法。
示意图:
graph LR
subgraph Clock[Clock 队列]
direction LR
P1((页1: 1)) --> P2((页2: 0))
P2 --> P3((页3: 1))
P3 --> P4((页4: 0))
P4 --> P1
end
Hand[指针 Hand] --> P2
style P2 fill:#ffcccc,stroke:#333,stroke-width:2px
note[当前指向 页2: 引用位=0 -> 淘汰!]
Hand -.-> note
抖动(Thrashing)¶
抖动指在页面置换的过程中,刚刚换出内存的页面又要被换入,刚刚换入内存的页面又要被换出,如此往复,造成缺页率非常高
抖动发生的根本原因是进程拥有的物理页帧太少.
工作集 (Working Set)
工作集是指在某段时间间隔 \(\Delta\) 内,进程实际访问的页面集合。
- 工作集窗口 (Working Set Window, \(\Delta\)):一个固定的时间窗口(例如过去 10,000 次内存访问)。
- 工作集大小 (Working Set Size, \(WSS\)):工作集中页面(不重复)的数量。
即:\(WSS_i\) = 进程 \(P_i\) 在窗口 \(\Delta\) 内访问的不同页面数。
- 跟踪工作集(维护窗口 \(\Delta\) 内的页面集合)开销较大,实现复杂。通常使用近似方法(如借助引用位和定时中断)来估算。
工作集模型利用局部性原理来解决抖动问题。
基本思想:
-
操作系统应该监控每个进程的工作集大小 (\(WSS\))。
-
进程只有在为其分配的帧数 \(\ge WSS\) 时,才会被允许运行。
-
如果所有进程的 \(WSS\) 之和 (\(D = \Sigma WSS_i\)) 大于物理内存的总帧数 (\(M\)),则说明系统即将发生(或已经发生)抖动。
-
策略:当 \(D > M\) 时,操作系统选择一个进程将其挂起 (Suspend)(即 Swap Out),释放它的所有页帧给其他进程使用,从而防止抖动。
内存映射文件 (Memory-Mapped Files)¶
实际上,内存映射文件就是虚拟内存的应用,其中用到了按需加载
内存映射文件是一组允许我们将磁盘上的文件映射到进程的虚拟地址空间中的机制。
基本原理:
-
映射: 操作系统保留一段虚拟地址空间,并将其与文件关联。此时并不立即加载数据。
-
缺页: 当进程第一次访问这段内存时,产生缺页中断。
-
加载: 操作系统从磁盘读取对应的文件页到物理内存,并更新页表。
-
访问: 后续对该内存的读写操作就像访问普通内存一样,不再需要
read()或write()系统调用。
优点:
-
编程简化: 程序员可以像操作数组一样操作文件,无需频繁使用
fseek等。 -
性能提升: 避免了传统 I/O 中数据在内核缓冲区和用户缓冲区之间的多次拷贝。
-
便于共享: 多个进程可以映射同一个文件,从而实现共享内存通信。
数据回写:
- 修改后的数据并不会立即写入磁盘,而是由操作系统定期或在文件关闭 (
msync/munmap) 时写回。





