Skip to content

18-746 存储系统

18-746 Storage Systems (Fall 2022): Syllabus (cmu.edu)

18-746 Storage Systems (Fall 2025): Syllabus (cmu.edu)

课程描述

存储系统是计算机系统中最迷人且最重要的部分之一。它们往往主导着系统的性能,而其他组件的故障通常通过从存储的数据中重新启动来解决。实际上,存储系统保存着大多数组织的“皇冠上的宝石”:它们的信息(从源代码到微软的软件,再到每个电子商务网站的销售数据库,以及推动大数据和机器学习革命的日志和索引)。在这一关键的计算机系统领域中,对优秀人才和更好解决方案的需求持续增长。

本课程涵盖了存储系统的设计、实现和使用,从单个存储设备的特性和操作到将它们与服务器和大规模分布式系统结合并使其发挥作用的操作系统、数据库和网络方法。在此过程中,我们将研究多个真实系统的案例研究、重要应用对存储系统的需求,以及趋势和新兴技术对未来存储系统的影响。

课程内容

  1. 概述 & Flash SSD操作
  2. 磁盘驱动操作
  3. 文件系统存储布局
  4. 缓存与文件系统完整性
  5. 磁盘阵列组织
  6. 数据中心NAND闪存SSD的当前和未来角色
  7. 分布式文件系统和NAS接口
  8. 软硬件协同设计扩展全闪存存储
  9. 极度可扩展的存储
  10. 可靠性增强技术
  11. 可扩展表存储
  12. 谷歌文件系统的演变
  13. 备份和数据保护
  14. LSM树及其应用
  15. Azure HPC Cache and vFXT

实验

https://github.com/Guo-lab/CloudFS_Design

https://github.com/Ishant89/CloudFS

Lec 1 概述 & Flash SSD操作 I

lec1.md

Lec 2 Flash SSD 操作 II

lec2.md

Lec 3 磁盘驱动操作

lec3.md

Lec 4: 文件系统存储布局

lec4.md

Lec 5: 文件系统的组织

lec5.md

Lec 6 文件系统组织:缓存和文件系统集成

lec6.md

Lec 7 缓存和文件系统集成

lec7.md

Lec 8 磁盘阵列组织

  • Operating Systems: Three Easy Pieces, CH38-RAIDs

  • [RAID: High-performance, Reliable Secondary Storage, 1994](lec9-RAID-High-performance, Reliable Secondary Storage.pdf)

  • [Disk Failures in the Real World: What Does an MTTF of 1,000,000 Hours Mean to You?](./lec8-Disk Failures in the Real World- What Does an MTTF of 1,000,000 Hours Mean to You?.pdf)

  • [Flash Reliability in Production: The Expected and the Unexpected, fast16](./lec8-Flash Reliability in Production- The Expected and the Unexpected.pdf)

lec8.md

Lec 9 磁盘阵列系统

  • [RAID: High-performance, Reliable Secondary Storage, 1994](lec9-RAID-High-performance, Reliable Secondary Storage.pdf)
  • [System Impacts of Storage Trends: Hard Errors and Testability, 2011](./lec9-System Impacts of Storage Trends- Hard Errors and Testability.pdf)
  • [Mean Time to Meaningless: MTTDL, Markov Models, and Storage System Reliability, 2010](./lec9-Mean Time to Meaningless- MTTDL, Markov Models, and Storage System Reliability.pdf)
  • Parity Lost and Parity Regained

lec9.md

Lec 10 分布式FS & NAS接口

lec10.md

Lec 11 多服务器分布式文件系统

GFS

PACEMAKER: Avoiding HeART attacks in storage clusters with disk-adaptive redundancy, 2020

lec11.md

Lec 12 Extremely scalable storage

GFS

lec12.md

'\

'

Lec 13 加强可靠性技术

lec13.md

Lec 14 可扩展的表存储

lec14.md

Lec 15 备份和数据保护

lec15.md

Lec 16 LSM树及其应用

lec16.md

Lec 17 Google文件系统革新

  • The Tail at Scale, 2013
  • [Using the CAS Standards in Assessment Projects, 2013](./lec17-Using the CAS Standards in Assessment Projects.pdf)

lec17.md