17 Database Logging

发表于2024-10-31|更新于2024-10-31|DB

|阅读量:

Database Logging

Crash Recovery

Actions during normal txn processing to ensure that the DBMS can recover from a failure
Actions after a failure to recovver the database to a state that ensures atomicity, consistency, and durability

Failure Classification

Transaction Failures

Logical Errors: 事务因为一些内部原因没有完成（完整性约束失效）
Internal State Errors: DBMS 必须终止一个活跃的事务因为一个错误的条件（死锁）

System Failures

Software Failure: OS 或者 DBMS 实现的错误
Hardware Failure:

the computer hosting the DBMS crahsed(电源线被拉了)
Fail-stop Assumption: 非易失性存储的内容被假设不会被 system crash 破坏

Storage Media Failures

Non-Repairable（无法修复的） Hardware Failure

head crash 或者相似的磁盘 failure 破坏了所有或者部分的 non-volatile storage
重建被假设可以被 detectable(磁盘控制器使用校验和来检测错误)

数据库不能从这种错误中恢复数据

UNDO VS. REDO

Steal Policy

似乎否允许 DBMS 允许一个未提交的事务覆盖最近提交的数据

Steal: is allowed
No-steal: is not allowed

Force Policy

是否一个 DBMS 要求事务的所有更新都在事务提交之前反应到 non-valaile 存储中

Force: is required
NO-force: is not required

Combination

NO-STEAL + FORCE

不必 undo，因为改变还未写入磁盘；
不必 redo，因为所有的改变在提交时已经确保写入磁盘

Shadow Paging 实际上在副本上进行修改，事务 commit 后，将 master 清空并将 shadow 作为新的 master

STEAL + NO-FORCE

维护一个 log 包含了事务对数据库的改变

WAL PROTOCOL

在数据写入磁盘前，对数据进行操作的日志必须先落盘

每次事务提交需要等待 log 落盘，这可能会成为瓶颈；所以 DBMS 使用 group commit optimization 来 batch multiple log flushed；这会提高吞吐量

如果 buffer 满了，写磁盘

如果超时了，写磁盘（5ms）

Logging Schemes

逻辑日志需要重新执行语句，成本过于高昂；Physiological 在页级别是物理的，但是页内部只记录修改的数据

Checkpoints

多频繁地进行检查点的设置是一个 tradeoff

Blocking/Consistent Checkpoint Protocol

暂停所有查询
将所有的 WAL 记录落盘
将所有在 Buffer Pool 中的更改的页落盘
在 WAL 中写入并落盘
恢复查询

文章作者: LZY

文章链接: http://tom-jerr.github.io/2024/10/31/CMU15445/17-Database_Logging/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 LZY的Code生活！

相关推荐

10-Join Algorithm

11 Query Execution

13 Concurrency Control Theory

14 Two Phase Lock

12 Query Planning and Optimization

15 Timestamp Ordering Concurrency Control