其他分享
首页 > 其他分享> > Bigtable 论文阅读

Bigtable 论文阅读

作者:互联网

Bigtable: A Distributed Storage System for Structured Data论文阅读

目录

谷歌在2003到2006年间发表了三篇论文

介绍了Google如何对大规模数据进行存储和分析。

这三篇论文开启了工业界的大数据时代,被称为Google的三驾马车

本文将剖析最后一篇论文的设计要点

背景

随着业余越做越大,数据密集性越来越突出,对数据库提出了更高的要求

传统的关系型数据库,已经不能满足大容量低延迟等要求

由此的设计目标为

架构

共四个角色

角色 实现
lock service Chubby
cluster manager one master server
data server many tablet servers
date storage GFS
users a library that is linked into every client

lock service

chubby的架构留坑会在另一篇论文阅读分享,其功能类似zk,简化如下:

其用途简化如下:

cluster manager

data server

date storage

users

数据模型

数据模型

用户可当做多维有序map,其kv映射关系如下

(row:string, column:string, time:int64) → string

在传统的structured data的基础上做的优化如下

Row

Tablet

通过选取key,可以稍微影响数据的物理分布

Column Family

Timestamp

存储层结构

WAL + Memtable + SSTable

WAL

Memtable

SStable

读流程

Tablet

分布

四层分布

detail:

![image-20210601230613381](/Users/zhangshihang/Library/Application Support/typora-user-images/image-20210601230613381.png)

分配

拓展性

容错性

一致性

优化细节

压缩方案

LOG

tablet 转移

Lessons

标签:tablet,column,论文,server,master,阅读,table,Bigtable,METADATA
来源: https://www.cnblogs.com/jamgun/p/14843345.html