BigTable

 

Bigtable发布让2006年,启发了森之NoSQL数据库,比如:Cassandra、HBase等等。

Cassandra架构中产生一半凡模拟Bigtable,包括了数据模型、SSTables以及提前写日记(另一半凡是仿Amazon的Dynamo数据库,使用点对点集群模式)。

BigTable 是起在 GFS 和 MapReduce 之上的。每个Table都是一个多维的稀疏图

以管住巨大的Table,把Table根据行分割,这些分割后底数码统称为:Tablets。每个Tablets大概发生
100-200 MB,每个机器存储100只左右的 Tablets。底层的架是:GFS。

由GFS是同一种植分布式的文件系统,采用Tablets的编制后,可以获取酷好之载重均衡。比如:可以把常响应的阐明动至其它空闲机器上,然后很快重建。

 

来自百度百科

BigTable是Google设计的分布式多少存储系,用来处理海量的数的如出一辙种植非关系型的数据库。

简介

igTable是免关系项目数据库,是一个疏散的、分布式的、持久化存储的多维度排序Map。Bigtable的统筹目的是快捷且保险地拍卖PB级别的数,并且能部署至上千贵机器上。

Bigtable已经落实了以下的几乎单对象:适用性广泛、可扩大、高性能和高可用性。

Bigtable已经在超越60单Google的出品与类别上赢得了下,包括 Google
Analytics、GoogleFinance、Orkut、Personalized
Search、Writely和GoogleEarth。这些活对Bigtable提出了截然不同的需要,有的需要强吞吐量的批处理,有的尽管要立即响应数据为最终用户。它们运的Bigtable集群的部署也闹充分可怜之差别,有的集群只发生几乎大服务器,而有些则用上千高服务器、存储几百TB底数额。

 

特点

每当过剩端,Bigtable和数据库很类似:它采取了重重数据库的实现政策。相互数据库和内存数据库业已具备可扩展性和大性能,但是Bigtable提供了一个暨这些体系了两样之接口。

Bigtable不支持完整的关系数据模型;与的相反,Bigtable为客户提供了简要的数据模型,利用这个模型,客户可以动态控制数据的布与格式(alex注:也就算是对BigTable而言,数据是没有格式的,用数据库领域的术语说,就是数据尚未Schema,用户自己去定义Schema),用户为可以自己想(alex注:reasonabout)底层存储多少的岗位相关性(alex注:位置相关性可以如此敞亮,比如树状结构,具有相同前缀的数量的存放位置接近。在读取的时刻,可以管这些数据一致破读取出来)。数据的下标是实行与排的讳,名字可以是擅自的字符串。

Bigtable将存储的数据都视为字符串,但是Bigtable本身不失去分析这些字符串,客户程序通常会当管各种结构化或者半结构化的数码串行化到这些字符串里。通过缜密选择数据的模式,客户可以控制数据的职位相关性。最后,可以通过BigTable的模式参数来控制数据是存在内存中还是硬盘上。

特点:

1、适合广大海量数据,PB级数据;

2、分布式、并发数据处理,效率极高;

3、易于扩展,支持动态伸缩;

4、适用于廉价设备;

5、适合为读操作,不入写操作。

6、不适用于人情涉嫌项目数据库;

 

应用:

BigTable为谷歌旗下之探寻、地图、财经、打印、以及社交网站Orkut、视频共享网站YouTube暨博客网站Blogger顶工作提供技术支持。

2010年9月,Google宣布用放弃MapReduce。新索引系统将迁移至BigTable平台。新平台因Colossus,也受称为GFS2。

 

网站地图xml地图