手机版

百科生活 投稿

数据库技术,数据库技术与应用难不难(大数据开发必须掌握的四种数据库)

百科 2026-02-19 10:54:42 投稿 阅读:8586次

关于【数据库技术】:数据库技术(大数据数据库技术简介与分类分析),今天小编给您分享一下,如果对您有所帮助别忘了关注本站哦。

  • 内容导航:
  • 1、数据库技术(大数据数据库技术简介与分类分析)
  • 2、Java大数据:大数据开发必须掌握的四种数据库

1、数据库技术(大数据数据库技术简介与分类分析)

数据库技术(大数据数据库技术介绍及分类分析)

大数据生态

传统数据库技术与新数据库技术

从大的角度来看,数据库可以简单地分为两类:

●传统SMP架构数据库主要指传统关系型数据库,如DB2、Postgrel、MySQL等。

●新型数据库主要是指为支持大规模数量集、高并发要求和高可扩展性而诞生的新型数据库。包括当前大数据生态中的主流MPP、NoSQL、NewSQL数据库等

在这里,我还是想推荐一下我自己的大数据学习交流qq裙:957205962。裙子都是大数据开发的。如果您正在学习大数据,小编欢迎您的加入。每个人都是软件开发方。不时分享干货(仅与大数据开发相关),包括一份2018年最新大数据高级资料和我自己编写的高级开发教程,欢迎想深入大数据的高级和进阶小伙伴。

传统数据库和新数据库的主要区别之一是SMP架构VS分布式/并行

数据库理论基础

理论基础-服务器系统架构

●对称多处理器

SMP是对称多处理器架构的简称,意思是多个CPU对称工作,没有主次关系。每个CPU共享同一个物理内存,每个CPU对内存中的任意地址都有相同的访问路径(访问时间相同),所以SMP也叫UMA:统一内存访问)。

●NUMA(非统一内存访问)

NUMA是一种不对称的多处理结构,与SMP正好相反。当多个CPU工作时,对内存的访问路径是不同的。针对SMP架构下的多CPU扩展问题,提出了NUMA架构。

●大规模并行处理

与NUMA不同,MPP提供了另一种扩展系统的方式。它是一个从用户角度出发的服务器系统,由多个SMP服务器通过一定的节点互联网络连接起来,协同工作完成相同的任务。

SMP和NUMA都主要指向一个单一的计算机系统,而MPP则有些集群化

理论基础——ACID基础理论

低原子性(原子性)

整个事务要么成功,要么失败,避免了部分成功

低一致性(一致)

事务不会改变数据库中数据的一致性。例如,如果a+b=10被完全约束,并且事务改变了A,那么B也应该相应地改变

低独立性(相关)

也称为隔离,它意味着两个以上的事务不会交错,因为不可能导致数据不一致

耐用性低(耐用)

交易成功执行后,公司对数据库所做的更改将永久存储在数据库中,不会无故回滚

传统的基于关系模型的数据库遵循ACID的基本理论,而新的分布式数据库并不完全遵循这一理论

理论基础——分布式CAP理论

低一致性(一致)

也就是数据的一致性,也就是把的数据复制到N台机器上。如果有更新,N台机器的数据要一起更新

低可用性(可用性)

当集群中的一些节点无法写博客后,整个集群也可以响应客户端的读写请求

低分区容错(容差)

分区不会影响整个系统的运行

在这里,我还是想推荐一下我自己的大数据学习交流qq裙:957205962。裙子都是大数据开发的。如果您正在学习大数据,小编欢迎您的加入。每个人都是软件开发方。时不时分享干货(仅与大数据开发相关),宝博客收录了2018年最新大数据高级资料和高级开发教程,欢迎想要深入大数据的高级和进阶合作伙伴。

基于传统关系模型的数据库更注重CA,而新NoSQL数据库更注重CP和AP

2、Java大数据:大数据开发必须掌握的四种数据库

大数据的典型特征,包括数据量大、数据类型多、价值密度低等,而具备这样特征的数据,在进入到存储阶段时,就需要根据数据类型及场景,来匹配适当的数据存储解决方案。今天我们来讲讲Java大数据开发当中,必须掌握的四种数据库。

数据库技术,数据库技术与应用难不难(大数据开发必须掌握的四种数据库)

大数据时代的数据,我们可以大致分为结构化数据和非结构化数据。其中,结构化数据,主要是依靠传统的关系型数据库去存储,比如说Oracle、MySQL、PostgreSQL等,都是关系型数据库的代表。

而比结构化数据,更加庞大的非结构化数据(其中也包括半结构化数据),则主要依靠非关系型数据库来完成存储。对于大数据开发者而言,非关系型数据库(NoSQL)也有不同的类型,需要匹配不同的场景需求来进行选择。

MongoDB

数据库技术,数据库技术与应用难不难(大数据开发必须掌握的四种数据库)

MongoDB。可以说是大数据时代的数据库代表作了。MongoDB最大的特点是表结构灵活可变,字段类型可以随时修改。MongoDB中的每一行数据只是简单的被转化成Json格式后存储,没有表结构的限制。

没有表结构这一点,对于MongoDB来说,带来了优势,当然也存在一定的缺陷,比如说在多表查询、复杂事务等高级操作上,MongoDB就显得不够优秀了。

得益于MongoDB的这些特点,MongoDB很适合那些表结构经常改变,数据的逻辑结构又没那么复杂不需要多表查询操作,数据量又比较大的应用场景。

Redis

数据库技术,数据库技术与应用难不难(大数据开发必须掌握的四种数据库)

Redis是现在最热门的key-value数据库。Redis的最大特点当然就是key-value存储所带来的简单和高性能了。

所谓key-value存储,就是每一条记录只包含一个用于查询数据的Key,以及与之对应的存储数据的value,就如同现实生活中的门牌号与住户,而没有诸如表、字段这些常规数据库中必需有的复杂概念,所有的查询都仅仅依赖于key值。

得益于这种简单的结构,再加上Redis会把所有数据加载到内存中的,Redis相比常规数据库的读写性能得到了极大的提升。并且,Redis还支持数据持久化,list、set等多种数据结构,主从复制备份等功能,堪称简单易用。

同样地,因为数据结构的简单,Redis对复杂查询的支持也有限,不能支持多列查询、区段查询等。总的来说,Redis更适用于读写性能要求极高,且数据表结构简单、查询条件也同样简单的应用场景。

ElasticSearch

数据库技术,数据库技术与应用难不难(大数据开发必须掌握的四种数据库)

ElasticSearch,严格来说,其实不算是数据库,而是搜索引擎,这个产品本身也是围绕搜索来设计的。

ES的典型优势就是,支持全文搜索,在对中文的支持上也比较友好(单是中文分词器就有很多种)。ES通过建立倒排索引实现全文搜索,以实现对存入ES中的所有数据进行快速检索,就算是非常复杂的聚合查询也可以得到不错的性能。

当然,ES也同样有不足,最明显的就是字段类型无法修改、写入性能较低和高硬件资源消耗。这就注定了ES不适用于数据价值不高、对写入性能有要求、数据量大而成本受限的场景下。

Hbase

数据库技术,数据库技术与应用难不难(大数据开发必须掌握的四种数据库)

HBase作为Hadoop生态当中的重要组件,说是大数据必学,相信没有人会反对。HBase最大的优点,就是对海量数据的支持,以及极强的横向(存储容量)扩展能力。

Hbase的存储和Redis类似,为每一行数据定义一个key,之后所有的查询都依赖这个key进行。但是Hbase的不同在于,一行数据还可以有非常多的列项,数据会按照列进行分组和存储,同一列的数据存储在同一个地方。

HBase的列式存储特性带来了海量数据规模的支持和极强的扩展能力,但是也给数据的读取带来很大的局限。由于只有同一列族的数据才会被存放在一起,而且所有的查询都必须要依赖Key,这就使得很多复杂查询难以进行。

简单来说,HBase适合数据量极大,查询条件简单,列与列之间联系不大的轻查询应用场景。

小结一下:

以上四种,可以说是大数据开发必须掌握的四款数据库,能够满足绝大多数场景下的数据存储需求,不同的数据库适用于不同的场景,如何去选择就要考察开发者的选型能力了。

本文关键词:数据库技术的发展分为哪几个阶段,数据库技术是在什么基础上发展起来的,数据库技术三级考试难吗,数据库技术与应用学什么,数据库技术。这就是关于《数据库技术,数据库技术与应用难不难(大数据开发必须掌握的四种数据库)》的所有内容,希望对您能有所帮助!

本文链接:https://bk.89qw.com/a-271235

最近发表
网站分类