数据存储概念详解

数据存储定义

数字信息有两种类型: 输入数据和输出数据。 用户提供输入数据, 计算机提供输出数据。 但如果没有用户输入,计算机的 CPU 就无法进行任何计算或产生任何输出数据。 

用户可以直接向计算机输入数据。 然而,人们在计算机时代的早期就发现,不断地手动输入数据非常耗时耗力。 一种短期解决方案是计算机内存,也称为随机存取存储器 (RAM)。但它的存储容量和保留时间是有限的。 只读存储器 (ROM) 顾名思义,存储在其中的数据只能读取,未必可以编辑。 它们控制着计算机的基本功能。 

尽管计算机内存技术取得了进展,出现了动态 RAM (DRAM) 和同步 DRAM (SDRAM),但它们仍然受到成本、容量和保留时间的限制。 当计算机关机时,RAM 保留数据的能力也随之消失。 那么有何解决方案呢? 答案是数据存储。 

通过数据存储空间,用户可以将数据保存到设备上。 当计算机关机时,数据仍得以保留。 用户可以指示计算机从存储设备中提取数据,而无需手动将数据输入计算机。 计算机可根据需要从各种来源读取输入数据,然后再创建输出,并将其保存到相同的源位置或其他存储位置。 用户还可以与他人共享数据存储。  

数据存储的工作原理

数据存储的工作原理是通过将数据写入存储设备,然后保持数据的完整性和可用性,使得用户可以随时访问和使用这些数据。 数据存储有两个基本要素: 数据所采取的形式,以及记录和存储数据的设备。


数据存储设备

数据存储设备是指用来存储数据的物理设备;
数据存储设备分为两大类: 直接区域存储基于网络的存储。 

直接区域存储也称为直连存储 (DAS),直接附加存储方式与我们普通的PC存储架构一样,外部存储设备都是直接挂接在服务器内部总线上,数据存储设备是整个服务器结构的一部分。 DAS 也可以提供良好的本地备份服务,但共享功能有限。

DAS 设备包括软盘、光盘 (CD 和 DVD)、硬盘驱动器 (HDD)、闪存驱动器和固态驱动器 (SSD)。 

 DAS存储方式主要适用以下环境:

1)小型网络
因为网络规模较小,数据存储量小,且也不是很复杂,采用这种存储方式对服务器的影响不会很大。并且这种存储方式也十分经济,适合拥有小型网络的企业用户。
2)地理位置分散的网络
虽然企业总体网络规模较大,但在地理分布上很分散,通过SAN或NAS在它们之间进行互联非常困难,此时各分支机构的服务器也可采用DAS存储方式,这样可以降低成本。
3)特殊应用服务器
在一些特殊应用服务器上,如微软的集群服务器或某些数据库使用的原始分区,均要求存储设备直接连接到应用服务器。

基于网络的存储支持多台计算机通过网络对其进行访问,因此更有利于数据共享和协作。 它的异地存储能力也使其更适合备份和数据保护。

有两种常见的基于网络的存储设置:网络连接存储 (NAS) 和存储区域网络 (SAN)。 

NAS(Network Attached Storage) 通常是由冗余存储容器组成的单个设备,或是独立磁盘冗余阵列 (RAID) ,它采用独立于服务器,单独为网络数据存储而开发的一种文件服务器来连接所存储设备,自形成一个网络。这样数据存储就不再是服务器的附属,而是作为独立网络节点而存在于网络之中,可由所有的网络用户共享。

NAS的优点:

1)真正的即插即用
NAS是独立的存储节点存在于网络之中,与用户的操作系统平台无关,真正的即插即用。
2)存储部署简单
NAS不依赖通用的操作系统,而是采用一个面向用户设计的,专门用于数据存储的简化操作系统,内置了与网络连接所需要的协议,因此使整个系统的管理和设置较为简单。
3)存储设备位置非常灵活
4)管理容易且成本低
NAS数据存储方式是基于现有的企业而设计的,按照TCP/IP协议进行通信,以文件的I/O方式进行数据传输。

NAS的缺点:
(1)存储性能较低 (2)可靠度不高

SAN(Storage Area Network)存储方式创造了存储的网络化。存储网络化顺应了计算机服务器体系结构网络化的趋势。SAN的支撑技术是光纤通道(FC Fiber Channel)技术。它是ANSI为网络和通道I/O接口建立的一个标准集成。FC技术支持HIPPI、IPI、SCSI、IP、ATM等多种高级协议,其最大特性是将网络和设备的通信协议与传输物理介质隔离开,这样多种协议可在同一个物理连接上同时传送。

SAN 存储可以是由多台不同类型的设备所组成的网络,包括 SSD 和闪存存储、混合存储、混合云存储、备份软件和设备以及云存储

SAN的硬件基础设施是光纤通道,用光纤通道构建的SAN由以下三个部分组成:

1)存储和备份设备:包括磁带、磁盘和光盘库等。
2)光纤通道网络连接部件:包括主机总线适配卡、驱动程序、光缆、集线器、交换机、光纤通道和SCSI间的桥接器
3)应用和管理软件:包括备份软件、存储资源管理软件和存储设备管理软件。

SAN的优势:

1)网络部署容易;
2)高速存储性能。因为SAN采用了光纤通道技术,所以它具有更高的存储带宽,存储性能明显提高。SAN的光纤通道使用全双工串行通信原理传输数据,传输速率高达1062.5Mb/s。
3)良好的扩展能力。由于SAN采用了网络结构,扩展能力更强。光纤接口提供了10公里的连接距离,这使得实现物理上分离,不在本地机房的存储变得非常容易。 

三种存储方式比较

存储应用最大的特点是没有标准的体系结构,这三种存储方式共存,互相补充。

从连接方式上对比:

DAS采用了存储设备直接连接应用服务器,具有一定的灵活性和限制性;
NAS通过网络(TCP/IP,ATM,FDDI)技术连接存储设备和应用服务器,存储设备位置灵活,随着万兆网的出现,传输速率有了很大的提高;
SAN则是通过光纤通道(Fibre Channel)技术连接存储设备和应用服务器,具有很好的传输速率和扩展性能。
三种存储方式各有优势,相互共存,占到了磁盘存储市场的70%以上。
SAN和NAS产品的价格仍然远远高于DAS.许多用户出于价格因素考虑选择了低效率的直连存储而不是高效率的共享存储。


存储设备的类型

SSD 和闪存

闪存是一种固态技术,它使用闪存芯片来写入和存储数据。 固态磁盘 (SSD) 闪存驱动器使用闪存来存储数据。 与 HDD 相比,固态系统没有移动部件,因此延迟更低,所需的 SSD 更少。 由于大多数现代 SSD 基于闪存,因此闪存已成为固态系统的代名词。

混合存储

SSD 和闪存提供比 HDD 更高的吞吐量,但全闪存阵列的价格较高。 许多组织机构采用混合方法,将闪存的速度与硬盘驱动器的存储容量结合在一起。 平衡的存储基础架构使公司能够针对不同的存储需求应用恰当的技术。 它提供了一种经济实惠的方式来告别传统的 HDD 模式,而无需完全采用闪存。

云储存

与将文件存储到本地硬盘驱动器或存储网络相比,云存储提供了一种经济实惠且可扩展的替代方案。 云服务提供商允许您将数据和文件保存在异地位置,然后通过公共互联网或专用私有网络连接进行访问。 提供商负责托管、保护、管理和维护服务器及相关基础架构,并确保您在需要时能够随时访问数据。

混合云存储

混合云存储结合了私有云和公共云元素。 借助混合云存储,组织机构可以选择将数据存储在哪种云上。 例如,具有严格归档和复制要求的高度管制数据通常更适合存储到私有云环境。 而敏感性不高的数据可以存储在公共云中。 一些组织机构借助混合云中的公共云存储来补充其内部存储网络。

备份软件和设备

备份存储和设备可防止因灾难、故障或欺诈而造成数据丢失。 它们定期将数据和应用程序副本复制到单独的辅助设备,然后使用这些副本进行灾难恢复。 备份设备可以是 HDD、SSD、磁带驱动器、服务器等等,但备份存储也可以作为服务提供,也就是所谓的备份即服务 (BaaS)。 与大多数“即服务”解决方案一样,BaaS 提供了一种保护数据的低成本选项,以易于扩展的方式将数据保存在远程位置。

数据存储的形式

有三种主要形式来记录和存储数据:​ 文件存储、块存储和对象存储。

文件存储

文件存储也称为文件级或基于文件的存储,是一种用于组织和存储数据的分层存储方法。 换言之,数据存储在文件中,文件被组织在文件夹中,文件夹则被组织在目录和子目录的层次结构下。

块存储

块存储有时也称为块级存储,是一种用于将数据存储成块的技术。 这些块随后作为单独的部分存储,每个部分都有一个唯一的标识符。 对于需要快速、高效和可靠的数据传输的计算场景,开发人员倾向于使用块存储。

对象存储

对象存储通常称为基于对象的存储,是一种用于处理大量非结构化数据的数据存储架构。 这些数据无法轻易组织到具有行和列的传统关系数据库中,或不符合其要求。 具体示例包括电子邮件、视频、照片、网页、音频文件、传感器数据以及其他类型的媒体和 Web 内容(文本或非文本)。

到这里,相信诸位对数据存储有了初步的认识。想了解更多有趣有料的信息

 欢迎扫码关注小F(ID:iamfastone)获取更多最新最全的信息。


我们有个 为应用定义的研发云平台

集成多种行业应用,大量任务多节点并行

应对短时间爆发性需求,连网即用

跑任务快,原来几个月甚至几年,现在只需几小时

5分钟快速上手,拖拉点选可视化界面,无需代码

支持高级用户直接在云端创建集群


扫码免费试用,送200元体验金,入股不亏~

更多电子书

欢迎扫码关注小F(ID:iamfastone)获取

你也许想了解具体的落地场景:

王者带飞LeDock!开箱即用&一键定位分子库+全流程自动化,3.5小时完成20万分子对接
这样跑COMSOL,是不是就可以发Nature了
Auto-Scale这支仙女棒如何大幅提升Virtuoso仿真效率?
1分钟告诉你用MOE模拟200000个分子要花多少钱
LS-DYNA求解效率深度测评 │ 六种规模,本地VS云端5种不同硬件配置
揭秘20000个VCS任务背后的“搬桌子”系列故事
155个GPU!多云场景下的Amber自由能计算
怎么把需要45天的突发性Fluent仿真计算缩短到4天之内?

5000核大规模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina对接2800万个分子

从4天到1.75小时,如何让Bladed仿真效率提升55倍?
从30天到17小时,如何让HSPICE仿真效率提升42倍?

关于为应用定义的云平台:

和28家业界大佬排排坐是一种怎样的体验?
这一届科研计算人赶DDL红宝书:学生篇
杨洋组织的“太空营救”中, 那2小时到底发生了什么?
速石科技获元禾璞华领投数千万美元B轮融资
一次搞懂速石科技三大产品:FCC、FCC-E、FCP
速石科技成三星Foundry国内首家SAFE™云合作伙伴
Ansys最新CAE调研报告找到阻碍仿真效率提升的“元凶”
【2021版】全球44家顶尖药企AI辅助药物研发行动白皮书
国内超算发展近40年,终于遇到了一个像样的对手
帮助CXO解惑上云成本的迷思,看这篇就够了
花费4小时5500美元,速石科技跻身全球超算TOP500

相关推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注

微信扫一扫

微信扫一扫

微信扫一扫,分享到朋友圈

数据存储概念详解
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close