MongoDB系列教程（八）：GridFS存储详解

Eliza ·

更新时间:2024-11-11

· 515 次阅读

GridFS简介

mongoDB的文档以BSON格式存储，支持二进制的数据类型，当我们把二进制格式的数据直接保存到mongoDB的文档中。但是当文件太大时，例如图片和视频等文件，每个文档的长度是有限的，于是mongoDb会提供了一种处理大文件的规范--GridFS。

GridFS实现原理

在GridFS数据库中，默认使用fs.chunks 和fs.files来存储文件，其中fs.files集合存放文件的信息，fs.chunks存放文件的数据,一个fs.files集合中的一条记录内容如下，即一个file信息如下所示：
代码如下:
{
"_id" : ObjectId("4f4608844f9b855c6c35e298"),       //唯一id，可以是用户自定义的类型
"filename" : "CPU.txt",      //文件名
"length" : 778,      //文件长度
"chunkSize" : 262144,    //chunk的大小
"uploadDate" : ISODate("2012-02-23T09:36:04.593Z"), //上传时间
"md5" : "e2c789b036cfb3b848ae39a24e795ca6",      //文件的md5值
"contentType" : "text/plain"     //文件的MIME类型
"meta" : null    //文件的其它信息，默认是没有”meta”这个key，用户可以自己定义为任意BSON对象
}

对应fs.chunks中的chunk（中文意思数据块），如下所示：
代码如下:
{
"_id" : ObjectId("4f4608844f9b855c6c35e299"),    //chunk的id
"files_id" : ObjectId("4f4608844f9b855c6c35e298"), //文件的id，对应fs.files中的对象，相当于fs.files集合的外键
"n" : 0,     //文件的第几个chunk块，如果文件大于chunksize的话，会被分割成多个chunk块
"data" : BinData(0,"QGV...")     //文件的二进制数据，这里省略了具体内容
}

默认大小是256k，所以把文件存入到GridFS过程中，如果文件大于chunksize，则把文件分割多个chunk，再把这些chunk保存在fs.chunks中，最后再把文件信息存入fs.files中。

在读取文件的时候，先根据查询的条件，在fs.files中找到一个合适的记录，得到“_id”的值，再根据这个值到fs.funks中查找所有files_id 为 _id 的chunk，并按照“n”排序，最后依次读取chunk中的“data”对象的内容，还原成原来的文件。

注：
1、GridFS不自动处理md5相同的文件，对于md5相同的文件，如果想在GridFS中只有一个存储，要用户处理，md5值的计算由客户端完成。
2、因为GridFS在上传文件过程中是先把文件数据保存到fs.chunks,最后再把文件的信息保存到fs.files中，所以如果上传文件过程中失败，有可能在fs.chunks中出现垃圾数据，这些垃圾数据，可以定期清理掉。

您可能感兴趣的文章:深入了解MongoDB是如何存储数据的PHP操作MongoDB GridFS 存储文件的详解PHP MongoDB GridFS 存储文件的方法详解Spring Boot集成Shiro并利用MongoDB做Session存储的方法详解Nodejs使用Mongodb存储与提供后端CRD服务详解python将MongoDB里的ObjectId转换为时间戳的方法python根据时间生成mongodb的ObjectId的方法深究从MongoDB的ObjectId中获取时间信息MongoDB批量将时间戳转为通用日期格式示例代码MongoDB存储时间时差问题的解决方法

gridfs MongoDB 教程

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Go 语言Map(集合)

Kara 2021-05-30

918

Django 模型

Eleanor 2021-03-08

662

PHP常见字符串操作函数与用法总结

Githa 2021-06-30

872

Visual Studio2022下Opencv的配置图文教程

Winola 2023-07-20

1690

Go语言tunny的workerWrapper使用教程示例

Dulcea 2023-07-21

1732

golang的tunny的用法示例教程

Malina 2023-07-21

1301

python库pydantic的入门简易教程

Tia 2023-07-21

295

C#创建Windows服务的图文教程

Lida 2023-07-21

845

C#连接SQL Sever数据库详细图文教程

Bonnie 2023-07-21

1971

IIS创建WEB服务的图文教程

Tia 2023-07-21

1627

DELL服务器配置RAID的教程

Lala 2023-07-21

1135

nginx正向代理的配置和使用教程

Tallulah 2023-07-21

439

idea搭建项目找不到Tomcat的解决方法(图文教程)

Crystal 2023-07-21

1280

Gradle属性设置及环境变量全面教程

Kersen 2023-07-21

485

Android连接MySQL数据库详细教程

Bonnie 2023-07-21

533

C#特性AttributeUsage简介与使用教程

Echo 2023-07-22

252

VMwareWorkstation16pro安装macos的图文教程

Phemia 2023-07-22

1138

docker存储目录迁移示例教程

Pelagia 2023-07-22

1183

宝塔通过composer安装TP依赖的详细教程(宝塔服务器)

Rhoda 2023-07-22

1436

Windows server 2019 批量创建用户的详细教程

Diane 2023-08-08

1728

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座