PyMongo 查询数据的实现

Glory ·

更新时间:2024-11-15

· 561 次阅读

查询数据

设置查询条件

更多查询操作

PS：pymongo最大查询限制

解决方案

查询数据

往 mongodb存储的所有数据，都是为了需要读取的时候能够取出。
但读取除了按某一列比如分数：排序读取；还会出现我只看某一段时间、某个班的条件筛选；还会出现我想看每个班平均分聚合求平均....等等多样操作
这些操作都可以通过 find_one()、find() 完成：


ret2find = collect.find_one()
# {'_id': ObjectId('5ea780bf747e3e128470e485'), 'class_name': '高三（1）班', 'student_name': '张三', 'subject': '英语', 'score': 100, 'date': '20200301'}
ret2find = collect.find()
# <pymongo.cursor.Cursor object at 0x0000024BBEBE15C8>

从上面的结果可以看出，find_one() 查询得出单一字典；find()则是一个生成器对象能够通过 for val in ret2find: 遍历取出

设置查询条件

但能取出全部数据还不够，查询一般是会带条件、甚至复杂的条件 —— 比如：查询出高三（1）班，张三或李四，成绩大于90 的科目，该怎么做呢？


ret2find = collect.find({"class_name":"高三（1）班","score":{"$gt":90},"$or":[{"student_name":"张三"},{"student_name":"李四"}]})
for val in ret2find:
    print(val)

上面有两个要点：

{"class_name":"高三（1）班","score":{"$gt":90}}

这一段写法表示 “高三（1）班且分数 > 90”；
而 $gt 比较操作符，表大于意思，除 $gt 操作符以外还有：

符号含义

$lt	小于
$lte	小于等于
$gt	大于
$gte	大于等于
$ne	不等于
$in	在范围内
$nin	不在范围内

{"$or":[{"student_name":"张三"},{"student_name":"李四"}]}

这一段写法表示 “学生名称为张三或李四”
而其中的 $or 逻辑操作符，用它来表示条件之间的关系。除了 $or 以外的逻辑操作符还有：

符号含义

$and	按条件取交集
$not	单个条件的相反集合
$nor	多个条件的相反集合
$or	多个条件的并集

更多查询操作

除了上述常规操作外，具体使用场景中我们还会用到：

符号含义示例示例含义

$regex	正则匹配	{"student_name":{"regex":".∗三"}}	学生名以 “三” 结尾
$expr	允许查询中使用聚合表达式	{"expr":{"gt":["spent","budget"]}}	查询花费大于预算的超支记录
$exists	属性是否存在	{"date":{"$exists": True}}	date属性存在
$exists	属性是否存在	{"date":{"$exists": True}}	date属性存在
$type	类型判断	{"score":{"$type":"int"}}	score的类型为int
$mod	取模操作	{'score': {'$mod': [5, 0]}}	分数取5、0的模

更多查询操作符可以点击查看官方文档

PS：pymongo最大查询限制

在用pyhton遍历mongo数据中时候，发限查询到101行就会阻塞，如下


    lista_a = []
    for info in db.get_collection("dbs").find():
        lista_a.append(info)
        print("info nums=",len(info))
'''结果显示'''
'''info nums=101'''

分析原因：mongodb的find()方法返回游标cursor，可能有一个限制阈值101，参考文档，如下

原文：

The MongoDB server returns the query results in batches. The amount of data in the batch will not exceed the maximum BSON document size. To override the default size of the batch, see batchSize() and limit().

New in version 3.4: Operations of type find(), aggregate(), listIndexes, and listCollections return a maximum of 16 megabytes per batch. batchSize() can enforce a smaller limit, but not a larger one.

find() and aggregate() operations have an initial batch size of 101 documents by default. Subsequent getMore operations issued against the resulting cursor have no default batch size, so they are limited only by the 16 megabyte message size.

For queries that include a sort operation without an index, the server must load all the documents in memory to perform the sort before returning any results.

翻译：

MongoDB服务器批量返回查询结果。批处理中的数据量不会超过最大BSON文档大小。要覆盖批处理的默认大小，请参见batchSize()和limit()。
新版本3.4:类型为find()、aggregate()、listIndexes和listCollections的操作每批最多返回16兆字节。batchSize()可以执行较小的限制，但不能执行较大的限制。
find()和aggregate()操作的初始批处理大小默认为101个文档。针对生成的游标发出的后续getMore操作没有默认的批处理大小，因此它们仅受16mb消息大小的限制。对于包含没有索引的排序操作的查询，服务器必须在返回任何结果之前加载内存中的所有文档来执行排序。

解决方案


    lista_a = []
    for info in db.get_collection("dbs").find().batch_size1(5000): #修改最大限制阈
        lista_a.append(info)
        print("info nums=",len(info))

但是这种方法是每次游标返回5000条数据，循环遍历，如果单词查找50000次应该怎么写呢？如下


   lista_a = []
   cousor=db.get_collection("dbs").find().batch_size1(5000)
    for i in range(50000): #修改最大限制阈
        lista_a.append(next(cousor))

到此这篇关于PyMongo 查询数据的实现的文章就介绍到这了,更多相关PyMongo 查询数据内容请搜索软件开发网以前的文章或继续浏览下面的相关文章希望大家以后多多支持软件开发网！

数据 pymongo

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

css3进阶之less实现星空动画的示例代码

Valarie 2020-03-04

959

详解css栅格系统在项目中的灵活运用

Ursula 2020-04-01

908

el-table表格动态合并相同数据单元格(可指定列+自定义合并)

Rachel 2023-07-20

1437

vuex页面刷新数据丢失解决方法详解

Psyche 2023-07-20

216

Vue3中是如何实现数据响应式示例详解

Winola 2023-07-20

1347

sessionStorage多Tab标签页数据共享问题分析

Gella 2023-07-20

数据结构之带头结点的单链表

Grizelda 2023-07-20

1827

C++各种输出数据类型详解

Janna 2023-07-20

623

Golang基于Vault实现敏感数据加解密

Ophelia 2023-07-21

1848

用Python进行数据清洗以及值处理

Crystal 2023-07-21

283

Python常用的数据清洗方法详解

Laila 2023-07-21

1301

Python multiprocessing.value实现多进程数据共享的示例

Aine 2023-07-21

1131

深入探究python中Pandas库处理缺失数据和数据聚合

Bliss 2023-07-21

191

Python中Pandas库的数据处理与分析

Lillian 2023-07-21

155

pandas删除重复数据简单方法

Tertia 2023-07-21

311

详解C#如何将枚举以下拉数据源的形式返回给前端

Olive 2023-07-21

797

Flutter中跨组件数据传递的方法总结

Angie 2023-07-21

906

python简单几步实现时间日期处理到数据文件的读写

Nora 2023-07-24

926

Python采集二手车数据的超详细讲解

Pandora 2023-07-24

294

Python实战使用XPath采集数据示例解析

Diane 2023-07-24

1433

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座