往 mongodb存儲的所有數據,都是為了需要讀取的時候能夠取出。
但讀取除了按某一列比如分數: 排序 讀取;還會出現我只看某一段時間、某個班的條件篩選;還會出現我想看每個班平均分 聚合 求平均....等等多樣操作
這些操作都可以通過 find_one()、find() 完成:
ret2find = collect.find_one() # {'_id': ObjectId('5ea780bf747e3e128470e485'), 'class_name': '高三(1)班', 'student_name': '張三', 'subject': '英語', 'score': 100, 'date': '20200301'} ret2find = collect.find() # <pymongo.cursor.Cursor object at 0x0000024BBEBE15C8>
從上面的結果可以看出,find_one() 查詢得出單一字典;find()則是一個生成器對象能夠通過 for val in ret2find: 遍歷取出
但能取出全部數據還不夠,查詢一般是會帶條件、甚至復雜的條件 —— 比如:查詢出 高三(1)班,張三 或 李四,成績大于90 的科目,該怎么做呢?
ret2find = collect.find({"class_name":"高三(1)班","score":{"$gt":90},"$or":[{"student_name":"張三"},{"student_name":"李四"}]}) for val in ret2find: print(val)
這一段 寫法 表示 “高三(1)班 且 分數 > 90”;
而 $gt 比較操作符,表 大于意思,除 $gt 操作符以外還有:
符號 | 含義 |
$lt | 小于 |
$lte | 小于等于 |
$gt | 大于 |
$gte | 大于等于 |
$ne | 不等于 |
$in | 在范圍內 |
$nin | 不在范圍內 |
這一段 寫法 表示 “學生名稱為 張三 或 李四”
而其中的 $or 邏輯操作符,用它來表示條件之間的關系。除了 $or 以外的邏輯操作符還有:
符號 | 含義 |
$and | 按條件取 交集 |
$not | 單個條件的 相反集合 |
$nor | 多個條件的 相反集合 |
$or | 多個條件的 并集 |
符號 | 含義 | 示例 | 示例含義 |
$regex | 正則匹配 | {"student_name":{"regex":".?三"}} | 學生名以 “三” 結尾 |
$expr | 允許查詢中使用 聚合表達式 | {"expr":{"gt":["spent","budget"]}} | 查詢 花費 大于 預算 的超支記錄 |
$exists | 屬性是否存在 | {"date":{"$exists": True}} | date屬性存在 |
$type | 類型判斷 | {"score":{"$type":"int"}} | score的類型為int |
$mod | 取模操作 | {'score': {'$mod': [5, 0]}} | 分數取5、0的模 |
更多 查詢操作符 可以點擊 查看官方文檔
lista_a = [] for info in db.get_collection("dbs").find(): lista_a.append(info) print("info nums=",len(info)) '''結果顯示''' '''info nums=101'''
The MongoDB server returns the query results in batches. The amount of data in the batch will not exceed the maximum BSON document size. To override the default size of the batch, see batchSize() and limit().
New in version 3.4: Operations of type find(), aggregate(), listIndexes, and listCollections return a maximum of 16 megabytes per batch. batchSize() can enforce a smaller limit, but not a larger one.
find() and aggregate() operations have an initial batch size of 101 documents by default. Subsequent getMore operations issued against the resulting cursor have no default batch size, so they are limited only by the 16 megabyte message size.
For queries that include a sort operation without an index, the server must load all the documents in memory to perform the sort before returning any results.
find()和aggregate()操作的初始批處理大小默認為101個文檔。針對生成的游標發出的后續getMore操作沒有默認的批處理大小,因此它們僅受16mb消息大小的限制。 對于包含沒有索引的排序操作的查詢,服務器必須在返回任何結果之前加載內存中的所有文檔來執行排序。
lista_a = [] for info in db.get_collection("dbs").find().batch_size1(5000): #修改最大限制閾 lista_a.append(info) print("info nums=",len(info))
lista_a = [] cousor=db.get_collection("dbs").find().batch_size1(5000) for i in range(50000): #修改最大限制閾 lista_a.append(next(cousor))