MongoDB遊標使用：遍歷查詢結果的正確姿勢

MongoDB遊標（Cursor）是查詢結果的“導航工具”，它讓我們可以高效地遍歷數據庫中的數據。和SQL中一次性返回所有結果不同，MongoDB的遊標是惰性執行的，只有在真正需要數據時纔會逐步獲取，這對處理大量數據非常友好。本文將用最簡單的方式，帶你掌握遊標遍歷的正確姿勢。

一、什麼是MongoDB遊標？¶

想象你在MongoDB中執行一條查詢，比如 db.collection.find()，這時候數據庫不會立刻把所有結果返回給你，而是先給你一個“遊標”——一個指向結果集的“指針”。只有當你開始遍歷這個遊標時（比如逐行讀取數據），MongoDB纔會真正從數據庫中拉取數據，然後逐步返回給你。

核心特點：
- 惰性執行：遊標創建時不查詢數據庫，直到開始遍歷才觸發實際查詢。
- 迭代器特性：每次只返回一條數據，避免一次性加載所有數據到內存，適合大數據量場景。

二、如何獲取遊標？¶

通過 find() 方法直接獲取遊標。例如，查詢 products 集合中所有文檔：

// 在MongoDB Shell中執行
var cursor = db.products.find(); // 此時未執行查詢，cursor是遊標對象

find() 還可以加查詢條件、排序、限制數量等，例如：

// 查詢價格大於1000的商品，按價格升序，只返回前10條
var cursor = db.products.find(
  { price: { $gt: 1000 } }, // 查詢條件
  { _id: 0, name: 1, price: 1 } // 只返回name和price字段
).sort({ price: 1 }).limit(10);

三、遍歷遊標：3種常用姿勢¶

遊標創建後，需要通過遍歷獲取數據。以下是初學者最常用的3種遍歷方式，各有適用場景。

1. `forEach()`：最簡單的遍歷方式（適合小數據量）¶

forEach() 是MongoDB Shell中最直觀的遍歷方法，直接傳入一個回調函數，每次返回一條文檔：

cursor.forEach(function(doc) {
  // doc就是當前遍歷到的文檔
  print("商品名稱：" + doc.name + "，價格：" + doc.price);
});

優勢：
- 無需手動處理循環邏輯，代碼簡潔。
- 自動處理遊標遍歷的終止條件（無更多數據時停止）。

2. `toArray()`：一次性獲取所有數據（僅適合小數據量）¶

toArray() 會將遊標中的所有數據一次性加載到內存，轉爲數組返回。適合數據量極小的場景（比如幾百條以內）：

var allDocs = cursor.toArray(); // 直接獲取所有數據到數組
allDocs.forEach(function(doc) {
  print(doc.name);
});

⚠️ 注意：
- 禁止用於大數據量！如果數據超過10萬條，toArray() 會導致內存溢出（OOM），甚至直接崩潰。
- 如果數據量較大，必須用迭代方式（如 forEach() 或 while 循環）逐步獲取。

3. `while` 循環 + `next()`：底層遍歷（適合大數據量）¶

遊標是可迭代對象，通過 next() 方法可以手動控制每次獲取一條數據。結合 while 循環，適合複雜場景：

while (cursor.hasNext()) { // 判斷是否還有下一條數據
  var doc = cursor.next(); // 獲取下一條文檔
  print(doc.name);
}

原理：
- cursor.hasNext()：檢查是否有未返回的數據。
- cursor.next()：返回當前文檔，並自動移動遊標到下一條。
- 當沒有更多數據時，next() 返回 null，循環終止。

四、遍歷遊標必知的“避坑指南”¶

遊標遍歷看似簡單，但實際操作中容易踩坑，以下是關鍵注意事項：

1. 警惕內存問題：大數據量別用 `toArray()`¶

toArray() 會一次性加載所有數據到內存，若數據量超過百萬級，會導致MongoDB服務或客戶端內存爆炸。
替代方案：用 forEach() 或 while 循環，每次只處理一條數據，處理完後釋放內存。

2. 遊標超時：別讓遍歷“等太久”¶

MongoDB遊標默認有超時時間（通常10分鐘）。如果遍歷過程中超過10分鐘未結束，遊標會自動失效，再次調用 next() 或 hasNext() 會拋出錯誤。
解決辦法：
- 遍歷前設置超時（僅MongoDB 3.4+支持）：

  var cursor = db.products.find().maxTimeMS(300000); // 設置超時5分鐘

對超大數據量，建議分批處理（每批1000條，處理完後重新創建遊標）。

3. 數據一致性：遍歷中數據會變嗎？¶

MongoDB遊標默認是快照讀（Read Concern: local），即遍歷過程中返回的數據是“某一時刻的快照”。如果遍歷期間原集合數據被修改（插入、更新、刪除），不會影響當前遊標。
- 例外：若原數據被刪除，遊標中仍可能返回該文檔（取決於操作時機），但MongoDB會保證遍歷結果的一致性。

4. 分頁別用 `skip()`，效率太低！¶

很多人用 skip() + limit() 做分頁，例如：

// 第1頁：跳過0條，取10條
db.products.find().skip(0).limit(10); 
// 第2頁：跳過10條，取10條
db.products.find().skip(10).limit(10);

問題：skip(n) 會從集合開頭開始數n條，大數據量下（如n=10萬），每次查詢會全表掃描，效率極低！
替代方案：用 _id 作爲“錨點”，例如：

// 上一頁最後一條的_id是lastId，下一頁從lastId之後開始
db.products.find({ _id: { $gt: lastId } }).limit(10);

用 _id 索引快速定位，避免全表掃描，效率提升百倍。

五、大數據量下的遍歷最佳實踐¶

處理百萬級甚至億級數據時，遊標遍歷需兼顧效率和內存：
1. 分批迭代：每次取1000-10000條數據，處理完後繼續下一批。
2. 避免全局遍歷：用 find().batchSize(1000) 控制每次從數據庫拉取的數據量（batchSize默認是101），減少網絡傳輸。
3. 異步處理：用Node.js或Python多線程/異步，將大任務拆分爲小任務並行處理（MongoDB驅動支持異步遊標）。

總結¶

遊標是MongoDB處理查詢結果的核心工具，它通過“惰性執行”和“迭代器特性”，讓我們能高效處理海量數據。關鍵是：
- 小數據量用 forEach() 快速遍歷；
- 大數據量用 while 循環 + next() 逐步獲取；
- 絕對別用 toArray() 加載大數據；
- 分頁優先用 _id 錨點，避免 skip()；
- 警惕遊標超時和內存溢出風險。

掌握這些，你就能像“導航”一樣輕鬆遍歷MongoDB數據，既高效又安全！

MongoDB遊標使用：遍歷查詢結果的正確姿勢

一、什麼是MongoDB遊標？¶

二、如何獲取遊標？¶

三、遍歷遊標：3種常用姿勢¶

1. forEach()：最簡單的遍歷方式（適合小數據量）¶

2. toArray()：一次性獲取所有數據（僅適合小數據量）¶

3. while 循環 + next()：底層遍歷（適合大數據量）¶