答案:MongoDB通过聚合管道实现数据统计,常用$group、$match等操作符进行分组、过滤和计算,支持总数统计、分类计数、均值求和及时间序列分析,结合索引与$match可优化性能,推荐使用countDocuments精确计数。

在 MongoDB 中进行数据统计,主要通过聚合管道(Aggregation Pipeline)来实现。它提供了强大且灵活的方式来处理和分析集合中的数据,支持分组、过滤、排序、计算等操作。
使用聚合管道(aggregate)进行统计
聚合是 mongodb 最常用的统计方式,通过 $group、$match、$project 等阶段组合完成复杂统计任务。
常见统计需求及对应操作:
- 统计文档总数:使用
$group配合$sum - 按字段分组统计:比如按地区、时间、状态等分类计数
- 计算平均值、最大值、最小值、求和:使用
$avg、$max、$min、$sum - 筛选后再统计:先用
$match过滤数据
示例:统计用户表中各性别的数量
db.users.aggregate([
{ $group: { _id: “$gender”, count: { $sum: 1 } } }
])
返回结果类似:
{ “_id” : “男”, “count” : 150 }
{ “_id” : “女”, “count” : 130 }
简单计数:count 方法
如果只是统计满足条件的文档数量,可以直接使用 countDocuments() 方法。
db.Collection.countDocuments({ status: “active” })
该方法会精确统计符合条件的文档数,推荐用于需要准确数量的场景。旧版的 count() 已不推荐使用。
结合日期或范围做统计
常用于分析趋势,比如每日注册用户数。
db.users.aggregate([
{
$group: {
_id: {
year: { $year: “$createdAt” },
month: { $month: “$createdAt” },
day: { $dayOfMonth: “$createdAt” }
},
count: { $sum: 1 }
}
}
])
这样可以按天汇总数据,便于绘制图表或分析趋势。
性能优化建议
大数据量下统计可能较慢,注意以下几点:
- 确保查询字段有索引,尤其是用于
$match和$group的字段 - 尽量先用
$match缩小数据集,再进行分组计算 - 避免在大集合上全表扫描,合理设计聚合流程
基本上就这些。MongoDB 的统计能力依赖聚合框架,掌握常用操作符和结构后,能应对大多数数据分析需求。实际使用时结合具体业务调整查询逻辑即可。