[Mongodb 5.0]聚合操作

本文对应Aggregation Operations — MongoDB Manual

正文

此章节主要介绍了Aggregation Pipeline，其实就是将若干个聚合操作放在管道中进行执行，每一个聚合操作的结果作为下一个聚合操作的输入，每个聚合指令被称为一个stage。

在正式开始学习聚合操作前，请先按照下面的方式在你的mongodb中创建数据可和插入记录：

首先通过创建数据库和表，我这里为了方便直接使用可视化工具Robo3T(官网推荐)来进行操作

然后直接通过下面指令添加记录

db.orders.insertMany( [{ _id: 0, name: "Pepperoni", size: "small", price: 19,quantity: 10, date: ISODate( "2021-03-13T08:14:30Z" ) },{ _id: 1, name: "Pepperoni", size: "medium", price: 20,quantity: 20, date : ISODate( "2021-03-13T09:13:24Z" ) },{ _id: 2, name: "Pepperoni", size: "large", price: 21,quantity: 30, date : ISODate( "2021-03-17T09:22:12Z" ) },{ _id: 3, name: "Cheese", size: "small", price: 12,quantity: 15, date : ISODate( "2021-03-13T11:21:39.736Z" ) },{ _id: 4, name: "Cheese", size: "medium", price: 13,quantity:50, date : ISODate( "2022-01-12T21:23:13.331Z" ) },{ _id: 5, name: "Cheese", size: "large", price: 14,quantity: 10, date : ISODate( "2022-01-12T05:08:13Z" ) },{ _id: 6, name: "Vegan", size: "small", price: 17,quantity: 10, date : ISODate( "2021-01-13T05:08:13Z" ) },{ _id: 7, name: "Vegan", size: "medium", price: 18,quantity: 10, date : ISODate( "2021-01-13T05:10:13Z" ) }
] )

上面插入的数据，用Robo3T的表格形式显示一下如下：

现在有了数据后，我们开始正式学习聚合操作相关的指令

运行聚合操作，使用的命令为

 db.collection.aggregate()

下面开始学习聚合相关的指令

$match
$match相当于sql中的where条件，来看例子：
例子：将表中，size字段为medium的记录查询出来
```
db.orders.aggregate( [{$match: { size: "medium" }}
] )
```

$group
$group就是分组的意思，看例子
例子：查找size为medium，并且对其进行分组显示
```
db.orders.aggregate( [// Stage 1: Filter pizza order documents by pizza size{$match: { size: "medium" }},// Stage 2: Group remaining documents by pizza name and calculate total quantity{$group: { _id: "$name", totalQuantity: { $sum: "$quantity" } }}
] )
```
在这个例子中我们就会看到聚合操作中所谓的pipeline的用法，例子中我们用了$match和$group两个指令，他们的执行是分为2个阶段(stage)，第一个阶段通过$match来进行数据的过滤，将满足的数据作为$group指令的输入，$group指令将$match的结果进行分组。后面的例子中全都是这种pipeline方式的聚合操作。
$project
$project用来指定只输出哪些字段，看例子
例子：查询name字段为Pepperoni的记录，并且只显示_id和name两个字段
```
db.orders.aggregate( [{ $match: { name: "Pepperoni"} },{ $project: { _id: 1, name: 1} }] )
```
通过$project我们指定结果中只显示_id和name字段，注意的是，在$match这个阶段输出的结果中包含了所有的字段，而只有在$project这个阶段，才将所以字段中的_id和name两个字段拿出来显示。
$sort
$sort就是就它上面阶段输出的内容进行排序的作用，看例子
例子：查询name字段为Pepperoni的记录按照_id进行排序，并且只显示_id和name两个字段.
```
db.orders.aggregate( [// Stage 1: Filter pizza order documents by date range{ $match: { name: "Pepperoni"} },{ $project: { _id: 1, name: 1}},{$sort:{_id:-1} // -1:倒序 | 1:正序}] )
```