给定 n个区间 [,],要求合并所有有交集的区间。
注意如果在端点处相交,也算有交集。
输出合并完成后的区间个数。
例如:[1,3]和 [2,6]可以合并为一个区间 [1,6]。
输入格式
第一行包含整数 n。
接下来 n行,每行包含两个整数 l和 r。
输出格式
共一行,包含一个整数,表示合并区间完成后的区间个数。
数据范围
1≤n≤100000,
≤≤≤
输入样例:
5
1 2
2 4
5 6
7 8
7 9
输出样例:
3
#include<iostream>
#include<vector>
#include<algorithm>
using namespace std;
typedef pair<int,int> PII;vector<PII> segs;void merge(vector<PII>& segs){//这里注意引用符号,关于引用的用法我前面有说过,这里就不说了。vector<PII> res;//定义装结果区间的vector数组res。sort(segs.begin(),segs.end());/*在操作之前,先将输入的一个个区间给排序,这里要注意,我们是用的vector<PII> segs;来存的,是pair<int,int>,相当于输入的{l,r}就是一个元素,数组里面有多少个元素,就说明有多少个区间,这一点我会在我写的博客里面细讲的。*/int st = -2e9,ed = -2e9;/*初始化定义开始值和结束值为-2e9,定义为-2e9是因为输入的是l,r两个,这里相当于定义的是无效值的感觉,说明此时还没有开始,区间里面还没有值。*/for(auto seg : segs){if(ed < seg.first){/*我的理解是:这个ed是当前操作区间的末尾点ed,而seg.first则是当前操作区间的下一个枚举区间,当当前操作区间的末尾点ed小于下一个枚举区间的开头seg.first的时候,就说明当前操作区间与下一个枚举区间之间没有交集,既然没有交集,那就将当前操作区间放入结果vector数组res里面。*/if(st != -2e9) res.push_back({st,ed});//当前操作区间{st,ed}直接插入进去。/*刚开始我们初始化了st=-2e9,满足条件,要将当前操作区间放入结果数组里面的时候,要注意,不能让st等于初始值-2e9,不然会报错。*/st = seg.first,ed = seg.second;//将当前操作区间放入结果数组后,将st和ed两个更新为下一个枚举区间的st,ed的值,准备下一次操作}else ed = max(ed,seg.second);/*如果满足上面的条件,那就说明两个区间之间有交集,那么这个时候st是不动的,只需要将ed更新为两个区间中最大的那个ed值即可,就是求两个集合的并集。*/ }if(st != -2e9) res.push_back({st,ed});/*注意,当遍历循环次数结束的时候,最后得到的那个区间是没办法加入到结果数组res里面的,所以这里判断,如果st不为初始值的化,那么就把此时的{st,ed}结果区间给插进去,就可以了。而且这个还有一个作用就是防止输入的区间是空的。*/segs = res;/*将得到的结果数组覆盖之前的segs数组,最后方便输出。所以这里可以看出来,res数组只是一个中间变量而已。*/
}int main(){int n;cin>>n;for(int i=0;i<n;i++){int l,r;cin>>l>>r;segs.push_back({l,r});/*定义这个segs(vector)类型的是因为每一次输入的数都不一样,随着输入次数的变化。segs里面的内容也会随着变化,所以这种存变化的数据的就用可变数组vector来存。*/}merge(segs);/*输入之后就想着合并,注意,我们segs刚开始是存储的所有的输入的序列,为了输出和各方面的方便,我们也segs来作为结果输出,那么想做到这样就是在一个函数里面把结果给得到,然后把结果复制给segs,把segs原有的给覆盖,最后就可以输出了,就是下面的cout那句话了。*/cout<<segs.size()<<endl;/*res结果区间复制给segs区间,覆盖他,最后输出里面有几个区间元素就得到了结果了。*/return 0;
}
注意事项:
1、
这句代码 sort(segs.begin(), segs.end());
是用来对容器 segs
中的元素进行排序的。具体来说:
segs
是一个存储区间的容器,比如一个 vector<pair<int, int>>
。
sort(segs.begin(), segs.end());
会对容器 segs
中的所有元素进行排序。
排序的细节
如果 segs
是 vector<pair<int, int>>
,那么 sort
函数会按照 pair
的第一个元素(即每个区间的起始位置 l
)进行排序。如果第一个元素相同,则会按照第二个元素(即每个区间的结束位置 r
)进行排序。
这意味着,排序后的 segs
会按照区间的起始位置升序排列,如果起始位置相同,则按照结束位置升序排列。
示例
假设 segs
的内容是:
vector<pair<int, int>> segs = {{3, 5}, {1, 4}, {2, 6}};
经过 sort(segs.begin(), segs.end());
后,segs
将变成:
{{1, 4}, {2, 6}, {3, 5}}
排序后的结果是按每个区间的起始位置从小到大排列的。如果两个区间的起始位置相同,则按结束位置排序。
相当于说一个区间就是一个元素,因为我们使用的就是pair<int,int>来存的,就是说我们每次输入的{l,r}就是一个元素,千万不要理解为每个数来排序,这样理解是错误的哦。
2、对于ed < seg.first这个判断条件的理解
操作区间(Current Interval):通常表示你当前正在处理或操作的区间。这可能是一个动态的区间,随着程序的执行而不断变化。
枚举区间(Enumerated Interval):这是你用来比较的固定区间,通常是从某些数据结构中提取出来的或者是预定义的。
ed < seg.first
的含义
ed < seg.first
这一条件表示你正在将操作区间的结束点 ed
与枚举区间的起始点 seg.first
进行比较。这通常用于确定操作区间是否与枚举区间有重叠或者是否有关系。
如果 ed < seg.first
:这表明操作区间的结束点在枚举区间的开始点之前。这可能意味着当前的操作区间在时间上或者逻辑上完全在枚举区间的左侧,没有交集。
如果操作区间和枚举区间有交集,则会有条件处理或者更新操作区间的逻辑。这是因为交集可能需要合并、分割或其他操作来正确处理数据。
ed
代表当前操作区间的结束点,而 seg.first
代表枚举区间的起始点。这种比较通常用于判断操作区间与枚举区间是否有重叠,进而决定如何处理这些区间的逻辑。
3、总结:
初始化 st
和 ed
为 -2e9
是为了表示当前没有有效的区间。
遍历区间并根据是否重叠或相邻来决定是否将区间添加到结果中。
处理最后一个区间是为了确保最后一个有效区间被包含在结果中。
4、是否可以省略 if (st != -2e9) res.push_back({st, ed});
?
不能省略。在处理不重叠的区间时,我们需要确保当前的区间被正确地添加到结果中。初始值 -2e9
的作用是标记“无效”状态,所以当 st
不等于 -2e9
时,说明我们已经有一个有效的区间需要被添加到结果中。