目录
1. 关联式容器
2. 键值对
3. 树形结构的关联式容器
4.set的介绍
接口count
接口lower_bound和upper_bound
insert插入接口
5.map的介绍
接口insert
接口operator[]
6.multiset
7.multimap
8.map和set相关OJ
1. 关联式容器
vector 、 list 、 deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面 存储的是元素本身。什么是关联式容器?它与序列式容器有什么区别?
关联式容器 也是用来存储数据的,与序列式容器不同的是,其 里面存储的是 <key, value> 结构的
键值对,在数据检索时比序列式容器效率更高(插入删除只需挪动指针,无需挪动数据,查找时间logN)
2. 键值对
用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量 key 和 value , key 代
表键值, value 表示与 key 对应的信息 。比如:现在要建立一个英汉互译的字典,那该字典中必然
有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应
该单词,在词典中就可以找到与其对应的中文含义。
SGI-STL中关于键值对的定义:
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair(): first(T1()), second(T2())
{}
pair(const T1& a, const T2& b): first(a), second(b)
{}
};
3. 树形结构的关联式容器
根据应用场景的不桶, STL 总共实现了两种不同结构的管理式容器:树型结构与哈希结构。 树型结
构的关联式容器主要有四种: map 、 set 、 multimap 、 multiset 。这四种容器的共同点是:使
用平衡搜索树 ( 即红黑树 ) 作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一
个容器。
4.set的介绍
T: set 中存放元素的类型,实际在底层存储 <value, value> 的键值对。Compare : set 中元素默认按照小于来比较Alloc : set 中元素空间的管理方式,使用 STL 提供的空间配置器管理
set中的底层使用二叉搜索树(红黑树)来实现
set中只放value,但在底层实际存放的是由<value, value>构成的键值对
set中的元素不可以重复。
set中查找某个元素,时间复杂度为:logN
set中的元素不允许修改(因为底层时二叉搜索树)
接口count
count和find的作用一样,都是用于查找set中是否存在某个元素。
其实count是为容器multiset设计的,其与set的区别在于multiset允许插入重复元素,此时count会返回被搜索元素的个数。
void test()
{set<int>s;for (int i = 1; i < 10; i++)s.insert(i);for (int i = 1; i < 10; i++){cout << i;if (s.count(i))cout << "is an element of s. \n";elsecout << "is not an element of s. \n";}
}
接口lower_bound和upper_bound
lower_bound返回大于等于目标值的迭代器,upper_bound返回大于目标值的迭代器。这里通常可以配合erase使用。
void test()
{set<int>s;for (int i = 1; i < 10; i++)s.insert(i);auto it1=s.lower_bound(1);auto it2=s.upper_bound(8);s.erase(it1,it2);//左开右闭for(auto ch:s){cout<<ch<<" ";}
}
insert插入接口
返回值为一个pair类型的变量,pair中存放的有两个变量,第一个为插入数据的迭代器,第二个如果插入成功为true,失败为false。
void test()
{set<int>s;for (int i = 1; i < 10; i++)s.insert(i);pair<set<int>::iterator,bool> p=s.insert(1);cout<<*p.first<<" "<<p.second<<endl;auto p2=s.insert(10);cout<<*p2.first<<" "<<p2.second<<endl;
}
5.map的介绍
1. map 是关联容器,它按照特定的次序 ( 按照 key 来比较 ) 存储由键值 key 和值 value 组合而成的元
素。
2. 在 map 中,键值 key 通常用于排序和惟一地标识元素,而值 value 中存储与此键值 key 关联的
内容。键值 key 和值 value 的类型可能不同,并且在 map 的内部, key 与 value 通过成员类value_type绑定在一起,为其取别名称为 pair: typedef pair<const key, T> value_type;
3. 在内部, map 中的元素总是按照键值 key 进行比较排序的。
4. map 中通过键值访问单个元素的速度通常比 unordered_map 容器慢,但 map 允许根据顺序对元素进行直接迭代( 即对 map 中的元素进行迭代时,可以得到一个有序的序列 ) 。
5. map 支持下标访问符,即在 [] 中放入 key ,就可以找到与 key 对应的 value 。
6. map 通常被实现为二叉搜索树 ( 更准确的说:平衡二叉搜索树 ( 红黑树 )) 。
接口insert
void test()
{map<string, string>dict;dict.insert(pair<string,string>("sort", "排序"));dict.insert(pair<string,string>("test", "测试"));for (auto& x : dict){cout << x.first << ":" << x.first << " ";}cout << endl;
}
这里也可以使用make_pair.
void test()
{map<string, string>dict;dict.insert(make_pair("sort", "排序"));dict.insert(make_pair("test", "测试"));for (auto& x : dict){cout << x.first << ":" << x.first << " ";}cout << endl;
}
接口operator[]
void test()
{string arr[] = { "西瓜","西瓜","香蕉","苹果","梨" };map<string, int>s;for (auto x : arr){s[x]++;}for (auto x : s){cout << x.first << ":" << x.second << endl;}
}
这里数组下标为key,获得值为value。如果key不存在,则插入,并且初始化value,并++,
存在就直接++。
6.multiset
1. multiset 是按照特定顺序存储元素的容器,其中元素是可以重复的。
2. 在 multiset 中,元素的 value 也会识别它 ( 因为 multiset 中本身存储的就是 <value, value> 组成
的键值对,因此 value 本身就是 key , key 就是 value ,类型为 T). multiset 元素的值不能在容器
中进行修改 ( 因为元素总是 const 的 ) ,但可以从容器中插入或删除。
3. 在内部, multiset 中的元素总是按照其内部比较规则 ( 类型比较 ) 所指示的特定严格弱排序准则
进行排序。
4. multiset 容器通过 key 访问单个元素的速度通常比 unordered_multiset 容器慢,但当使用迭
代器遍历时会得到一个有序序列。
5. multiset 底层结构为二叉搜索树 ( 红黑树 ) 。
注意:
1. multiset 中再底层中存储的是 <value, value> 的键值对
2. mtltiset 的插入接口中只需要插入即可
3. 与 set 的区别是, multiset 中的元素可以重复, set 是中 value 是唯一的
4. 使用迭代器对 multiset 中的元素进行遍历,可以得到有序的序列
5. multiset 中的元素不能修改
6. 在 multiset 中找某个元素,时间复杂度为 $O(log_2 N)$
7. multiset 的作用:可以对元素进行排序
void TestSet()
{int array[] = { 2, 1, 3, 9, 6, 0, 5, 8, 4, 7 };// 注意:multiset在底层实际存储的是<int, int>的键值对multiset<int> s(array, array + sizeof(array)/sizeof(array[0]));for (auto& e : s)cout << e << " ";cout << endl;return 0;
}
7.multimap
1. Multimaps 是关联式容器,它按照特定的顺序,存储由 key 和 value 映射成的键值对 <key,
value> ,其中多个键值对之间的 key 是可以重复的。
2. 在 multimap 中,通常按照 key 排序和惟一地标识元素,而映射的 value 存储与 key 关联的内
容。 key 和 value 的类型可能不同,通过 multimap 内部的成员类型 value_type 组合在一起,
value_type 是组合 key 和 value 的键值对 :
typedef pair<const Key, T> value_type ;
3. 在内部, multimap 中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对
key 进行排序的。
4. multimap 通过 key 访问单个元素的速度通常比 unordered_multimap 容器慢,但是使用迭代
器直接遍历 multimap 中的元素可以得到关于 key 有序的序列。
5. multimap 在底层用二叉搜索树 ( 红黑树 ) 来实现。
注意: multimap 和 map 的唯一不同就是: map 中的 key 是唯一的,而 multimap 中 key 是可以
重复的 。
multimap 中的接口可以参考 map ,功能都是类似的。
注意:
1. multimap 中的 key 是可以重复的。
2. multimap 中的元素默认将 key 按照小于来比较
3. multimap 中没有重载 operator[] 操作 ( 同学们可思考下为什么 ?) 。
4. 使用时与 map 包含的头文件相同:
8.map和set相关OJ
class Solution {
public:class Compare{public:// 在set中进行排序时的比较规则bool operator()(const pair<string, int>& left, const
pair<string, int>& right){return left.second > right.second;}};vector<string> topKFrequent(vector<string>& words, int k){// 用<单词,单词出现次数>构建键值对,然后将vector中的单词放进去,统计每
个单词出现的次数map<string, int> m;for (size_t i = 0; i < words.size(); ++i)++(m[words[i]]);// 将单词按照其出现次数进行排序,出现相同次数的单词集中在一块multiset<pair<string, int>, Compare> ms(m.begin(), m.end());// 将相同次数的单词放在set中,然后再放到vector中set<string> s;size_t count = 0; // 统计相同次数单词的个数size_t leftCount = k;vector<string> ret;for (auto& e: ms){if (!s.empty()){// 相同次数的单词已经全部放到set中if (count != e.second){if (s.size() < leftCount){ret.insert(ret.end(), s.begin(), s.end());leftCount -= s.size();s.clear();}else{break;}}}count = e.second;s.insert(e.first);}for (auto& e : s){if (0 == leftCount)break;ret.push_back(e);leftCount--;}return ret;}};
class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {// 先去重set<int> s1;for(auto e : nums1){s1.insert(e);}set<int> s2;for(auto e : nums2){s2.insert(e);}// set排过序,依次比较,小的一定不是交集,相等的是交集auto it1 = s1.begin();auto it2 = s2.begin();vector<int> ret;while(it1 != s1.end() && it2 != s2.end()){if(*it1 < *it2){it1++;}else if(*it2 < *it1){it2++;}else{ret.push_back(*it1);it1++;it2++;}}return ret;}
};