多数问题求解之蒙特卡洛与分治法

多数问题(Majority Problem)是一个有多种求解方法的经典问题,其问题定义如下:

给定一个大小为 n n n的数组,找出其中出现次数超过 n / 2 n/2 n/2的元素

例如:当输入数组为 [ 5 , 3 , 5 , 2 , 3 , 5 , 5 ] [5, 3, 5, 2, 3, 5, 5] [5,3,5,2,3,5,5],则 5 5 5是多数(majority)。

本文将介绍该问题的多种求解方法,重点介绍蒙特卡洛与分治法2种。

1. 解决思路

面对一个未知的算法问题,我们最开始很自然地会使用简单粗暴的方法。

1.1 暴力解法

暴力解法就是遍历整个数组,依次判断每个元素是否是多数。其伪代码如下:

Majority(A[1, n])
for(i = 1 to n)cnt = 1for(j = 1 to n)if (i != j and A[i]==A[j])cnt++endif (cnt > n/2) return "A[i] is the majortiy"endreturn "No majority"

暴力算法的缺点就是费时间,时间复杂度为 O ( n 2 ) O(n^2) O(n2)。那有什么办法能少一些遍历的时间代价呢?哈希表就是一种用空间换时间的方法。

1.2 哈希表

上面的暴力解法中,我们在循环遍历中更新元素出现的次数,然后再判断是否是多数。可以改为只遍历数组一次,用哈希表记录每个元素出现的次数,然后再遍历哈希表找到出现次数最大的元素,判断其出现次数是否超过 n / 2 n/2 n/2

这样时间复杂度降为了 O ( n ) O(n) O(n),空间复杂度为 O ( n ) O(n) O(n)。时间复杂度还能更优化一点吗?下面让我们来看下分治法的求解思路。

1.3 分治法

我们把原始数组分为两半:在前一半子数组中,找到多数 A A A;在后一半子数组中,找到多数 B B B。那么原始数组的多数一定在 A A A B B B之间,当二者相等时,原始数组的多数就已经找到了;当二者不等时,比较 A A A B B B出现的次数哪个大于 n / 2 n/2 n/2即可。

算法的时间复杂度 T ( n ) = T ( n / 2 ) + 2 n = O ( n log ⁡ n ) T(n)=T(n/2)+2n=O(n\log{n}) T(n)=T(n/2)+2n=O(nlogn)。具体的C语言代码实现可参见第2节。

1.4 蒙特卡洛法

蒙特卡罗(Monte Carlo)算法是一种随机算法,在一般情况下可以保证对问题的所有实例都以高概率给出正确解,但是通常无法判定一个具体解是否正确。

在多数问题中,蒙特卡洛法的思想是随机从数组中选择一个元素,判断是否是多数。如果不是多数的话,再随机选择一个。在存在多数的情况下,因为随机选择到多数的概率超过 1 2 \frac{1}{2} 21,算法找不到多数的概率小于 1 2 \frac{1}{2} 21

该算法的平均时间复杂度为 O ( n ) O(n) O(n)

2. 代码

以下C语言代码依次实现了Monte Carlo以及分治法求解多数问题,并比较了两种算法的运行时间。

  1. 首先用户需输入测试数据的文件路径,按下回车键。
  2. 然后进入Monte Carlo模式需输入重复的次数。
  3. 待用户输入完成,按下回车键后,对Monte Carlo算法求解多数问题计时开始,直至输出多数问题的结果计时结束,打印输出运行时间(ms)。
  4. Monte Carlo结束后直接进入分治法求解,开始计时,直至分治法输出多数问题的结果计时结束,打印输出运行时间(ms)。
#include <iostream>
#include <cstdlib>
#include <ctime>
#include <windows.h> using namespace std;const int N = 2000000;        //定义数组的最大长度 int a[N];bool majorityMC_once(int a[], int len, int *result) { //对长度为len的数组a[]进行一次蒙特卡洛寻找多数 int rnd = rand() % len;  //生成[0, len-1)的一个随机下标 int x = a[rnd];int count = 0;           //记录 x 在数组a[]中出现的次数 for (int i = 0; i < len; i++) { if (a[i] == x) {count++;}}if (count > (len / 2)) { //若 x 出现次数超过数组长度的一半,则一次蒙特卡洛找到多数,返回true *result = x;         //将找到的多数的值传给result return true;} else {                   //否则,一次蒙特卡洛未找到多数,返回false return false;}
}bool majorityMC_k_times(int a[], int len, int *result, int k) { //k次蒙特卡洛 for (int i = 1; i <= k; i++) {if(majorityMC_once(a, len, result)) { //只要有一次蒙特卡洛找到多数,则返回true              return true;}} return false;                             //k次蒙特卡洛均未找到多数,则返回false 
}bool majorityDC(int a[], int start, int end, int *result) { //分治法求解多数问题,数组下标区间为[start, end] if (start == end) {*result = a[end];return true;}else {int m1, m2;majorityDC(a, start, (start + end) / 2, &m1);    //m1为前半区间[start, (start + end) / 2]的多数 majorityDC(a, (start + end) / 2 + 1, end, &m2);  //m2为后半区间[(start + end) / 2 + 1, end]的多数 int count1 = 0, count2 = 0;for (int i = start; i <= end; i++) {if (a[i] == m1) {     //count1记录m1在数组a[]中出现的次数 count1++;}if (a[i] == m2) {     //count2记录m2在数组a[]中出现的次数 count2++;}}if (count1 > ((end - start + 1) / 2)) { //m1在数组a[]中出现的次数大于数组长度的一半,则m1为多数 *result = m1;return true;} else if (count2 > ((end - start + 1) / 2)) { //m2在数组a[]中出现的次数大于数组长度的一半,则m2为多数 *result = m2;return true;}else {  return false;         //m1, m2均不是多数,则数组a[]的多数不存在}}
}int main() {srand(time(NULL));  //设置时间函数time(NULL)为随机数种子 char s[100];cout << "请输入测试数据文件路径:" << endl;cin >> s; FILE *fp;fp = fopen(s, "r");if (fp == NULL) {cout << "Can not open the file!" << endl;exit(0);}int i = 0;while (fscanf(fp, "%d\n", &a[i]) != EOF) {  //读取文件中的数据到数组a[]中 i++;}fclose(fp); cout << "********************** Monte Carlo *********************" << endl;int k;cout << "请输入 Monte Carlo 重复的次数: ";cin >> k;LARGE_INTEGER nFreq;LARGE_INTEGER nBeginTime;LARGE_INTEGER nEndTime;QueryPerformanceFrequency(&nFreq);QueryPerformanceCounter(&nBeginTime);  //Monte Carlo计时开始 int resultMC;if (majorityMC_k_times(a, i, &resultMC, k)) {cout << resultMC << " is the majority" << endl;} else {cout << "Can not find the majority!" << endl;}QueryPerformanceCounter(&nEndTime);  //Monte Carlo计时结束 double time = (double)(nEndTime.QuadPart - nBeginTime.QuadPart) / nFreq.QuadPart * 1000;cout << "Running time: " << time << "ms" << endl;cout << endl;cout << "****************** Divide and Conquer ******************" << endl;QueryPerformanceFrequency(&nFreq);QueryPerformanceCounter(&nBeginTime);  //分治法计时开始 int resultDC;if (majorityDC(a, 0, i - 1, &resultDC)) {cout << resultDC << " is the majority" << endl;} else {cout << "Can not find the majority!" << endl;}QueryPerformanceCounter(&nEndTime);    //分治法计时结束 time = (double)(nEndTime.QuadPart - nBeginTime.QuadPart) / nFreq.QuadPart * 1000;cout << "Running time: " << time << "ms" << endl;return 0;
}

3. 运行结果

基于测试数据,求解得到如下结果:

  • dataset1.txt:none
  • dataset2.txt:991
  • data_1015.txt:none
  • data_1015l.txt:none

多次运行程序发现,在多数问题有解时,采用Monte Carlo算法求解效率普遍比分治法高,但是在Monte Carlo算法重复次数较少时,它在实际中并不总是返回正确结果。如测试数据为dataset2.txt,Monte Carlo重复1次时,可能会找不到多数问题的解,如下图。

在这里插入图片描述

其他运行示例:

(1)dataset1.txt,Monte Carlo重复次数1000:

在这里插入图片描述

(2)dataset2.txt,Monte Carlo重复次数20:

在这里插入图片描述

(3)data_1015.txt,Monte Carlo重复次数1000:

在这里插入图片描述

(4)data_1015l.txt,重复次数1000:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/275199.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

爬虫案例2:playwright 超爽体验

参考链接&#xff1a;https://playwright.bootcss.com/python/docs/intro 目标网站&#xff1a;https://spa6.scrape.center/通过观察&#xff0c;页面的信息是通过Ajax请求后返回的信息 下面使用playwright实现绕过token的获取直接拿到返回的数据import asyncio import json f…

邮件发送:行业会议邀请的高效新选择

随着数字化浪潮的不断深入&#xff0c;营销手段也在不断的创新和升级。因此&#xff0c;如何高效、精准地触达并吸引目标用户群体参与行业会议已成为众多会议举办方的核心关注点。在这一背景下&#xff0c;邮件推送服务凭借其独特的优势正逐渐成为行业会议邀请的新选择。 邮件推…

Linux本地搭建FastDFS系统

文章目录 前言1. 本地搭建FastDFS文件系统1.1 环境安装1.2 安装libfastcommon1.3 安装FastDFS1.4 配置Tracker1.5 配置Storage1.6 测试上传下载1.7 与Nginx整合1.8 安装Nginx1.9 配置Nginx 2. 局域网测试访问FastDFS3. 安装cpolar内网穿透4. 配置公网访问地址5. 固定公网地址5.…

初级爬虫实战——伯克利新闻

文章目录 发现宝藏一、 目标二、简单分析网页1. 寻找所有新闻2. 分析模块、版面和文章 三、爬取新闻1. 爬取模块2. 爬取版面3. 爬取文章 四、完整代码五、效果展示 发现宝藏 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不…

挑战杯 基于深度学习的人脸表情识别

文章目录 0 前言1 技术介绍1.1 技术概括1.2 目前表情识别实现技术 2 实现效果3 深度学习表情识别实现过程3.1 网络架构3.2 数据3.3 实现流程3.4 部分实现代码 4 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 基于深度学习的人脸表情识别 该项目较…

explain关键字的用法(mysql高级部分)

文章目录 简介explain关键字分析 简介 explain主要是用来分析sql语句的&#xff0c;当你的系统中出现慢查询SQL后&#xff0c;你可以使用explain关键字对该语句进行分析。通过使用explain&#xff0c;我们可以得到以下结果 表的读取顺序 哪些索引可能使用 哪些索引被实际使用…

48. 【Linux教程】yum 软件包管理

本小节介绍如何在 Linux 系统中使用 yum 命令软件管理。 1.yum 简介 yum 是 Red Hat 软件包管理器&#xff0c;它能够查询有关可用软件包的信息&#xff0c;从存储库获取软件包&#xff0c;安装和卸载软件包&#xff0c;以及将整个系统更新到最新的可用版本。yum 在更新&#…

netty草图笔记

学一遍根本记不住&#xff0c;那就再学一遍 public static void test_nettyFuture() {NioEventLoopGroup group new NioEventLoopGroup();log.info("开始提交任务");Future<String> future group.next().submit(() -> {log.info("执行异步任…

如何实现sam(Segment Anything Model)|fastsam模型

sam是2023年提出的一个在图像分割领域的大模型&#xff0c;其具备了对任意现实数据的分割能力&#xff0c;其论文的介绍可以参考 https://hpg123.blog.csdn.net/article/details/131137939&#xff0c;sam的亮点在于提出一种工作模式&#xff0c;同时将多形式的prompt集成到了语…

【漏洞复现】网康科技 NS-ASG 应用安全网关 SQL注入漏洞(CVE-2024-2330)

免责声明&#xff1a;文章来源互联网收集整理&#xff0c;请勿利用文章内的相关技术从事非法测试&#xff0c;由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;所产生的一切不良后果与文章作者无关。该…

Spring学习 基础(三)MVC

5、Spring MVC 传统Web模式&#xff1a; Model:系统涉及的数据&#xff0c;也就是 dao 和 bean。View&#xff1a;展示模型中的数据&#xff0c;只是用来展示。Controller&#xff1a;处理用户请求都发送给 &#xff0c;返回数据给 JSP 并展示给用户。 随着 Spring 轻量级开发…

Python逆向:pyc字节码转py文件

一、 工具准备 反编译工具&#xff1a;pycdc.exe 十六进制编辑器&#xff1a;010editor 二、字节码文件转换 在CTF中&#xff0c;有时候会得到一串十六进制文件&#xff0c;通过010editor使用查看后&#xff0c;怀疑可能是python的字节码文件。 三、逆向反编译 将010editor得到…

【Redis】redis持久化

redis 持久化 Redis是内存数据库&#xff0c;数据都是存储在内存中&#xff0c;为了避免进程退出导致数据的永久丢失&#xff0c;需要定期将Redis中的数据以某种形式(数据或命令)从内存保存到硬盘&#xff1b;当下次Redis重启时&#xff0c;利用持久化文件实现数据恢复。除此之…

前端性能优化 | CDN缓存

前言 CDN&#xff08;Content Delivery Network&#xff09;是一种分布式的网络架构&#xff0c;通过在全球各地部署节点服务器来快速传输和分发网络内容。CDN的主要目标是提供快速、可靠的内容传输&#xff0c;以提升用户体验。 本文主要从以下方面讲解CDN 什么是CDNCDN的作…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的木材表面缺陷检测系统(深度学习+Python代码+UI界面+训练数据集)

摘要&#xff1a;开发高效的木材表面缺陷检测系统对于提升木材加工行业的质量控制和生产效率至关重要。本篇博客详细介绍了如何运用深度学习技术构建一个木材表面缺陷检测系统&#xff0c;并提供了完整的实现代码。该系统采用了强大的YOLOv8算法&#xff0c;并对YOLOv7、YOLOv6…

十六、接口隔离原则、反射、依赖注入

接口隔离原则、反射、特性、依赖注入 接口隔离原则 客户端不应该依赖它不需要的接口&#xff1b;一个类对另一个类的依赖应该建立在最小的接口上。 五种原则当中的i 上一章中的接口&#xff0c;即契约。 契约就是在说两件事&#xff0c;甲方说自己不会多要&#xff0c;乙方会在…

如何轻松打造属于自己的水印相机小程序?

水印相机小程序源码 描述&#xff1a;微信小程序。本文将为您详细介绍小程序水印相机源码的搭建过程&#xff0c;教您如何轻松打造属于自己的水印相机小程序。无论您是初学者还是有一定基础的开发者&#xff0c;都能轻松掌握这个教程。 一&#xff1a;水印相机搭建教程 1 隐…

JS ATM练习案例(复习循环知识)

需求&#xff1a;用户可以选择存钱、取钱、查看余额和退出功能。 分析&#xff1a;1循环时反复出现提示框&#xff0c;所以提示框写到循环里面。 2.退出的条件是4&#xff0c;所以是4就会结束循环 3.提前准备一个金额预存储 4取钱为减法操作&#xff0c;存钱为加法操作&#xf…

【Linux】-Linux下的软件商店yum工具介绍(linux和windows互传文件仅仅一个拖拽搞定!!!!)

目录 1.Linux 软件包管理器yum 1.1快速认识yum 1.2 yumz下载方式&#xff08;如何使用yum进行下载&#xff0c;注意下载一定要是root用户或者白名单用户&#xff08;可提权&#xff09;&#xff09; 1.2.1下载小工具rzsz 1.2.2 rzsz使用 1.2.2查看软件包 1.3软件的卸载 2.yum生…

【考研数学】打基础用张宇《30讲》还是武忠祥《基础篇》?

基础课不太可能所有的东西全都覆盖&#xff0c;还是先搭起一个知识框架&#xff0c;然后不断的填充和完善。 所以不必太过于在意少一些东西&#xff0c;我们不可能一口吃成胖子&#xff0c;基础知识肯定不会遗漏的&#xff0c;只可能一些技巧不到位。 从自己的情况考虑&#…