进入数据结构的世界

数据结构和算法的概述

一、什么是数据结构
二、什么是算法
三、如何去学习数据结构和算法
四、算法的时间复杂度和空间复杂度
- 4.1 算法效率
- 4.2 大O的渐进表示法
- 4.3 时间复杂度
- 4.4 空间复杂度
- 4.5 常见复杂度对比

一、什么是数据结构

数据结构是计算机存储、组织数据的方式。（相互之间存在一种或多种特定关系的数据元素的集合）

二、什么是算法

算法就是一系列的计算步骤，用来吧输入数据转换成输出结果。（算法就是有良好的计算过程，把一个或一组的值输入，并产出一个或一组的值输出）

三、如何去学习数据结构和算法

现在的公司对学生的代码能力越来越高，数据结构和算法的题目越来越难。算法的能力在短期内是不能够快速提升的，需要进行算法训练的积累。校招的时候，笔试很难，为了能够找到工作，还需要对数据结构和算法早早的准备，多去训练算法能力。
数据结构和算法对于初学者来说很难。但是，古话说的好，世上无难事，只怕有心人。不管数据结构和算法有多难，我们都要硬着头皮去学。我相信，只要多学多练，学习数据结构和算法就会越来越简单。

四、算法的时间复杂度和空间复杂度

时间和空间这两个维度能够衡量算法的好坏，

4.1 算法效率

算法在编写成可执行程序后，运行程序需要耗费空间资源和时间资源。因此，衡量一个算法的好坏，一般是从时间和空间两个维度来衡量的，这就是时间复杂度和空间复杂度。

时间复杂度主要是衡量算法的运行快慢，而空间复杂度主要是衡量一个算法运行时所需要的额外空间。（计算机发展的早期，计算机存储的容量很小，我们对空间复杂度很在乎。但是经过计算机行业的快速发展，计算机存储的容量已经达到了很高的地步。所以我们今天已经不需要特别在关注算法的空间复杂度）

4.2 大O的渐进表示法

大O符号（Big O notation）：用于描述函数渐进行为的数学符号
大O的渐进表示法的推导方法：

1、用常数1取代运行时间中所以的加法常数。
2、在运行次数函数中，只保留最高阶项。
3、如果最高价项存在且不是1，则去除与这个项相乘的常数，得到的结果就是大O阶。

算法的时间复杂度存在最好、平均和最坏情况：

最好情况：任意输入规模的最大运行次数（上界）
平均情况：任意输入规模的期望运行次数
最坏情况：任意输入规模的最小运行次数（下界）

例如：在一个长度为N的数组中搜索一个数据x

最好情况：1次找到
平均情况：N/2次找到
最坏情况：N次找到

实际中，我们关注的都是算法的最坏情况。所以，数组中搜索数据的时间复杂度为O(N)

4.3 时间复杂度

时间复杂度的定义：
一个算法执行所消耗的时间，从理论上说，是不能够算出来得，只有把程序放在机器上跑，才能够知道消耗的时间。一个算法所花费的时间与其中语句的执行次数成正比，算法的基本操作的执行次数，就是算法的时间复杂度。
案例1：

找到基本语句与问题规模n的数学表达式，算出该算法的时间复杂度。

//计算++count语句执行的次数
#include <stdio.h>
int main()
{int n = 0;scanf("%d", &n);int count = 0;for (int i = 0; i < n; i++){for (int j = 0; j < n; j++)++count;}for (int i = 0; i < 2 * n; i++){++count;}int m = 10;while (m--){++count;}printf("%d\n", count);return 0;
}

基本操作次数：
F(n)=n^2+2*n+10

n=10 F(n)=130
n=100 F(n)=10210
n=1000 F(n)=1002010

用大O的渐进表示法，时间复杂度为O(N^2)

n=10 F(n)=100
n=100 F(n)=10000
n=1000 F(n)=1000000

实际中我们计算时间复杂度时，并不一定计算精准的时间复杂度，而只需要大概执行次数，这里我们使用大O的渐进表示法。

通过上面我们可以发现大O的渐进表示法去掉了那些对结果影响不大的项，简洁明了的表示出了执行次数。
案例2：

计算Fun2的时间复杂度
void Fun2()
{int N;scanf("%d", &N);int count = 0;for (int i = 0; i < 2 * N; i++){++count;}int M = 10;while (M--){++count;}printf("%d\n", count);
}

Fun2的时间复杂度为：
F(N)=2*N+10
大O的渐进表示法：时间复杂度为O(N)
案例3：

//计算Fun3的时间复杂度
void Fun3()
{int N, M;scanf("%d%d", &N, &M);int count = 0;for (int i = 0; i < N; i++){++count;}for (int j = 0; j < M; j++){++count;}printf("%d\n", count);
}

Fun2的时间复杂度为：
F(N)=N+M
大O的渐进表示法：时间复杂度为O(N)
案例4：

//二分查找的思想
void Fun4()
{int m = 0;int arr[10] = { 1,2,4,6,8,11,55,66,77,88};int n;printf("请输入要查找的数：\n");scanf("%d", &n);int begin = 0;int end = 9;while (begin <= end){int mid = begin + (end - begin)/2;if (arr[mid] < n)begin = mid + 1;else if (arr[mid] > n)end = mid - 1;else{printf("找到了\n");printf("%d", arr[mid]);m = 1;break;}}if(m==0)printf("没找到\n");
}

区间数据个数：
N
N/2
N/2/2
…………
N/2/2/2……/2=1

最坏的情况，查找区间缩放只剩一个值时，就是坏得，
假设查找x次，2^x=N,所以x=logN。

大O的渐进表示法：时间复杂度为O(logN).

案例5：

//斐波那契递归的复杂度
#include <stdio.h>
int Fun5(size_t n)
{if (n < 3)return 1;return Fun5(n - 2) + Fun5(n - 1);}
int main()
{int n = 7;int sum=Fun5(n);printf("%d\n", sum);return 0;
}

打印结果：
在这里插入图片描述
递归展开图：

1次（2^ 0）
2次（2^ 1）
4次（2^ 2）
8次（2^ 3）
……
2^（N-1）次
通过函数递归图分析基本操作递归了2 ^N-1次，
大O的渐进表示法：时间复杂度为O (2 ^N)。

4.4 空间复杂度

空间复杂度的定义：
一个算法在运行过程中临时占用存储空间大小的量度。（空间复杂度算的是变量的个数）
注意：
函数运行时所需要的栈空间（存储函数、局部变量、一些寄存器信息等）在编译期间就已经确定好了，因此，空间复杂度主要就是函数在运行的时候申请的额外空间来确定的。
案例1：

//计算BubbleSort函数的空间复杂度
void BubbleSort(int* a, int n)
{assert(a);for (int end = n; end > 0; end--){int exchange = 0;for (int i = 1; i < n; i++){if (a[i - 1] > a[i]){Swap(&a[i - 1], &a[i]);exchange = 1;}}//不需要循环了if (exchange == 0)break;}
}

可以看出使用了常数个额外空间，所以空间复杂度为O(1)
案例2：

//看返回斐波那契数列的前n项，计算Fibonac的空间复杂度
int* Fibonac(int n)
{if (n == 0)return NULL;int* fibar = (int*)malloc(sizeof(int) * (n + 1));fibar[0] = 0;fibar[1] = 1;for (int i = 2; i <= n; i++){fibar[i] = fibar[i - 1] + fibar[i - 2];}return fibar[i];
}