崔春雷

1 第一单元： MATLAB基础
- 1.1 课程说明与资料
  - 1.1.1 作业参考答案
  - 1.1.2 移动22级作业答案
- 1.2 MATLAB安装与运行环境
  - 1.2.1 MATLAB介绍
- 1.3 基本数据类型：数值类型
- 1.4 基本数据类型：字符类型
- 1.5 数据类型转换与输出
- 1.6 数组与矩阵基础
  - 1.6.1 矩阵运算进阶
- 1.7 数组与矩阵常用函数
- 1.8 matlab中的逻辑运算
- 1.9 实验： MATLAB常用数学函数
  - 1.9.1 实验作业答案
- 1.10 元胞数组
- 1.11 结构体数组
  - 1.11.1 结构体进阶
  - 1.11.2 元胞数组与结构体数组对比
  - 1.11.3 map 容器
- 1.12 附录：MATLAB常用基础命令
- 1.13 拓展内容：实时脚本
  - 1.13.1 实时脚本示例
- 1.14 课程作业与答案
  - 1.14.1 《通信系统仿真》期末考试
2 第二单元：Matlab 程序设计
- 2.1 顺序结构程序
- 2.2 分支结构—— if语句
- 2.3 分支结构—— switch语句
- 2.4 循环结构—— while语句
- 2.5 循环结构—— for语句
- 2.6 图像处理基础
- 2.7 Matlab的函数
  - 2.7.1 函数内容的课外扩展
- 2.8 本章实验：for循环的应用
  - 2.8.1 素数问题
    - 2.8.1.1 素数的螺旋线排列
  - 2.8.2 3X+1猜想
  - 2.8.3 7 行代码计算 π
- 2.9 排序算法
  - 2.9.1 冒泡排序
  - 2.9.2 选择排序
  - 2.9.3 插入排序
  - 2.9.4 快速排序
  - 2.9.5 基数排序
  - 2.9.6 计数排序
  - 2.9.7 堆排序
- 2.10 动态规划算法
  - 2.10.1 动态规划编程实例
  - 2.10.2 动态规划：01背包问题
  - 2.10.3 动态规划常见题目分析
  - 2.10.4 动态规划题目分析2
- 2.11 常用算法简介
  - 2.11.1 剪枝算法
  - 2.11.2 二分查找
  - 2.11.3 递归算法
  - 2.11.4 回溯算法
    - 2.11.4.1 Leetcode回溯题目合集
    - 2.11.4.2 回溯算法总结
    - 2.11.4.3 回溯法解数独问题
    - 2.11.4.4 DFS与BFS
      - 2.11.4.4.1 DFS/BFS原理
      - 2.11.4.4.2 BFS的应用：Dijkstra算法
  - 2.11.5 n 皇后问题专题
  - 2.11.6 双指针算法
  - 2.11.7 数组模拟链表（约瑟夫环）
  - 2.11.8 Hash（哈希表）
  - 2.11.9 图论与路径规划
    - 2.11.9.1 迪杰斯特拉算法
    - 2.11.9.2 A*算法
      - 2.11.9.2.1 A*算法的MATLAB实现
    - 2.11.9.3 RRT路径规划算法
      - 2.11.9.3.1 RRT算法 MATLAB代码
      - 2.11.9.3.2 参考资料
  - 2.11.10 数据结构
    - 2.11.10.1 数据结构例题
  - 2.11.11 前缀和差分双指针
  - 2.11.12 位运算
  - 2.11.13 常用算法代码模板
- 2.12 练习题库
- 2.13 code
  - 2.13.1 简易计算器gui代码
  - 2.13.2 五子棋
  - 2.13.3 连连看小游戏
  - 2.13.4 递归算法与汉诺塔
  - 2.13.5 有理数的小数循环节
- 2.14 MATLAB编程风格
  - 2.14.1 向量化编程专题
3 第三单元：Matlab 图形图像处理
- 3.1 二维图形绘图基础
- 3.2 二维图形绘图进阶
- 3.3 三维图形绘图
  - 3.3.1 MATLAB绘图小结
    - 3.3.1.1 用matlab绘制好看图像
- 3.4 MATLAB高级绘图
- 3.5 文件操作
- 3.6 Matlab图像处理进阶
  - 3.6.1 补充：Matlab图像处理常用函数
  - 3.6.2 RGB/HSV/HSI颜色模型
  - 3.6.3 图片切换动画效果
  - 3.6.4 图像连通域标记
  - 3.6.5 图像旋转与插值
  - 3.6.6 图像的形态学
  - 3.6.7 空间滤波
    - 3.6.7.1 图像中常见的噪声类型与滤波方法
    - 3.6.7.2 matlab中的滤波函数
    - 3.6.7.3 BM3D 去噪算法
    - 3.6.7.4 双边滤波
  - 3.6.8 图像的频域处理
- 3.7 本章总结
- 3.8 实验： matlab 绘图练习1
- 3.9 实验： matlab 绘图练习2
- 3.10 实验：数学函数图像绘制
- 3.11 实验：绘图综合练习
- 3.12 实验：曲线拟合
- 3.13 实验：牛顿法求解方程的根
- 3.14 实验：信号的傅里叶变换
  - 3.14.1 傅里叶变换、小波变换、希尔伯特变换
  - 3.14.2 新建目录
- 3.15 课外补充:图像处理基础1
- 3.16 课外补充:图像处理基础2
- 3.17 课外补充:图像处理基础3
- 3.18 课外补充：PYTHON基础
4 第五单元：MATLAB通信仿真
- 4.1 现代通信系统的介绍
- 4.2 模拟通信系统的仿真原理
- 4.3 HDB3编解码的仿真实现
- 4.4 SIMULINK和其模块简介
- 4.5 数字通信系统的仿真原理
- 4.6 模拟通信系统Simulink仿真
- 4.7 数字通信系统Simulink仿真
- 4.8 音频信号测处理与仿真
- 4.9 图像数字水印技术
  - 4.9.1 三角函数到傅里叶变换再到语音识别与数字水印
- 4.10 信息系统与算法
  - 4.10.1 递归算法
    - 4.10.1.1 递归与堆栈的关系
  - 4.10.2 哈希表
  - 4.10.3 双指针算法
    - 4.10.3.1 双指针算法实战
    - 4.10.3.2 双指针进阶：滑动窗口算法
  - 4.10.4 字符串匹配 KMP算法
    - 4.10.4.1 字符串匹配B-M算法
  - 4.10.5 快速傅里叶变换
  - 4.10.6 回溯算法
  - 4.10.7 动态规划
  - 4.10.8 分治算法
  - 4.10.9 Dijkstra算法
5 第六单元： systemview通信仿真
- 5.1 SystemView概述
- 5.2 模拟通信系统数字系统的仿真分析
- 5.3 SystemView通信系统仿真进阶
- 5.4 新建课程目录
6 第四单元：MATLAB高级应用
- 6.1 符号运算基础
  - 6.1.1 利用Matlab自动推导公式
- 6.2 Matlab中的数值计算
  - 6.2.1 积分的计算
  - 6.2.2 龙格库塔:常微分方程的数值解法
  - 6.2.3 fmincon函数与非线性方程最小值
- 6.3 统计、拟合、插值
  - 6.3.1 协方差与相关系数
- 6.4 GUI设计初步
- 6.5 matlab GUI界面编程
  - 6.5.1 gui实例
  - 6.5.2 gui编程中常用函数
  - 6.5.3 App Designer入门
- 6.6 实验：GUI设计图像空间变换系统
- 6.7 作业：利用GUI设计计算器、信号发生器等
- 6.8 MTALB数据导入方法
- 6.9 课外补充：MATLAB的App会取代GUI吗？
- 6.10 模拟退火算法matlab实现
- 6.11 遗传算法的Matlab实现
  - 6.11.1 进化算法（Evolutionary Algorithm）及相关函数介绍
- 6.12 粒子群算法 matlab实现
  - 6.12.1 粒子群算法及MATLAB实例仿真
- 6.13 BP网络的应用
- 6.14 matlab 结构体
- 6.15 群智能算法合集
7 拓展知识
- 7.1 什么是算法的时间复杂度？
- 7.2 Notepad++使用教程
- 7.3 MATLAB常用函数总结
- 7.4 MATLAB常用知识点总结
- 7.5 MATLAB命令大全
- 7.6 视频：MATLAB官方基础教程
- 7.7 经典书籍：Matlab2012经典超强教程
- 7.8 经典书籍：MATLAB揭秘（自学宝典）
- 7.9 经典资料：MATLAB N个实用技巧
- 7.10 Matlab编程小技巧
- 7.11 寻优算法
  - 7.11.1 Dijkstra算法python实现
- 7.12 PYTHON基础教程
  - 7.12.1 Python进阶
  - 7.12.2 Python小技巧
  - 7.12.3 Python总结
    - 7.12.3.1 Python循环语句总结
    - 7.12.3.2 24个顶级Python库
    - 7.12.3.3 魔法函数
  - 7.12.4 廖雪峰python
  - 7.12.5 正则表达式基础
  - 7.12.6 numpy
    - 7.12.6.1 101道Numpy习题
    - 7.12.6.2 Numpy简要语法教程
    - 7.12.6.3 Numpy实现全连接神经网络（手写数字识别)
    - 7.12.6.4 图解NumPy
  - 7.12.7 matplotlib
    - 7.12.7.1 matplotlib练习50题
    - 7.12.7.2 Matplotlib速查表
    - 7.12.7.3 Matplotlib 实操指南
  - 7.12.8 Python3 模块 import
  - 7.12.9 Python 小项目
- 7.13 参考资源：数据结构与算法
  - 7.13.1 十大经典排序算法总结
- 7.14 机器学习概述
  - 7.14.1 反向传播算法
    - 7.14.1.1 反向传播的数学原理
  - 7.14.2 极大似然估计
    - 7.14.2.1 极大似然估计与最小二乘法
  - 7.14.3 Batch Normalization
    - 7.14.3.1 Batch Normalization&Dropout浅析
    - 7.14.3.2 BN层的梯度反向传播计算
    - 7.14.3.3 Batch Size的大小与神经网络的性能
    - 7.14.3.4 标准化和归一化
  - 7.14.4 主成分分析PCA与SVD奇异值分解
    - 7.14.4.1 岭回归与 PCA
    - 7.14.4.2 PCA原理推导
    - 7.14.4.3 PCA原理新解
    - 7.14.4.4 svd
    - 7.14.4.5 PCA数学原理
  - 7.14.5 正则化
    - 7.14.5.1 L1、L2正则化和过拟合总结
    - 7.14.5.2 L1 和 L2 正则化的直观解释
  - 7.14.6 SVM
    - 7.14.6.1 从零推导支持向量机(SVM)
    - 7.14.6.2 支持向量机（SVM）介绍
    - 7.14.6.3 SVM推导与实战
    - 7.14.6.4 支持向量机的直观理解
    - 7.14.6.5 浅显易懂的支持向量机SVM
  - 7.14.7 线性回归
  - 7.14.8 逻辑回归
  - 7.14.9 BP算法
    - 7.14.9.1 万能逼近——神经网络拟合任意函数原理
  - 7.14.10 激活与池化
    - 7.14.10.1 激活函数与损失函数小结
  - 7.14.11 深度学习简述
    - 7.14.11.1 MATLAB2020深度学习实例
  - 7.14.12 损失函数与误差反向传播
    - 7.14.12.1 梯度下降与损失函数
  - 7.14.13 深度学习优化问题
  - 7.14.14 梯度下降法
    - 7.14.14.1 各类梯度下降算法的Python实现
    - 7.14.14.2 梯度下降的直观理解
    - 7.14.14.3 动量、RMSProp、Adam
  - 7.14.15 卷积的概念
    - 7.14.15.1 卷积的矩阵化算法
  - 7.14.16 局部连接
  - 7.14.17 RNN
  - 7.14.18 LSTM
  - 7.14.19 CNN-四大经典CNN技术浅析
  - 7.14.20 熵(Entropy)与交叉熵
  - 7.14.21 softmax函数详解
  - 7.14.22 自编码算法详细理解与代码实现
  - 7.14.23 pytorch
    - 7.14.23.1 PyTorch简介
      - 7.14.23.1.1 Pytorch快速入门资料
    - 7.14.23.2 CNN的PyTorch实现
    - 7.14.23.3 pytorch总结
    - 7.14.23.4 PyTorch trick 集锦
    - 7.14.23.5 在PyTorch上加载自定义数据集
    - 7.14.23.6 实战：Pytorch识别验证码
    - 7.14.23.7 实战：Transformer的最简洁pytorch实现
    - 7.14.23.8 使用PyTorch实现神经网络分类
  - 7.14.24 卷积神经网络CNN概述
    - 7.14.24.1 CNN 简易原理
    - 7.14.24.2 卷积神经网络CNN原理详解
    - 7.14.24.3 自己手写一个卷积神经网络
    - 7.14.24.4 CNN反向传播算法
    - 7.14.24.5 卷积计算、作用与思想
    - 7.14.24.6 用卷积神经网络CNN识别手写数字集
    - 7.14.24.7 卷积池化参数的计算
    - 7.14.24.8 im2col方法实现卷积算法
    - 7.14.24.9 卷积核的梯度计算
    - 7.14.24.10 卷积层反向传播推导及实现
    - 7.14.24.11 反向传输算法
      - 7.14.24.11.1 resnet残差网络
    - 7.14.24.12 CNN反向传播的MATLAB实现
  - 7.14.25 神经网络的调参技巧
  - 7.14.26 BP神经网络
    - 7.14.26.1 零开始搭建bp神经网络
    - 7.14.26.2 MATLAB自带的bp工具箱
    - 7.14.26.3 神经网络中偏置（bias）的作用
  - 7.14.27 聚类分析 k-means
    - 7.14.27.1 matlab做聚类分析（k-means）
    - 7.14.27.2 聚类模型探讨综述
    - 7.14.27.3 5种经典聚类算法
  - 7.14.28 深度学习的一些概念
  - 7.14.29 人工智能简述：AI的过去和现在
  - 7.14.30 k-NN（k近邻算法）
  - 7.14.31 神经网络中的优化器：BGD、SGD、MBGD、Momentum
  - 7.14.32 卷积神经网络的经典网络总结
    - 7.14.32.1 卷积神经网络中十大拍案叫绝的操作
  - 7.14.33 GAN 对抗样本攻击
  - 7.14.34 蒙特卡洛模拟
  - 7.14.35 dropout与随机部分连接
  - 7.14.36 Jupyter 等 IDE概览
  - 7.14.37 分类算法常用评价指标
  - 7.14.38 Inception 网络与不变性
  - 7.14.39 卷积神经网络的可视化
  - 7.14.40 隐马尔可夫模型HMM
    - 7.14.40.1 马尔科夫链
- 7.15 MATLAB音频处理
  - 7.15.1 python处理音频信号
- 7.16 图像处理
  - 7.16.1 图像处理中的指标
- 7.17 代码集
- 7.18 论文写作与阅读方法
  - 7.18.1 期刊投稿攻略
  - 7.18.2 论文排版教程
  - 7.18.3 SCI-HUB论文下载技巧
  - 7.18.4 几种论文写作神器，提高写作效率
  - 7.18.5 latex入门
  - 7.18.6 LaTeX教程
- 7.19 机器学习常用的网站以及资源
  - 7.19.1 很详细的ML&DL学习博客
- 7.20 SymPy 符号计算基本教程
8 程序设计数学基础
- 8.1 编程数学基础
  - 8.1.1 概率的历史
  - 8.1.2 概率
    - 8.1.2.1 常见概率分布
      - 8.1.2.1.1 二维正态分布
    - 8.1.2.2 蒙特卡罗方法
    - 8.1.2.3 置信区间
    - 8.1.2.4 协方差与相关系数
  - 8.1.3 矩阵向量求导法则
  - 8.1.4 雅可比矩阵海森矩阵
  - 8.1.5 矩阵的几种分解方式
  - 8.1.6 行列式和代数余子式
  - 8.1.7 向量
  - 8.1.8 矩阵的基本运算
  - 8.1.9 矩阵分析
  - 8.1.10 矩阵的LU分解
  - 8.1.11 矩阵奇异值分解(SVD)
    - 8.1.11.1 SVD分解2
    - 8.1.11.2 SVD分解逐步推导
    - 8.1.11.3 奇异值与特征值的意义
  - 8.1.12 随机向量
    - 8.1.12.1 随机过程简述
  - 8.1.13 投影矩阵和最小二乘
  - 8.1.14 知乎数学精选集
    - 8.1.14.1 高数问题集
  - 8.1.15 小波变换
  - 8.1.16 程序设计数学基础1：高等数学
  - 8.1.17 程序设计数学基础2：线性代数
  - 8.1.18 程序设计数学基础3：概率论和数理统计
  - 8.1.19 向量的距离与相似度计算
  - 8.1.20 复数
  - 8.1.21 高等数学——幂级数
  - 8.1.22 无穷小的本质
  - 8.1.23 数列极限和收敛性
  - 8.1.24 不定积分技巧总结
- 8.2 有趣的数学题目
- 8.3 高等数学
  - 8.3.1 泰勒级数
9 路径规划与智能算法
- 9.1 常见路径规划算法简介
- 9.2 Dijkstra算法详细
10 教学文档
- 10.1 授课计划
- 10.2 课程标准

信息系统与算法

数据结构与算法资源：

（1）https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzUxNjY5NTYxNA==&action=getalbum&album_id=1485825793120387074&scene=173&from_msgid=2247484250&from_itemidx=1&count=3&nolastread=1#wechat_redirect

（2）https://labuladong.gitbook.io/algo/

（3）https://www.lintcode.com/

算法杂谈 : 神一样的随机算法

这篇文章，我们从一道经典面试题开始来探讨这个问题。这个面试题有很多形式，但其实背后的算法是一致的。

这个问题是：

设计一个公平的洗牌算法

看问题，洗牌，显然是一个随机算法了。随机算法还不简单？随机呗。把所有牌放到一个数组中，每次取两张牌交换位置，随机 k 次即可。

如果你的答案是这样，通常面试官会进一步问一下，k 应该取多少？100？1000？10000？

很显然，取一个固定的值不合理。如果数组中有 1000000 个元素，随机 100 次太少；如果数组中只有 10 个元素，随机 10000 次又太多。一个合理的选择是，随机次数和数组中元素大小相关。比如数组有多少个元素，我们就随机多少次。

这个答案已经好很多了。但其实，连这个问题的本质都没有触及到。此时，面试官一定会狡黠地一笑：这个算法公平吗？

我们再看问题：设计一个公平的洗牌算法。

问题来了，对于一个洗牌算法来说，什么叫“公平”？这其实是这个问题的实质，我们必须定义清楚：什么叫公平。

一旦你开始思考这个问题，才触及到了这个问题的核心。在我看来，不管你能不能最终给出正确的算法，如果你的思路是在思考对于洗牌算法来说，什么是“公平”，我都觉得很优秀。

因为背出一个算法是简单的，但是这种探求问题本源的思考角度，绝不是一日之功。别人告诉你再多次“要定义清楚问题的实质”都没用。这是一种不断面对问题，不断解决问题，逐渐磨炼出来的能力，短时间内无法培训。

这也是我经常说的，面试不是标准化考试，不一定要求你给出正确答案。面试的关键，是看每个人思考问题的能力。

说回我们的洗牌算法，什么叫公平呢？一旦你开始思考这个问题，其实答案不难想到。洗牌的结果是所有元素的一个排列。一副牌如果有 n 个元素，最终排列的可能性一共有 n! 个。公平的洗牌算法，应该能等概率地给出这 n! 个结果中的任意一个。

如思考虑到这一点，我们就能设计出一个简单的暴力算法了：对于 n 个元素，生成所有的 n! 个排列，然后，随机抽一个。

这个算法绝对是公平的。但问题是，复杂度太高。复杂度是多少呢？O(n!)。因为，n 个元素一共有 n! 种排列，我们求出所有 n! 种排列，至少需要 n! 的时间。

有一些同学可能对 O(n!) 没有概念。我本科时就闹过笑话，正儿八经地表示 O(n!) 并不是什么大不了不起的复杂度。实际上，这是一个比指数级 O(2^n) 更高的复杂度。因为 2^n 是 n 个 2 相乘；而 n! 也是 n 个数字相乘，但除了 1，其他所有数字都是大于等于 2 的。当 n>=4 开始，n! 以极快的的速度超越 2^n。

O(2^n) 已经被称为指数爆炸了。O(n!) 不可想象。

所以，这个算法确实是公平的，但是，时间不可容忍。

我们再换一个角度思考“公平”这个话题。其实，我们也可以认为，公平是指，**对于生成的排列，每一个元素都能等概率地出现在每一个位置。**或者反过来，每一个位置都能等概率地放置每个元素。

这个定义和上面的最终洗牌结果，可以等概率地给出这 n! 个排列中的任意一个，是等价的。这个等价性，可以证明出来。并不难。如果正在学习概率论的同学，还比较习惯概率论处理问题的思想，应该能很快搞定：）

基于这个定义，我们就可以给出一个简单的算法了。说这个算法简单，是因为他的逻辑太容易了，就一个循环：

for(int i = n - 1; i >= 0 ; i -- )
	swap(arr[i], arr[rand() % (i + 1)])

这么简单的一个算法，可以保证上面我所说的，对于生成的排列，**每一个元素都能等概率的出现在每一个位置。**或者反过来，每一个位置都能等概率的放置每个元素。

大家可以先简单的理解一下这个循环在做什么。其实非常简单，i 从后向前，每次随机一个 [0…i] 之间的下标，然后将 arr[i] 和这个随机的下标元素，也就是 arr[rand() % (i + 1)] 交换位置。

大家注意，由于每次是随机一个 [0…i] 之间的下标，所以，我们的计算方式是 rand() % (i + 1)，要对 i + 1 取余，保证随机的索引在 [0…i] 之间。

这个算法就是大名鼎鼎的 Knuth-Shuffle，即 Knuth 洗牌算法。

这个算法的原理，我们稍后再讲。先来看看 Knuth 何许人也？

中文名：高纳德。算法理论的创始人。我们现在所使用的各种算法复杂度分析的符号，就是他发明的。上世纪 60-70 年代计算机算法的黄金时期，近乎就是他一手主导的。他的成就实在太多，有时间单独发文介绍，但是，我觉得一篇文章是不够的，一本书还差不多。

大家最津津乐道的，就是他所写的《The Art of Computer Programming》，简称 TAOCP。这套书准备写七卷本，然后，到今天还没有写完，但已经被《科学美国人》评为可以媲美相对论的巨著。

微软是 IT 界老大的年代，比尔盖茨直接说，如果你看完了这套书的第一卷本，请直接给我发简历。

至于这套书为什么写的这么慢？因为老爷子写到一半，觉得当下的文字排版工具都太烂，于是转而发明出了现在流行的LaTex文字排版系统…

另外，老爷子可能觉得当下的编程语言都不能完美地表现自己的逻辑思想，还发明了一套抽象的逻辑语言，用于这套书中的逻辑表示…

下面这张照片是他年轻的时候。这张照片是我在斯坦福大学计算机学院的橱窗拍的。

下面的话和大家共勉：

A programmer who subconsciously views himself as an artist will enjoy what he does and will do it better.
Donald E. Knuth 1978

所以，我从来都不认为自己只是一名工程师而已。我是艺术家：）

是时候仔细的看一下，这个简单的算法，为什么能做到保证：对于生成的排列，每一个元素都能等概率的出现在每一个位置了。

其实，简单的吓人：）

在这里，我们模拟一下算法的执行过程，同时，对于每一步，计算一下概率值。

我们简单的只是用 5 个数字进行模拟。假设初始的时候，是按照 1，2，3，4，5 进行排列的。

那么，根据这个算法，首先会在这五个元素中选一个元素，和最后一个元素 5 交换位置。假设随机出了 2。

下面，我们计算 2 出现在最后一个位置的概率是多少？非常简单，因为是从 5 个元素中选的嘛，就是 1/5。实际上，根据这一步，任意一个元素出现在最后一个位置的概率，都是 1/5。

下面，根据这个算法，我们就已经不用管 2 了，而是在前面 4 个元素中，随机一个元素，放在倒数第二的位置。假设我们随机的是 3。3 和现在倒数第二个位置的元素 4 交换位置。

下面的计算非常重要。3 出现在这个位置的概率是多少？计算方式是这样的：

其实很简单，因为 3 逃出了第一轮的筛选，概率是 4/5，但是 3 没有逃过这一轮的选择。在这一轮，一共有4个元素，所以 3 被选中的概率是 1/4。因此，最终，3 出现在这个倒数第二的位置，概率是 4/5 * 1/4 = 1/5。

还是 1/5 !

实际上，用这个方法计算，任意一个元素出现在这个倒数第二位置的概率，都是 1/5。

相信聪明的同学已经了解了。我们再进行下一步，在剩下的三个元素中随机一个元素，放在中间的位置。假设我们随机的是 1。

关键是：1 出现在这个位置的概率是多少？计算方式是这样的：

即 1 首先在第一轮没被选中，概率是 4/5，在第二轮又没被选中，概率是 3/4 ，但是在第三轮被选中了，概率是 1/3。乘在一起，4/5 * 3/4 * 1/3 = 1/5。

用这个方法计算，任意一个元素出现在中间位置的概率，都是 1/5。

这个过程继续，现在，我们只剩下两个元素了，在剩下的两个元素中，随机选一个，比如是4。将4放到第二个位置。

然后，4 出现在这个位置的概率是多少？4 首先在第一轮没被选中，概率是 4/5；在第二轮又没被选中，概率是 3/4；第三轮还没选中，概率是 2/3，但是在第四轮被选中了，概率是 1/2。乘在一起，4/5 * 3/4 * 2/3 * 1/2 = 1/5。

用这个方法计算，任意一个元素出现在第二个位置的概率，都是 1/5。

最后，就剩下元素5了。它只能在第一个位置呆着了。

那么 5 留在第一个位置的概率是多少？即在前 4 轮，5 都没有选中的概率是多少？

在第一轮没被选中，概率是 4/5；在第二轮又没被选中，概率是 3/4；第三轮还没选中，概率是 2/3，在第四轮依然没有被选中，概率是 1/2。乘在一起，4/5 * 3/4 * 2/3 * 1/2 = 1/5。

算法结束。

你看，在整个过程中，每一个元素出现在每一个位置的概率，都是 1/5 ！

所以，这个算法是公平的。

当然了，上面只是举例子。这个证明可以很容易地拓展到数组元素个数为 n 的任意数组。整个算法的复杂度是 O(n) 的。

通过这个过程，大家也可以看到，同样的思路，我们也完全可以从前向后依次决定每个位置的数字是谁。不过从前向后，代码会复杂一些，感兴趣的同学可以想一想为什么？自己实现一下试试看？

（因为生成 [0, i] 范围的随机数比生成 [i, n) 范围的随机数简单，直接对 i+1 求余就好了。）

怎么样，是不是很酷？

这个算法除了洗牌，还能怎么用？

其实，在很多随机的地方，都能使用。比如，扫雷生成随机的盘面。我们可以把扫雷的二维盘面先逐行连接，看作是一维的。之后，把 k 颗雷依次放在开始的位置。

然后，我们运行一遍 Knuth 洗牌算法，就搞定啦：

是不是很酷？

这就是我喜欢算法的原因。在我眼里，算法从来不是枯燥的逻辑堆砌，而是神一样的逻辑创造。

尽管这个世界很复杂，但竟也如此的简洁，优雅。

作者：liuyubobobo

链接：https://www.imooc.com/article/289159

来源：慕课网

图片预览