github:howie6879/mlhub123
导航
新闻资讯
Google News: Google News Machine learning
MIT News: Machine learning | MIT News
机器之心: 机器之心 | 全球人工智能信息服务
雷锋网: 雷锋网 | 读懂智能,未来
知乎主题: 知乎机器学习热门主题
数据分析网: 数据分析网 - 大数据学习交流第一平台
17bigdata: 专注数据分析、挖掘、大数据相关领域的技术分享、交流
社区交流
DataTau: 人工智能领域的Hacker News
PaperWeekly: 一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台
Reddit: Reddit | 机器学习板块
Quora: Quora | 机器学习主题
AIQ: 机器学习大数据技术社区
极智能: 人工智能技术社区
ShortScience: 用最简单的篇幅去概况科学著作
MathOverflow: 数学知识问答社区
优质博文
Machine Learning Mastery: 帮助开发人员使用机器学习的知识解决复杂的问题
Stats and Bots - Medium: 机器学习应用程序和代码的实用指南
tornadomeet的博客: 很详细的ML&DL学习博客
爱可可-爱生活: 知名互联网资讯博主
超智能体: 分享最通俗易懂的深度学习教程
人工智能笔记: 人工智能从入门到AI统治世界
论文检索
SCI-HUB: 找论文必备
猫咪论文: 简单自由的论文下载平台
arXiv: 康奈尔大学运营的学术预印本发布的平台
GitXiv: arXiv的成果开源实现平台
Arxiv Sanity: 论文查询推荐
Papers with Code: 将论文与开源代码实现结合
比赛实践
Kaggle: 为数据科学家提供举办机器学习竞赛
KDD-CUP: 国际知识发现和数据挖掘竞赛
天池大数据: 大数据竞赛、大数据解决方案、数据科学家社区、人工智能、机器学习
DataCastle: 中国领先的数据科学竞赛平台
赛氪网: 汇集以高校竞赛为主,活动、社区为辅的大学生竞赛活动平台
DataFountain: DF,CCF指定专业大数据竞赛平台
滴滴新锐: 滴滴面向全球高校博士、硕士、优秀本科生的精英人才计划
资源
课程学习
机器学习速成课程: Google制作的节奏紧凑、内容实用的机器学习简介课程
吴恩达: 机器学习课程
吴恩达: 深度学习课程
林轩田: 机器学习基石
林轩田: 机器学习技法
liuyubobobo: Python3 入门机器学习
fast.ai: Making neural nets uncool again
3Blue1Brown: YouTube | 数学基础频道
Two Minute Papers: YouTube | 最简短的语言概况最新的热点论文
开源资源
Coursera-ML-AndrewNg-Notes: 吴恩达老师的机器学习课程个人笔记
deeplearning_ai_books: 吴恩达老师的深度学习课程笔记及资源
awesome-machine-learning-cn: 机器学习资源大全中文版,包括机器学习领域的框架、库以及软件
周志华 - 机器学习: 周志华《机器学习》笔记
ml_tutorials: 机器学习相关教程
Machine Learning、Deep Learning: ML&DL资料
MachineLearning_Python: 机器学习算法python实现
开源书籍
deeplearningbook-chinese: 深度学习中文版
Neural Networks and Deep Learning: 深度学习开源书籍
Neural Networks and Deep Learning: 深度学习开源书籍 - 中文
hands_on_Ml_with_Sklearn_and_TF: Sklearn与TensorFlow机器学习实用指南
机器学习实战: Machine Learning in Action(机器学习实战)
文档
名库文档
TensorFlow: TF官方文档
PyTorch: PyTorch官方文档
Caffe: 一个基于表达式,速度和模块化原则创建的深度学习框架
Keras: Keras官方文档
Neon: Nervana公司一个基于Python的深度学习库
Chainer: 基于Python的独立的深度学习模型开源框架
scikit-learn: scikit-learn官方文档
PyBrain: 一个模块化的Python机器学习库
Statsmodels: 用来探索数据,估计统计模型,进行统计测试
Theano: 允许高效地定义、优化以及评估涉及多维数组的数学表达式
Pylearn2: 构建于Theano之上的机器学习库
Gensim: 包含可扩展的统计语义,分析纯文本文档的语义结构,以及检索相似语义的文档等功能
NumPy: NumPy官方文档
pandas: pandas官方文档
Matplotlib: Matplotlib官方文档
======================================
一、前言
AI 初学者最大的问题就是:
资料太多!!!看不完!!!不知道如何取舍!!!人的精力有限!!!
我把 公众号创办以来的原创文章进行整理,文章适合本科、硕士以及刚接触机器学习的博士。
学完这些文章学完以后,就基本入门了。
入门以后,遇到问题能上网搜索解决了,也知道接下来应该学什么。
本文建议用收藏,利用碎片时间学习。
二、学习路线
这篇文章为初学者提供了入门的路线。包含数学基础、python 入门、机器学习、深度学习、特征工程入门等。并把代码放在了 github 仓库:
https://github.com/fengdu78/Data-Science-Notes
这篇文章将机器学习的精华部分做成了手册,打开微信就能学习,适合平时时间少的朋友学习机器学习,可以在通勤的时候在手机上学习,建议收藏本文慢慢学习
三、基础知识
上面这篇文章是数学基础,也是以下五篇文章的整合版本,可以在线阅读,也可以根据需要分别阅读。
四、机器学习
原创作品为以下三个:
后来又制作成了在线阅读版本:
机器学习相关
五、深度学习
吴恩达深度学习课程笔记和资源
TensorFlow 入门:
keras 入门:
Pytorch入门:
其他资料
六、Python 相关
七、NLP
八、学术技巧
适合初学者入门人工智能的路线及资料下载
本文为AI入门提供了一个简易的学习路线,并提供了代码和数据集下载。(黄海广)
一、前言
AI以及机器学习入门,初学者遇到的问题非常多,但最大的问题就是:
资料太多!!!看不完!!!不知道如何取舍!!!人的精力有限!!!
我曾经写了一篇初学者入门的文章:《机器学习简易入门-附推荐学习资料》,这篇文章给初学者指明了学习的方向,受到广大初学者好评。
在此基础上,结合本站已经发过的文章,以及自己的学习过程,整理出一个AI的入门路线,并整合到一个github仓库,所有代码和数据集都提供了下载方式。
本路线适合本科、硕士以及刚接触机器学习的博士。
根据这个github仓库学完以后,就基本入门了。
入门以后,遇到问题能上网搜索解决了,也知道接下来应该学什么。
二、学习路线的github
该仓库拥有者黄海广,致力于帮助机器学习初学者入门,帮助学习者更好地成长。仓库主要内容由黄海广原创,另一部分由其他公益组织创作。
仓库链接:
https://github.com/fengdu78/Data-Science-Notes
你不是一个人在战斗!
三、仓库目录及概述
0.math
数学基础
1.python-basic
python基础
2.numpy
numpy基础
3.pandas
pandas基础
4.scipy
scipy基础
5.data-visualization
数据可视化基础
6.scikit-learn
scikit-learn基础
7.machine-learning
机器学习入门
8.deep-learning
深度学习入门
9.feature-engineering
特征工程入门
四、学习路线说明
这个目录其实是一个学习路线:
0——>1——>2——>3——>4——>5——>6——>7——>8——>9
1-5是个整体,6和7的顺序可以交换也可以同时学习,8属于选学部分(深度学习),9放在最后学习。
五、学习路线和内容
第一部分,数学基础学习:
目录名称:0.math
数学基础:数学基础内容太多,很容易把人劝退,其实先把高等数学、概率论与数理统计和线性代数这三门课学熟了,大部分机器学习问题是能解决的。数学基础部分我放了三个资料。
第一个是当时考研和考博士复习的。数学基础,我把机器学习的部分,提炼出来。
第二、三个是今年刚翻译的CS229的线性代数和概率论,这部分是斯坦福所有人工智能有关的课程的数学基础复习材料,非常实用。
这部分内容曾经有文章介绍(查看文章)
第二部分,python学习
目录名称:1.python-basic
python基础:这里有个代码练习:两天入门python
目录名称: 2.numpy
numpy基础:这里有2个代码练习
一、适合初学者快速入门的Numpy实战全集
二、Numpy练习题100题-提高你的数据分析技能
目录名称: 3.pandas
pandas基础:这里有3个代码练习
一、《十分钟搞定pandas》:10-Minutes-to-pandas,这是十分钟搞定pandas 10 minutes in pandas的中文翻译。
二、《pandas练习题》:Pandas_Exercises,这个是pandas的练习题。
三、《pandas入门教程-2天学会pandas》:pandas_beginner
目录名称: 4.scipy
scipy基础:scipy的示例代码
目录名称: 5.data-visualization
数据可视化基础:这里有2个代码练习
一、matplotlib学习之基本使用
二、数据可视化的利器-Seaborn简易入门
第三部分,机器学习基础
目录名称:6.scikit-learn
scikit-learn基础:PyParis 2018: Machine learning using scikit-learn的代码翻译(截图如下:)
图:代码截图
目录名称:7.machine-learning
机器学习入门,推荐4份教程,着重推荐1、2部分。
一、斯坦福大学2014(吴恩达)机器学习教程中文笔记及资源
内容介绍(点击查看文章)
二、李航《统计学习方法》的代码实现
内容介绍(点击查看文章)
三、周志华老师的《机器学习》的解答--南瓜书PumpkinBook
内容介绍(点击查看文章)
四、台大林轩田《机器学习基石》系列课程教材的习题解答
内容介绍(点击查看文章)
目录名称:8.deep-learning
深度学习入门,推荐3份教程
一、深度学习教程中文笔记
内容介绍(点击查看文章)
二、《python深度学习》的代码翻译版
内容介绍(点击查看文章)
三、 强烈推荐的TensorFlow、Pytorch和Keras的样例资源
内容介绍(点击查看文章)
目录名称:9.feature-engineering
特征工程入门,这个是项目实战部分。
一、面向机器学习的特征工程
内容介绍(点击查看文章)
总结
本文提供了适合初学者入门AI的路线及资料下载,以上内容都整合到一个仓库:
仓库链接:
https://github.com/fengdu78/Data-Science-Notes
==========================================
1. 前言
机器学习的基本方法论说简单点就是在已知的数据集中寻找数据的规律,在未知的数据集中寻找数据的关系,为找到样本数据的规律,就需要提取数据的特征,建立模型。
在学习机器学习的过程中,花了很多时间搜集资料,今天就全部整理出来,其中有的是自己正在看的而且觉得好的,有的是别人推荐的,如果你也有觉得很好的资料或开源项目,欢迎留言分享。
交流和分享最能让技术人进步!
2. 学习路线
![](https://pic1.zhimg.com/80/v2-81fd51b5ae0486542a3409399a010ee8_720w.jpg)
3. 数学
微积分
《麻省理工学院公开课:单变量微积分》
http://open.163.com/special/sp/singlevariablecalculus.html
线性代数
《麻省理工学院公开课:线性代数》
http://open.163.com/special/opencourse/daishu.html
概率统计
《可汗学院公开课:概率》
http://open.163.com/special/Khan/probability.html
《可汗学院公开课:统计学》
http://open.163.com/special/Khan/khstatistics.html
4. Python
![](https://pic4.zhimg.com/80/v2-b4dd583575fb686e0b53d5329e8f7e7b_720w.jpg)
5. 机器学习
5.1 机器学习理论
视频:
《机器学习基石》、《机器学习技法》—台湾大学林轩田;
《吴恩达机器学习视频》
https://www.coursera.org/learn/machine-learning
书籍:
《统计学习方法》——李航
《机器学习》——周志华
《模式识别与机器学习》
5.2 机器学习实战
书籍:
《Python机器学习及实践_从零开始通往Kaggle竞赛之路》
《机器学习实战》
其他:
GitHub:100天机器学习挑战项目:
https://github.com/Avik-Jain/100-Days-Of-ML-Code
莫烦视频教程:
https://morvanzhou.github.io/about/
6. 其他
除了以上介绍的,下面这些资源也很不错
YouTuBe - Google Developer:
从hello world讲到如何使用tensorflow
https://www.youtube.com/playlist?list=PLOU2XLYxmsIIuiBfYad6rFYQU_jL2ryal,
用python玩机器学习:
pyhttps://pythonprogramming.net/machine-learning-tutorial-python-introduction/
不错的博客:
https://machinelearningmastery.com/blog/
Github上的机器学习与深度学习教程:
https://github.com/ujjwalkarn/Machine-Learning-Tutorials
Coding Your Ambition!
http://weixin.qq.com/r/hy6ttUvEEBZvrQ-W93uV (二维码自动识别)
===============================================
机器学习理论是一个涵盖统计、概率、计算机科学和算法方面的领域,该理论的初衷是以迭代方式从数据中学习,找到可用于构建智能应用程序的隐藏洞察。
尽管机器学习和深度学习有巨大的发展潜力,但要深入掌握算法的内部工作原理并获得良好的结果,就必须透彻地了解许多技术的数学原理。
为什么学习数学?
机器学习的数学原理很重要,下面重点介绍部分原因:
选择正确的算法,这涉及到考虑准确率、训练时间、模型复杂性、参数数量和特征数量。
选择参数设置和验证策略。
通过理解偏差-方差权衡,识别欠拟合和过拟合。
估算正确的置信区间和不确定性。
多高的数学知识水平?
在尝试理解诸如机器学习这样的跨学科领域时,需要考虑的主要问题是,理解这些技术需要多大的数学知识量和多高的数学知识水平。此问题的答案涉及多个维度,而且取决于个人的知识水平和兴趣。对机器学习的数学公式和理论发展的研究从未间断过,一些研究人员正在研究更高级的技术。下面介绍成为机器学习工程师所需的最低数学知识水平,每个数学概念的重要性,以及相应的学习资源。
有哪些数学知识?
线性代数:在机器学习中,线性代数无处不在。要理解用于机器学习的优化方法,需要掌握许多主题,比如主成份分析(PCA)、奇异值分解(SVD)、矩阵特征分解、LU分解、QR分解/因式分解、对称矩阵、正交化/标准正交化、矩阵运算、投影、特征值和特征矢量、矢量空间,以及范数。资源:《麻省理工公开课-线性代数》、《可汗学院公开课:线性代数》、《同济大学公开课:线性代数》、《山东大学MOOC-线性代数》、《线性代数讲义 - 华东师范大学数学系》、《线性代数-北京大学出版社》、线性代数-维基百科、MIT-18.06-线性代数-完整笔记 、两小时讲完线性代数 、《矩阵编码:线性代数在计算机科学中的应用》、《线性代数应用-戴维森学院》
概率论和统计学:机器学习需要的一些基本的统计和概率理论包括组合学、概率规则和公理、贝叶斯定理、随机变量、方差和预期、假设检验、A / B检验、置信区间、p值、线性回归、正则化、概率分布函数、条件和联合分布、标准分布(伯努利、二项式、多项式、均匀和高斯分布)、矩母函数、最大似然估计(MLE)、先验和后验、最大后验概率估计(MAP),以及采样方法。资源:《可汗学院公开课:统计学》、《加利福尼亚大学伯克利分校公开课:统计学》、《浙江大学公开课:概率论与数理统计》、《可汗学院公开课:概率》、《概率论与数理统计-重庆大学公开课》、《概率论与数理统计-北京大学公开课》、《概率论与数理统计》浙大版(第四版) 、《概率论与数理统计-中科大公开课》、《商务与经济统计-北师大公开课》、《哈佛大学统计学110讲稿》、《概率论和统计学-Khan Academy》
微积分:一些必要的主题包括微积分、偏微分、矢量-值函数、方向梯度、海赛函数、雅可比行列式、拉普拉斯算子和拉格朗日分布等。资源:《麻省理工学院公开课:微积分重点》、《清华大学微积分主讲-刘坤林》、《微积分-浙江大学》、《麻省理工学院公开课:多变量微积分》、《可汗学院公开课:微积分预备》、《麻省理工学院公开课:单变量微积分》、《HACC公开课:微积分1》、《HACC公开课:微积分II》、《微积分—多元函数与重积分-清华大学》、《数学分析讲义 - 南京大学数学系》、《7天搞定微积分》、《托马斯微积分》
算法和复杂优化:这对理解机器学习算法的计算效率和可伸缩性,以及利用数据集的稀疏性都很重要。需要数据结构(二叉树、哈希运算、堆、堆栈等)、动态编程、随机化和次线性算法、图表、梯度/随机下降,以及原对偶方法的知识。资源:《麻省理工学院公开课:算法导论》、《北京大学公开课:程序设计与算法基础》、《算法学习笔记 - GitHub》、《算法导论 中文版》、《机器学习导论-上海交通大学 张志华》、《机器学习算法基础》、《机器学习(Machine Learning)- 吴恩达》、《十大算法精讲》、《MIT算法导论全套》
最优化和运筹学:这些主题与应用数学中的传统话语没什么不同,因为它们在专业领域——理论计算机科学、控制理论或运筹学中最为相关和最广泛使用。实际上,每种机器学习算法旨在最小化受各种约束影响的某种估计误差,这就是优化问题。要学习的内容包括:优化的基础-如何制定问题、最大值、最小值、凸函数、全局解、线性规划、单纯形算法、整数规划、约束编程、背包问题等等。资源:《运筹学-黄丽娟》、《运筹学-江西财经大学》、《运筹学-陆军工程大学》、《西安交通大学 运筹学》、《Linear Programing简略版》、《斯坦福大学-凸优化》、《优化-Khan Academy》
结语
最后,这些数学知识绝对能在优化你的你的机器学习算法中发挥巨大的作用,当然你也不必学习每一个细节。上面的课程仅作参考,根据自己需要高效学习。