Skip to content

Latest commit

 

History

History
877 lines (399 loc) · 37 KB

MachineLearning_resources.md

File metadata and controls

877 lines (399 loc) · 37 KB

资源&教程&项目

综合资源

  1. 深度学习入门教程&&优秀文章&&Deep Learning Tutorial--非常全面完整的深度学习资料,包括教程、发展史、文章、项目等
  2. Awesome Computer Vision--Github 上的一个9000+星的资源,包含书籍、课程、教程、论文、数据集、博客等等
  3. 资源汇总 | 200多个最好的机器学习、NLP和Python相关教程
  4. AI算法工程师手册--包含数学基础、机器学习、深度学习、计算机视觉和NLP等知识
  5. StateOfTheArt.ai --AI 界的 State of the Art都在这里了
  6. awesome-fashion-ai--有关 fashion 和 e-commerce 方面的研究论文、数据集等
  7. AlphaTree-graphic-deep-neural-network--介绍了深度学习的一些模型,并且有图示,包含了图像分类、物体检测、人脸检测与识别等方向
  8. AiLearning: 机器学习 - MachineLearning - ML、深度学习 - DeepLearning - DL、自然语言处理 NLP
  9. A complete ML study path, focused on TensorFlow and Scikit-Learn--机器学习的学习路线
  10. Awesome-nlp:nlp 相关的资源、教程等
  11. 深度学习网络模型大全(基于TensorFlow和PyTorch实现)
  12. 深度学习工程师生存指南--讲述一个深度学习工程师所需的所有东西,配置选择工作站、本地电脑、Python库,Linux常用命令、常用数据集、网络模型等 
  13. 十个最常用深度学习图像/视频数据标注工具
  14. keras pytorch 构建模型对比
  15. 卷积核可视化网站
  16. Shift-AI-models-to-real-world-products--AI模型落地的建议
  17. 计算机视觉领域资源汇总(Awesome-CV-Resources)
  18. 机器学习免费资源中心:https://aihub.cloud.google.com/u/0/

网上教程

机器学习

深度学习

CNN

图神经网络

RNN & LSTM

Attention

人脸

场景文字识别检测

智能运维

综合资源

文章

数据库

特征工程

介绍的文章 https://mp.weixin.qq.com/s/dMuTcHNIyb5cpneZhdLE_Q

NLP

模型压缩

  • model-compression:基于pytorch实现模型压缩(1、量化:8/4/2 bits(dorefa)、三值/二值(twn/bnn/xnor-net);2、剪枝:正常、规整、针对分组卷积结构的通道剪枝;3、分组卷积结构;4、针对特征A二值的BN融合)

Docker

环境配置


视频课程

机器学习

机器学习基石 [课程主页] [b站视频] 配套书籍:Learning From Data 笔记和习题

机器学习技法 [b站视频]

深度学习


书籍

机器学习

  • 《统计学习方法》

代码:https://github.com/wzyonggege/statistical-learning-method

https://github.com/WenDesi/lihang_book_algorithm

https://blog.csdn.net/tudaodiaozhale

https://github.com/fengdu78/lihang-code

https://github.com/SmirkCao/Lihang

  • 《机器学习》--周志华

南瓜书: https://github.com/datawhalechina/pumpkin-book 对书中公式的补充推导,在线阅读地址:https://datawhalechina.github.io/pumpkin-book

深度学习


网站

国内

国外


工具

综合

  1. AI 研究工具:https://github.com/bighuang624/AI-research-tools

文献翻译

  1. CopyTranslator:最大的优点在于有置顶、点按复制、监听剪贴板等功能,阅读文献配合使用时可以无缝切换,非常方便。

论文

顶会

AAAI: 顶级人工智能综合会议

2019年accepted paper:

https://aaai.org/Conferences/AAAI-19/wp-content/uploads/2018/11/AAAI-19_Accepted_Papers.pdf

2018年accepted paper:

https://aaai.org/Conferences/AAAI-18/wp-content/uploads/2017/12/AAAI-18-Accepted-Paper-List.Web_.pdf

2017年accepted paper:

https://www.aaai.org/Conferences/AAAI/2017/aaai17accepted-papers.pdf

IJCAI: 顶级人工智能综合会议

2018年accepted paper:

http://www.ijcai-18.org/accepted-papers/index.html

2017年accepted paper:

https://ijcai-17.org/accepted-papers.html

ICML :顶级机器学习会议

2018年accepted paper:

https://icml.cc/Conferences/2018/Schedule?type=Poster

2017年accepted paper:

https://icml.cc/Conferences/2017/Schedule?type=Poster

NIPS:顶级综合人工智能会议

2018年accepted paper:

https://nips.cc/Conferences/2018/Schedule?type=Poster

2017年accepted paper:

https://nips.cc/Conferences/2017/Schedule?type=Poster

CVPR:计算机视觉和模式识别

CVPR 2019 accepted paper:http://openaccess.thecvf.com/CVPR2019.py CVPR 2018 accepted paper:http://openaccess.thecvf.com/CVPR2018.py CVPR 2017 accepted paper:http://openaccess.thecvf.com/CVPR2017.py

ICCV:国际计算机视觉大会

ECCV:欧洲计算机视觉国际会议

ECCV 2018 accepted paper:http://openaccess.thecvf.com/ECCV2018.py

综合资源

网站


项目 & Github

人脸

计算机视觉

GAN


博客

国内

  1. 机器学习--tornadomeet--这是别人学习机器学习和深度学习做下笔记的博客,有好几十篇博文呢。
  2. zouxy09的专栏--这个博客不只有机器学习内容,还有一个深度学习的系列。
  3. Machine Learning--也是有关机器学习的一个博客。
  4. 美团技术团队
  5. 苏剑林的博客
  6. **火光摇曳:**腾讯技术大牛们的博客

国外

公司&组织

  1. OpenAI--OpenAI
  2. Distill--Distill
  3. Google AI Blog--谷歌AI的博客
  4. Notes on machine learning
  5. BAIR Blog--伯克利大学AI小组博客
  6. DeepMind Blog--DeepMind的博客
  7. FAIR Blog--Facebook AI博客
  8. **Netflix:**Netflix技术博客
  9. Towards Data Science
  10. Learn Opencv
  11. (推荐)PyimageSearch--计算机视觉、opencv等,并且都是详细实现代码,每一步实现都解释得很清楚!
  12. machinelearningmastery

个人

  1. SALu--有关于 GAN 方面的文章
  2. Colah’s Blog--神经网络理解方面的入门,以及深度学习知识
  3. Ruder’s Blog--多任务学习、迁移学习
  4. inFERENCe
  5. Andrew Trask’s Blog
  6. Adit Deshpande’s Blog--比较适合入门神经网络
  7. Graduate Descent

比赛

比赛网站

  1. Kaggle
  2. 天池
  3. DataFountain
  4. FlyAI
  5. JData

比赛经验

比赛代码


数据集

八大机器学习数据集

文章介绍:[原文][翻译]

1. Kaggle 数据集

数据集地址:

https://www.kaggle.com/datasets

每个数据集都是一个小型社区,用户可以在其中讨论数据、查找公共代码或在内核中创建自己的项目。包含各式各样的真实数据集。

用户还可以看到与每个数据集相关的“内核”,许多数据科学家还提供了相关手册来分析数据集。

2. Amazon 数据集

数据集地址:

https://registry.opendata.aws/

该数据源包含多个不同领域的数据集,如:公共交通、生态资源、卫星图像等。

网页中也有一个搜索框来帮助用户寻找想要的数据集,还有所有数据集的描述和使用示例,这些数据集信息丰富且易于使用!

数据集存储在Amazon Web Services (AWS)资源中,比如Amazon S3——云中的一个高度可伸缩的对象存储服务。

如果用户正在使用AWS进行机器学习实验和开发,这将非常方便,由于它是AWS网络的本地数据,因此数据集的传输将非常快。

3. UCI机器学习资源库

数据集地址:

https://archive.ics.uci.edu/ml/datasets.html

另一个来自加州大学信息与计算机科学学院的大型资源库,包含100多个数据集。

用户可以找到单变量和多变量时间序列数据集,分类、回归或推荐系统的数据集。

有些UCI的数据集已经是被清洗过的。

4. 谷歌数据集搜索引擎

数据集地址:

https://toolbox.google.com/datasetsearch

在2018年末,谷歌做了他们最擅长的事情,推出了另一项伟大的服务——它是一个可以按名称搜索数据集的工具箱。

他们的目标是统一成千上万个不同的数据集存储库,使这些数据能够且易被发现。

5. 微软数据集

数据集地址:

https://msropendata.com/

2018年7月,微软与外部研究社区共同宣布推出“Microsoft Research Open Data”。

它在云中包含一个数据存储库,用于促进全球研究社区之间的协作。它提供了一系列用于已发表研究的、经过处理的数据集。

6. Awesome Public Datasets Collection

数据集地址:

https://github.com/awesomedata/awesome-public-datasets

这是一个按“主题”组织的数据集,比如生物学、经济学、教育学等。

这里列出的大多数数据集都是免费的,但是在使用任何数据集之前,用户需要检查一下许可要求。

7. 政府数据集

政府相关数据集也很容易找到的。

许多国家为了提高透明度,向公众分享了各种数据集。以下是一些例子:

欧盟开放数据门户:欧洲政府数据集。

数据集地址:

https://data.europa.eu/euodp/data/dataset

美国政府数据:目前由于一些非政治性原因,暂时无法访问。

数据集地址:

https://www.data.gov/

新西兰政府数据集:

数据集地址:

https://catalogue.data.govt.nz/dataset

印度政府数据集:

数据集地址:

https://data.gov.in/

8. 计算机视觉数据集

数据集地址:

https://www.visualdata.io/

Visual Data包含一些可以用来构建计算机视觉(CV)模型的大型数据集。

用户可以通过特定的CV主题查找特定的数据集,如语义分割、图像标题、图像生成,甚至可以通过解决方案(自动驾驶汽车数据集)查找特定的数据集。

常用数据集

  1. Mnist:手写数字数据集,包含 60000 张训练集和 10000 张测试集。
  2. fashion-mnist [官网] [Github]
  3. Cifar:分为 Cifar10 和 Cifar100。前者包含 60000 张图片,总共10个类别,每类 6000 张图片。后者是 100 个类别,每个类别 600 张图片。类别包括猫狗鸟等动物、飞机汽车船等交通工具。
  4. Imagenet:应该是目前最大的开源图像数据集,包含 1500 万张图片,2.2 万个类别。
  5. lsun [官网] [Github]
  6. Open Images V4[Description][Download][Paper]--包含 600 个类别,900w 张数据集,包含图片标签、物体检测框以及视觉关系的标注信息。

人脸数据集

  1. LFW
  2. CelebA

数据集介绍:https://blog.csdn.net/Cloudox_/article/details/78432517

百度云下载:https://pan.baidu.com/s/1eSNpdRG#list/path=%2FCelebA%2FImg

  1. MS-Celeb-1M
  2. CASIA-WebFace
  3. FaceScrub
  4. MegaFace

衣服数据集

  1. Fashion Detection in the Wild (Deep Clothes Detector)

数据集:Large-scale Fashion (DeepFashion) Database

论文:DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations.

作者介绍[Home][PPT]

文章:

  1. MULTI-VIEW CLOTHING DATASET

论文:MVC: A Dataset for View-Invariant Clothing Retrieval and Attribute Prediction

数据集:数据集

  1. DeepFashion2

Github:https://github.com/switchablenorms/DeepFashion2


面试资料

综合

题目

简历制作

  • Deedy-Resume中文版:简历分为左右两栏,用 XeTeX 进行排版,双栏设计使页面可容纳更多信息。
  • CV:简历模板的界面设计简洁清晰,技能堆栈、项目经历、实习经历、教育背景一目了然。
  • ResumeSample:作为一款在 GitHub 上有着接近两万 Star 的简历模板,在技术圈内有较高的知名度,不少开发者对上面所提供的内容也赞赏有加。这个模板里面包含 PHP、iOS、Android、架构师、通用程序员等相关岗位的简历模板,其中的技能清单与技能关键字有比较高的参考价值。
  • 适合中文的简历模板收集(LaTeX,HTML/JS and so on)