机器学习入门
1、学习资源获取渠道 2、机器学习第一语言Python 3、机器学习算法基础 4、深度学习框架基础
下面说,在机器学习这一领域,需要掌握哪些基本的Python知识。
一、Python的基本语法和应用
1、基本元素
基本上就是整数、浮点数、字符串、变量、布尔值、list、tuple、dict和常用格式文件等元素的操作和使用。
2、判断和循环
你可以理解为把上面说的一些基本元素通过if..else...., for和while等来做一些判断和循环。判断很简单,在某个节点上,如果是A,下面一步应该怎么走,如果是B,下面应该怎么走。循环也不难理解,比如说我们有一个list[1,2,3],我们把里面的每个元素都取出来做某些处理。
3、函数和类
你可以理解为我们故意把某些逻辑做成类或函数,在某些需要用到这端逻辑的场景下,我们可以直接调用相关函数,而不用重新去写这段逻辑的代码,其实就是程序猿常说的不要重复造轮子的事情 。
聪明的你是不是感觉有点熟悉似曾相识啊,对的哇,前面说的库里的模块,其实就是一个个封装好的函数哈。
再次强调,这只是你需要掌握的最最基本的东西,Python的世界可是大着呢!
二、科学计算库numpy和pandas
numpy和pandas是非常出名两个科学计算库,很多做数据分析和金融的童鞋都会用到。
那为什么机器学习会用到这两个库了?
我们先来无脑吟唱下这句话:在机器的世界里,万物皆可为向量。向量其实也算是一维的矩阵,我们的训练数据和要预测的数据也都是以矩阵的形式喂给机器的。
而numpy和pandas可以说是处理矩阵的好手,所以通常会用numpy和pandas对数据进行处理后再喂给机器,就我目前的实践经验来说,numpy应用的场景会比pandas多些。
其实好一些机器学习框架(如TensorFlow和Mxnet)也有自己处理数据的模块,但大多是通过封装numpy得到的,使用的方法也很像,所以无脑去上手numpy肯定不亏。
关于numpy和panda,我给大家提供一个PPT《机器学习numpy与pandas基础》,大概100来页,两个库的基本知识都说到了,感觉还不错,已经放在云盘里了。
另外,网上有一篇叫《十分钟搞定pandas》的文章梳理得还算清晰到位,大家不妨也去读读,反正也花不了多少时间。
《机器学习numpy与pandas基础》获取方式:详见文末
《十分钟搞定pandas》阅读地址:http://t.cn/RpYFh6h