前言

在前年[2020年]疫情居家期间, 在 coursera 上刷过几章节吴恩达的机器学习的课程。但由于在当时看来,课程使用的语言 octave 的学习成本实在有点高,当时在学习了前几个章节后就放弃了。

 

而今天在浏览知乎的时候发现了下面这篇文章:
知乎-【资源推荐】《机器学习100天》中文版本!

文章介绍了一个在 github上超火的一个项目:100-Days-Of-ML-Code 

c项目目录
项目目录

查看这个项目的目录以及 readme 文件后,发现这个项目很有意思:

  1. 项目目前涵盖的内容比较浅显,这给了作为“初学者”的我,坚持下去的勇气。毕竟数学基本都还给老师了(不是)
  2. 整个项目的变成语言是 python 。这对我来说是极大的利好,无需重新学些,可以避免在无关的内容上浪费时间;
  3. 经过尝试性的百度之后,发现相关的讨论内容页很丰富。这意味着在学习过程中遇到障碍
  4. ....

 

基于上述种种,重新去了解、学习机器学习的想法重新燃了起来。既然如此,那我们开干。

 

准备工作

可预见的,我们将面临大量的数据的处理、清洗工作;为了能够“从上次停下来的地方重新开始工作”,避免充重新运行大量的代码,我们决定使用 Jupyter Notebook 。

安装Jupyter Notebook

我们在 terminal 中运行以下命令:

pip install jupyter notebook

安装完成后,只需要在 terminal 中输入下方命令即可启动 Jupyter Notebook :

jupyter notebook

 

安装 numpy,  pandas

在 terminal 中运行命令即可:

pip3 install numpy

pip3 install pandas

 

安装 sklearn

在 terminal 中运行命令即可:

pip3 install sklearn

由于我之前已经安装过对应的package,因此在此处系统提示 "requirement already satisfied"。如果之前并未安装,则需要依次运行安装命令并等待其安装完成。

因后续学习过程中,由于sklearn版本更新,项目中部分代码已经无法正常运行。如果在后续的进度中,你无法根据sklearn版本修改出错的代码,则需安装sklearn 0.20或之前的版本,运行下方命令即可:

1
pip3 install --force-reinstall scikit-learn==0.20

 

一切就绪

安装完成后,我们在 terminal 中输入,打开 Jupyter Notebook 吧:

jupyter notebook

命令运行后,如果顺利,我们应该会在默认浏览器中打开如上图所示的一个页面。到此,well done! 一切就绪

报错解决方法

机器学习100天相关报错处理方法

在学习过程中遇到的较为难处理报错,都将汇总在上述页面

 

 

参考资料

https://blog.csdn.net/Glory095/article/details/123211222