前言
在前年 [2020 年] 疫情居家期间, 在 coursera 上刷过几章节吴恩达的机器学习的课程。但由于在当时看来,课程使用的语言 octave 的学习成本实在有点高,当时在学习了前几个章节后就放弃了。
而今天在浏览知乎的时候发现了下面这篇文章:
知乎 -【资源推荐】《机器学习 100 天》中文版本!
文章介绍了一个在 github 上超火的一个项目:100-Days-Of-ML-Code
查看这个项目的目录以及 readme 文件后,发现这个项目很有意思:
- 项目目前涵盖的内容比较浅显,这给了作为“初学者”的我,坚持下去的勇气。毕竟数学基本都还给老师了
(不是); - 整个项目的变成语言是 python。这对我来说是极大的利好,无需重新学些,可以避免在无关的内容上浪费时间;
- 经过尝试性的百度之后,发现相关的讨论内容页很丰富。这意味着在学习过程中遇到障碍
- ….
基于上述种种,重新去了解、学习机器学习的想法重新燃了起来。既然如此,那我们开干。
准备工作
可预见的,我们将面临大量的数据的处理、清洗工作;为了能够“从上次停下来的地方重新开始工作”,避免充重新运行大量的代码, 我们决定使用 Jupyter Notebook。
安装 Jupyter Notebook
我们在 terminal 中运行以下命令:
pip install jupyter notebook
安装完成后,只需要在 terminal 中输入下方命令即可启动 Jupyter Notebook:
jupyter notebook
安装 numpy, pandas
在 terminal 中运行命令即可:
pip3 install numpy
pip3 install pandas
安装 sklearn
在 terminal 中运行命令即可:
pip3 install sklearn
由于我之前已经安装过对应的 package,因此在此处系统提示 “requirement already satisfied”。如果之前并未安装,则需要依次运行安装命令并等待其安装完成。
因后续学习过程中,由于 sklearn 版本更新,项目中部分代码已经无法正常运行。如果在后续的进度中,你无法根据 sklearn 版本修改出错的代码,则需安装 sklearn 0.20 或之前的版本,运行下方命令即可:
pip3 install --force-reinstall scikit-learn==0.20
一切就绪
安装完成后,我们在 terminal 中输入,打开 Jupyter Notebook 吧:
jupyter notebook
命令运行后,如果顺利,我们应该会在默认浏览器中打开如上图所示的一个页面。到此,well done! 一切就绪
报错解决方法
在学习过程中遇到的较为难处理报错,都将汇总在上述页面
参考资料
https://blog.csdn.net/Glory095/article/details/123211222