为什么学 Python
这里我们就以数据处理、数据(含文本)分析、机器学习这几个学习方向为准,来描述一下 Python 语言的学习路径,在此之前,先弄清楚 Python 语言的内容分布。
从内容上来说,Python 可以分为三个部分——核心语言、标准库和第三方库。核心语言就是口头上说的 Python 语法,其中主要的还是数据类型;标准库是 Python 语言自带的,具有特定功能的模块的集合,例如系统交互、网络请求等,目前 Python 共有 200 多个标准库;而第三方库实质上就是 Python 语言的生态,其中包含超过 40 万个 Python 项目,涵盖各个领域,如果我们想要专攻某一学习方向,技术上来说主要就是学习具有对应功能的第三方库的使用方法以及原理。
1. Python 环境配置
这是学习 Python 的步,学编程语言可不能纸上谈兵,毕竟实践出真知,多练才能学得快。
一些 Python “小白”在自行配置 Python 环境时就会遇到各种各样的问题,有时甚至自我怀疑:我连环境都配不好,是不是废了,就这还学 Python?
其实不必如此,彻底玩明白环境配置本就不是一件简单的事情,遇到问题只不过是走了几步弯路而已,找到合适的教程就可以解决问题。回到正题,安装 Python 时解释器的选择以及开发环境的选择都是有讲究的,使用一些安装难度不高,但是功能十分强大的工具不仅可以简化安装过程,还能为后续的其他需求打好基础。
例如 Miniconda 可以在附带 Python 的情况下帮助节省空间并且提供管理 Python 环境的功能;开发环境 VSCode 既可以兼容交互式编程环境 Jupyter Notebook,又提供了丰富的插件以及代码提示、代码补全、语法错误识别等功能,后续还可以使用各种 AI 插件来增加编程效率,而且 VSCode 学习成本远低于同样热门的开发工具 Pycharm。相关工具可找我领取!
2. Python 核心语言
学习 Python 核心语言(也可以说是 Python 基础)是入门 Python 的必要一步,无论后续深入哪个方向学习,都要先学会核心语言。
那么Python 基础难学吗?强哥认为,一点都不难。Python 是数据分析御用编程语言,即使不进行数据方面的任务,也时刻与数据挂钩(当然这里的数据不是指数据集),因此数据类型的学习是 Python 语言基础中的基础。如果对 Python 基础做一个分类,那么强哥将它大致分为三部分——数据类型、控制结构、函数与类。
数据类型这一部分主要是学习数字、字符串、布尔值、空值、四种组合数据类型以及这些类型的操作方法(注意“方法”是指特定类型对象相关的函数),例如字符串的分割方法str.split()、列表类型的排序方法list.sort()。上述内容极其重要,后面如果需要进行数据处理和分析,那么关于这些类型的属性和方法都将受用。而且这些内容毫无难度可言,只是知识点较多,多种类型的灵活变换和操作需要多用才能精通。另外,在学习数据类型的过程中,你将接触到数值运算、变量定义、表达式以及代码书写规范等,早些养成良好的编程习惯也是一件非常重要的事。
控制结构主要包括判断语句、循环语句、异常处理等程序结构,常用于批量处理数据的场景中。与数据类型相比,这部分内容较少,难度也不算高,如果你有其他语言的基础,那么学习起来将会游刃有余。函数与类则是 Python 基础中稍难的一部分了,先说函数,一类是 Python 语言自带的函数,叫做内置函数,一般具有特定的单一功能。Python 中包含 68 个内置函数,这些函数中大部分都很重要,且功能实用,也不难理解,例如四舍五入函数round()、帮助函数help()(能获取一个函数或方法的文档)、操作文件的open()函数等。
另一类是自定义函数,它是由用户自己编写的具有某种特殊功能的函数,这也是因为 Python 的内置函数与数据类型显然不能应对所有工作场景,所以必须提供给用户一个自己编写函数的途径以实现特殊功能,同时,这也是第三方库发展壮大的基石,因为其他所有第三方库就如同自定义函数的集合,例如某人开发了一个能够从PDF文件中提取表格的第三方库,那么这个功能一定是通过自定义函数实现的,而我们也可以通过定义函数来解决一个特定场景下的问题。而类则是面向对象编程的产物,类的概念十分抽象,理解后对编程大有裨益,但如果我们学习 Python 的目的是数据处理与分析,那么只需要简单了解其原理即可,不必样样精通,而如果你有开发方面的需求,就需要好好学习关于面向对象和类相关的知识了。
总的来说,在数据处理与分析这条学习路线上,没有十分难学的 Python 基础知识,只是需要在知识点的基础上多练才能做到融会贯通。如果你已经有一定基础了,那么了解一下 Python 语言的内存管理机制会让你的数据处理工作更加安全、避免出现低级错误。
,如果遇到程序报错,不要对着代码呆思,一定要先从报错信息中查看是哪一行代码出了问题,然后根据报错提示信息对症下药,弄清楚错误原理后也能避免以后再出现类似的问题。



