使用jupyter进行数据分析
需求描述
数据挖掘过程往往是一步一步推进的,前一步的结果很大程度上会影响下一步的方法;同时,在设计具体方法时,数据分析师需要根据当前结果不断地进行调整。这种情况下,jupyter的代码与markdown交叉的形式,以及代码按照模块执行的方法,十分契合数据分析的过程。
因此,这篇文章就来讲一讲在使用jupyter notebook时可能要注意的点。
安装与环境配置
网上现成的教程很多,利用pip安装也很方便,只需要注意启动的jupyter内核应该和使用的python环境一致;如果使用的docker,记得为镜像中的8888端口设置对应接口。
使用时踩的坑
虽然刚刚开始使用,但是也经历一些小坑,在此做一些记录。
引入自定义包
python中,我们常常会习惯把不同功能的函数放到不同的.py模块下,而jupyter notebook不建议这种方式。一个notebook虽然也可以使用同一目录下其他notebook定义的函数,但是很容易出现一些奇奇怪怪的问题。
jupyter更加建议这样的一种模式:
- 每个notebook都是一个完整的内容,除了开头引入工具包(库),不调用其他自定义模块
- 尽量不定义函数,尤其是不把没有返回值的过程定义为函数
- 利用markdown的分级标题(多个‘#’)把代码分为不同的模块
markdown换行
jupyter notebook的文字部分为markdown格式,但是在换行上有些问题,刚开始时,会发现明明敲了回车,但是还是会渲染为同一行。正确的操作是: 在行尾添加两个空格,再回车,这样就换行了。
- Title: 使用jupyter进行数据分析
- Author: Huan Lee
- Created at : 2022-06-24 14:19:14
- Updated at : 2024-02-26 04:53:15
- Link: https://www.mirthfullee.com/2022/06/24/使用jupyter进行数据分析/
- License: This work is licensed under CC BY-NC-SA 4.0.