使用jupyter进行数据分析

Huan Lee Lv5

需求描述

数据挖掘过程往往是一步一步推进的,前一步的结果很大程度上会影响下一步的方法;同时,在设计具体方法时,数据分析师需要根据当前结果不断地进行调整。这种情况下,jupyter的代码与markdown交叉的形式,以及代码按照模块执行的方法,十分契合数据分析的过程。
因此,这篇文章就来讲一讲在使用jupyter notebook时可能要注意的点。

安装与环境配置

网上现成的教程很多,利用pip安装也很方便,只需要注意启动的jupyter内核应该和使用的python环境一致;如果使用的docker,记得为镜像中的8888端口设置对应接口。

使用时踩的坑

虽然刚刚开始使用,但是也经历一些小坑,在此做一些记录。

引入自定义包

python中,我们常常会习惯把不同功能的函数放到不同的.py模块下,而jupyter notebook不建议这种方式。一个notebook虽然也可以使用同一目录下其他notebook定义的函数,但是很容易出现一些奇奇怪怪的问题。
jupyter更加建议这样的一种模式:

  • 每个notebook都是一个完整的内容,除了开头引入工具包(库),不调用其他自定义模块
  • 尽量不定义函数,尤其是不把没有返回值的过程定义为函数
  • 利用markdown的分级标题(多个‘#’)把代码分为不同的模块

markdown换行

jupyter notebook的文字部分为markdown格式,但是在换行上有些问题,刚开始时,会发现明明敲了回车,但是还是会渲染为同一行。正确的操作是: 在行尾添加两个空格,再回车,这样就换行了。

  • Title: 使用jupyter进行数据分析
  • Author: Huan Lee
  • Created at : 2022-06-24 14:19:14
  • Updated at : 2024-02-26 04:53:15
  • Link: https://www.mirthfullee.com/2022/06/24/使用jupyter进行数据分析/
  • License: This work is licensed under CC BY-NC-SA 4.0.