博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用pandas的dataframe清理excel里面空值
阅读量:6329 次
发布时间:2019-06-22

本文共 529 字,大约阅读时间需要 1 分钟。

  hot3.png

Python3

import numpy as npimport pandas as pddf = pd.read_excel('myData.xls', sheet_name='Sheet1')print(df)df1 = df.replace(np.nan, '', regex=True)print(df1)

DataFrame

replate

DataFrame这是一个pandas的概念,可以简单理解成一个表格。在print(df)会看到有些数据为NaN,需要清洗掉这个部分数据,需要pandas结合numpy一起使用,关键代码如下:

df1 = df.replace(np.nan, '', regex=True)

把DataFrame里面数据为NaN的替换成空字符串的数据。

dropnp

df1 = df.dropna()

dropna方法,可以直接删除一行包含无效数据(NAN)的数据。

总结

这里主要了解pandas里面的DataFrame的概念,以及怎么样结合numpy进行数据预处理。还涉及到了pandas读取excel文件的使用。

参考:

转载于:https://my.oschina.net/fxtxz2/blog/1936060

你可能感兴趣的文章
Linux内核同步:RCU
查看>>
Android逆向进阶——让你自由自在脱壳的热身运动(dex篇)
查看>>
Java设计模式之五大创建型模式(附实例和详解)
查看>>
60 Permutation Sequence
查看>>
主流的RPC框架有哪些
查看>>
Hive学习之路 (七)Hive的DDL操作
查看>>
[转]mysql使用关键字作为列名的处理方式
查看>>
awesome go library 库,推荐使用的golang库
查看>>
树形展示形式的论坛
查看>>
jdbcTemplate 调用存储过程。 入参 array 返回 cursor
查看>>
C++中的stack类、QT中的QStack类
查看>>
Linux常用基本命令[cp]
查看>>
CSS 相对|绝对(relative/absolute)定位系列(一)
查看>>
关于 Nginx 配置 WebSocket 400 问题
查看>>
Glide和Govendor安装和使用
查看>>
Java全角、半角字符的关系以及转换
查看>>
Dubbo和Zookeeper
查看>>
前端项目课程3 jquery1.8.3到1.11.1有了哪些新改变
查看>>
UOJ#179. 线性规划(线性规划)
查看>>
整合spring cloud云架构 - SSO单点登录之OAuth2.0登录认证(1)
查看>>