pandas官方对DataFrame的定义了三个特点:Two-dimensional(二维), size-mutable(尺寸可变), potentially heterogeneous tabular data(潜在的异构表格型数据)。
通俗的说,DataFrame是一种表格型数据结构,由行(rows)和列(columns)组成,index为行索引,column为列索引。我们可以对整行和整列进行操作。可以理解成是一种存放Series对象,结构类似于字典的容器。
由于DataFrame用起来方便,很多库都基于DataFrame编写。接下来介绍DataFrame如何根据列值选择行。
1、要选择列值等于标量的行,可以使用==。
df.loc[df[‘column_name’] == some_value]
2、要选择列值在可迭代中的行,可以使用isin。
df.loc[df[‘column_name’].isin(some_values)]
将多个条件与&:
df.loc[(df[‘column_name’] >= A) & (df[‘column_name’] <= B)]
注意括号。
3、由于Python的运算符优先级规则,&绑定比<=and更紧密>=。
因此,最后一个例子中的括号是必要的。
没有括号
df[‘column_name’] >= A & df[‘column_name’] <= B
被解析为
df[‘column_name’] >= (A & df[‘column_name’]) <= B
以上就是Python DataFrame根据列值选择行的方法,希望对大家有所帮助。
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试