21. IT

pandasで条件抽出する2つの方法(単一条件、複数条件)

ソースコードによって実現される素晴らしい世界に驚嘆する人
絹田 真也

こんにちは!エンジニアの絹田です。今回はPythonでAphaVantage APIを扱う方法について紹介します。

数字の場合

数字と文字列で大きく分けられるので,まずは数字の場合について説明します.

サンプルデータ

サンプルデータとしてはこちらを使います.3列100行のデータで,左からA列,B列,C列という名前にします.A列には0-99の数字を入れていて、B列, C列にはそれぞれに100-199、200から299のデータが並んでいます。

import pandas as pd 
df = pd.DataFrame({ 
	'A':[i for i in range(100)],
	'B':[i+100 for i in range(100)],
	'C':[i+200 for i in range(100)]
})
print(df)

A列が20未満を抜き出す

#方法1
df = df.query('(A < 20)')
#方法2
df = df[df['A']<20]

A列が20より大きく、かつ、50未満を抜き出す

#方法1
df = df.query('(A < 20) and (A < 50)') #方法2 df = df[(df["A"]>20)&(df["A"]<50)]

A列が20より大きく、または、50未満を抜き出す

#方法1
df = df[(df["A"]>20)|(df["A"]<50)] #方法2 df = df.query('(A > 20) | (A < 50)')
データサイエンティスト
絹田 真也
千葉県市川市在住。大手通信キャリアのデータサイエンティスト。 個人で活動する場所が欲しくてブログをしています。 NP & Companyという個人事務所でITサービス企画開発も細々しています。 通信キャリアでデータサイエンティスト←古河電工でデータエンジニアリング←慶應大学←慶應高校
twitter-timeline