データ分析・初級問題チェック
問題 22 /40
pandasでファイルからデータを読み込む場合、誤っているメソッドはどれか。
選択 1
read_csv
選択 2
read_excel
選択 3
read_html
選択 4
read_database
解説
選択肢4が正解です。
pandasにread_databaseメソッドはありません。pandasでデータベースからデータを読み込む際は、sqlalchemyモジュールを利用してデータベースに接続し、read_sqlメソッドで読み込みます。
選択肢1、2、3のread_csv、read_excel、read_htmlは正しいメソッドです。
read_csvメソッドは多数の引数が用意されています。例えば引数「header」でカラム名として使う行番号を指定したり、引数「index_col」でインデックス名として使う列番号を指定することができます。
次のCSVファイルで、先頭行をカラム名に指定し、先頭列をインデックス名に指定する場合を考えます。
sample.csv
-------------------------------
,A列,B列,C列
1行,1,2,3
2行,4,5,6
3行,7,8,9
-------------------------------
df = pd.read_csv('sample.csv')
▶︎
引数がない場合、先頭行がカラム名になり、インデックス名は連番が付与されます。引数で「header=None」とすると、カラム名も連番が付与されます。
df = pd.read_csv('sample.csv', index_col=0)
▶︎
引数「index_col=0」で、先頭列をインデックス名にするよう指定しています。
(公式書籍 p.145-148)

