データ分析・初級問題チェック

問題 22 /40

pandasでファイルからデータを読み込む場合、誤っているメソッドはどれか。

選択 1

read_csv

選択 2

read_excel

選択 3

read_html

選択 4

read_database

解説

選択肢4が正解です。 pandasにread_databaseメソッドはありません。pandasでデータベースからデータを読み込む際は、sqlalchemyモジュールを利用してデータベースに接続し、read_sqlメソッドで読み込みます。 選択肢1、2、3のread_csv、read_excel、read_htmlは正しいメソッドです。 read_csvメソッドは多数の引数が用意されています。例えば引数「header」でカラム名として使う行番号を指定したり、引数「index_col」でインデックス名として使う列番号を指定することができます。 次のCSVファイルで、先頭行をカラム名に指定し、先頭列をインデックス名に指定する場合を考えます。 sample.csv ------------------------------- ,A列,B列,C列 1行,1,2,3 2行,4,5,6 3行,7,8,9 ------------------------------- df = pd.read_csv('sample.csv') ▶︎ 引数がない場合、先頭行がカラム名になり、インデックス名は連番が付与されます。引数で「header=None」とすると、カラム名も連番が付与されます。 df = pd.read_csv('sample.csv', index_col=0) ▶︎ 引数「index_col=0」で、先頭列をインデックス名にするよう指定しています。 (公式書籍 p.145-148)