Data Analytics using Python - Week 2-1

今日はpandaをはじめて触った。

 

ExcelシートをDataFrame型に読み込んで、その情報を取得するを学んだ。

  • df.shape > (column count, row count)
  • df.count("column name") > count of values
  • df.columns > list of column headers
  • df.dtypes > list of data type of each column
  • df.head(int) > the first [int] rows of data
  • df.drop_duplicates("column name") 
  • df["column name"] > list of values of the column
    • column nameは複数をリスト(["a", "b", "c"])で指定可能

 

明日は2週目後半、データの操作方法について。