book

為何 Pandas ?

Pandas 是 Python 語言中的一個資料分析工具,提供高效能,簡易使用的資料格式,讓開發人員能快速操作資料與分析。 Pandas 主要提供兩種資料結構 :

  • Time Series: 時間序列結構,Time-Value 組成的結構
  • DataFrame: 是屬於 Time Series 的延伸,相同時間可以搭配多組資料,成為多維結構

Time Series 結構

接下來我們來看看它有哪些應用

1. 建立第一個時間序列

import pandas as pd
s = pd.Series([1,2,3,4])

book

2. 加上時間 TS

date = pd.date_range('20180101', periods=6)
s = pd.Series([1,2,3,4,5,6], index=date)

book

3. 一次設定所有值

s = pd.Series(2, index=date)

book

4. 使用 loc() 查找某一個值

date = pd.date_range('20180101', periods=6)
s = pd.Series([1,2,3,4,5,6], index=date)
s.loc['20180104']

book

s.loc['20180102':'2018-01-04']

book

5. 使用 iloc() 查找某一個值

s.iloc[1]

book

s.iloc[1:4]

book

6. 數值計算

print(s)
r1 = s.max()
print(r1)
r2 = s.min()
print(r2)
r3 = s.mean()
print(r3)
r4 = s.std()
print(r4)
r5 = s.cumsum()
print(r5)
r6 = s.cumprod()
print(r6)

book

7. 整體序列計算

print(s)
print(s + 1)
print(s - 1)

book

print(s * 2)
print(s / 2)
print(s > 3)
print(s < 3)

book

8. 繪圖

%matplotlib inline
s.plot()

book