Max Min Mean Median Modus Dengan Pandas

Menentukan max, min, mean, median dan modus adalah hal paling basic dalam data science. But, ternyata itu semua dapat dilakukan dengan kombinasi pandas dan numpy loh. Kuy kita lihat apa saja fungsi-fungsi berfaedah yang bisa kalian manfaatkan hanya menggunakan kombinasi pandas dan numpy.

1. Max()
Fungsi max() digunakan untuk mencari nilai maksimum atau nilai terbesar pada sebuah kolom yang terdapat pada dataframe. Sebelum itu, mari kita buat dulu sebuah dataframe seperti berikut:

arr = [ [150,’Bukit Duri’,100,220,’Darurat’], [90,’Katulampa’,220,180,’Darurat’], [100,’Bukit Duri’,200,150,’Siaga’], [200,’Beji’,200,130,’Siaga’], [150,’Beji’,100,180,’Darurat’], [190,’Katulampa’,210,150,’Darurat’],
]
import pandas as pd
df = pd.DataFrame(arr)
df.columns = [‘curah_hujan’,’site’,’debit_air’,’tinggi_muka_air’,’status’]
df

Hasilnya adalah seperti ini:

Oke, sekarang kita coba mencari data maksimum pada setiap kolom di dataframe tersebut. Caranya, kita tinggal panggil fungsi max() pada dataframe seperti berikut:

df.max()

Dan hasilnya adalah seperti ini:

Dari data diatas kita dapat ketahui bahwa nilai maksimum pada kolom ‘curah_hujan’ adalah 220. Sedangkan untuk kolom ‘site’ adalah ‘katulampa’. Hal ini dikarenakan, jumlah digit dalam kata ‘katumpa’ merupakan jumlah digit yang paling banyak.

Kita juga bisa mencari nilai maksimum yang terdapat pada salah-satu kolom saja. Misalnya kita hendak mencari berapa nilai maksimum yang terdapat pada kolom ‘curah_hujan’, maka kita tinggal memanggil fungsi max() pada kolom tersebut seperti ini:

df[‘curah_hujan’].max()

Dan hasilnya adalah seperti ini:

Dari hasil diatas, kita dapat ketahui bahwa nilai maksimum dari kolom ‘curah_hujan’ adalah 200.

2. Min()
Fungsi min() digunakan untuk mecari nilai minimum atau nilai terkecil pada sebuah kolom yang terdapat pada dataframe. Dengan menggunakan dataset diatas, kita dapat menggunakan fungsi min() seperti berikut:

df.min()

Dan hasilnya seperti ini:

Dari data diaatas, kita dapat ketahui bahwa nilai minimun dari kolom curah hujan adalah 90. Sedangkan nilai minimum dari kolom ‘site’ adalah ‘beji’. Hal ini karena beji memiliki jumlah digit paling sedikit diantara data lainnya.

Dengan cara yang sama kita bisa mencari nilai minimum pada salah-satu kolom saja. Misal kita ingin mencari nilai tinggi muka air minimum. Kita dapat melakukannya seperti ini:

df[‘tinggi_muka_air’].min()

Dan hasilnya seperti ini:

3. Mean()
Fungsi mean, digunakan untuk mencari nilai rata-rata. Dengan dataset yang sama, kita bisa mencari nilai rata-rata pada setiap kolom seperti berikut:

df.mean()

Dan hasilnya seperti berikut:

Dengan cara yang sama dengan kedua fungsi diatas, kita bisa mencari nilai rataan pada kolom tertentu.

4. Median()
Fungsi median() digunakan untuk mencari nilai tengah dari suatu data. Namun kita tidak bisa melakukannya secara langsung pada keseluruhan dataframe dengan cara diatas. So, kita harus mencarinya satu-per-satu.

Untuk menggunakannya, kita membutuhkan library tambahan yang bernama numpy. Jadi, jangan lupa untuk import dulu librarynya ya kawan. Caranya seperti berikut:

import numpy as np
np.median(df[‘tinggi_muka_air’])

Dan hasilnya seperti berikut:

5. Mode()
Fungsi mode() merupakan fungsi untuk mencari nilai yang paling sering muncul (bukan nilai terbesar), atau biasa kita kenal dengan modus. Untuk menggunakan fungsi ini, kita memerlukan library tambahan yang bernama ‘stats’ yang berasal dari scipy. Kalian bisa menggunakan fungsi ini untuk semua kolom sekaligus. Caranya adalah sebagai berikut:

from scipy import stats
stats.mode(df)

Dan hasilnya sebagai berikut:

Dari data diatas, kita dapat ketahui bahwa pada kolom pertama, modusnya adalah 150 dan muncul sebanyak 2 kali. Dan begitu seterusnya.

Kita juga bisa mencari nilai modus pada salah satu kolom saja. Misal kita ingin mencari nilai modus pada kolom ‘curah hujan’. Lakukan dengan cara ini:

from scipy import stats
stats.mode(df[‘curah_hujan’])

Dan hasilnya sebagai berikut:

Dari data diatas, kita dapat mengetahui bahwa modus pada kolom ‘curah hujan’ adalah 150 dan muncul sebanyak 2 kali.