Postingan ini merupakan lanjutan dari postingan sebelumnya, sekali lagi kita akan melanjutkan dengan data yang telah kita impor di sesi sebelumnya Show
Persentil dan Kuartil sangat berguna saat kita perlu mengidentifikasi outlier dalam data kita. Mereka juga membantu kita memahami distribusi dasar data Persentil adalah statistik deskriptif yang memberi tahu kita tentang distribusi nilai. Nilai persentil ke-n menunjukkan bahwa n% dari nilai dalam urutan yang diberikan lebih kecil dari nilai ini. Misalnya, nilai persentil ke-25 adalah nilai yang lebih besar dari 25% nilai yang ada dalam data. Dalam tutorial ini, kita akan melihat cara menghitung nilai persentil ke-n (misalnya, persentil ke-95) dengan Python Bagaimana cara menghitung persentil dengan Python?Ada beberapa cara. Anda dapat menggunakan fungsi import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95))4 numpy pada array atau urutan nilai. Anda juga dapat menggunakan fungsi panda import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95))_5 untuk mendapatkan persentil ke-n dari seri panda. Berikut ini adalah sintaks untuk keduanya – # using numpy - 95th percentile value of the array arr np.percentile(arr, 95) # using pandas - 95th percentile value of column 'Col' in df df['Col'].quantile(0.95) ContohMari kita lihat beberapa contoh penggunaan sintaks di atas untuk mendapatkan persentil di Python 1. Persentil ke-95 dari array atau daftar menggunakan numpyUntuk mendapatkan nilai persentil ke-n dari sebuah array atau daftar, berikan array (atau daftar) bersama dengan nilai n (persentil yang ingin Anda hitung) ke fungsi import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95))4 numpy. Misalnya, mari kita dapatkan nilai persentil ke-95 dari larik 100 bilangan asli pertama (angka dari 1 hingga 100) import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95)) Keluaran 95.05 Anda dapat melihat bahwa kami mendapatkan 95. 05 sebagai keluaran. Perhatikan bahwa 95% nilai dalam larik 100 bilangan asli pertama lebih kecil dari nilai ini Fungsi di atas akan bekerja dengan cara yang sama pada daftar import numpy as np # create a list of 100 numbers ls = list(range(1, 101)) # get the 95th percentile value print(np.percentile(ls, 95))_ Keluaran 95.05 Kami mendapatkan hasil yang sama seperti di atas 2. Nilai persentil berbeda dari larik yang samaAnda bisa mendapatkan nilai untuk persentil yang berbeda dengan memberikan daftar persentil yang Anda inginkan. Misalnya, mari kita dapatkan nilai persentil ke-25, ke-50, dan ke-75 untuk larik yang sama (100 bilangan asli pertama) import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 25th, 50th, and 75th percentile values print(np.percentile(arr, [25, 50, 75]))_ Keluaran [25.75 50.5 75.25]_ Kami mendapatkan nilai yang mewakili masing-masing persentil ke-25, ke-50, dan ke-75 dari array 3. Kuantil ke-n dari deret pandaAnda juga dapat menggunakan fungsi panda import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95))_5 untuk mendapatkan persentil ke-n dari seri panda atau kerangka data dengan python. Pertama, mari buat kerangka data sampel import pandas as pd # create a pandas dataframe df = pd.DataFrame({ 'Day' : [i for i in range(1, 101)], 'Next Day': [i+1 for i in range(1, 101)], 'Location': ['Japan'] * 100 }) # display the dataframe df Keluaran Di sini, kami membuat kerangka data panda dari dua kolom numerik dan satu kolom teks. Sekarang mari kita hitung nilai persentil ke-95 untuk kolom "Hari". Perhatikan bahwa saat menggunakan fungsi panda import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95))5, berikan nilai persentil ke-n sebagai nilai pecahan. Misalnya lulus 0. 95 untuk mendapatkan nilai persentil ke-95 # get the 95th percentile value of "Day" df['Day'].quantile(0.95) Keluaran 95.05 Anda juga dapat menerapkan fungsi yang sama pada kerangka data panda untuk mendapatkan nilai persentil ke-n untuk setiap kolom numerik dalam kerangka data import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95))0 Keluaran import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95))_1 Di sini Anda dapat melihat bahwa kami mendapatkan nilai persentil ke-95 untuk semua kolom numerik dalam kerangka data Anda juga bisa mendapatkan banyak kuantil sekaligus. Misalnya, mari kita dapatkan nilai persentil ke-25, ke-50, dan ke-75 dari kolom "Hari" import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95))_2 Keluaran import numpy as np # create a numpy array arr = np.array(range(1, 101)) # get the 95th percentile value print(np.percentile(arr, 95))_3 Bagaimana persentil bermanfaat?Beberapa nilai persentil dapat memberi Anda informasi deskriptif penting tentang distribusi data pokok. Misalnya, median bisa menjadi ukuran yang baik untuk tendensi sentral (bisa sangat berguna jika data Anda memiliki outlier yang dapat membelokkan rata-rata), perbedaan nilai persentil ke-75 dan ke-25 memberi Anda Inter Quartile Range yang merupakan ukuran Dengan ini, kita sampai pada akhir tutorial ini. Contoh kode dan hasil yang ditampilkan dalam tutorial ini telah diimplementasikan di Jupyter Notebook dengan python (versi 3. 8. 3) kernel memiliki versi numpy 1. 18. 5 dan panda versi 1. 0. 5
Pengarang
|