Kuantil dan persentil dalam python

Postingan ini merupakan lanjutan dari postingan sebelumnya, sekali lagi kita akan melanjutkan dengan data yang telah kita impor di sesi sebelumnya

Persentil dan Kuartil sangat berguna saat kita perlu mengidentifikasi outlier dalam data kita. Mereka juga membantu kita memahami distribusi dasar data

Persentil adalah statistik deskriptif yang memberi tahu kita tentang distribusi nilai. Nilai persentil ke-n menunjukkan bahwa n% dari nilai dalam urutan yang diberikan lebih kecil dari nilai ini. Misalnya, nilai persentil ke-25 adalah nilai yang lebih besar dari 25% nilai yang ada dalam data. Dalam tutorial ini, kita akan melihat cara menghitung nilai persentil ke-n (misalnya, persentil ke-95) dengan Python

Kuantil dan persentil dalam python
Kuantil dan persentil dalam python

Bagaimana cara menghitung persentil dengan Python?

Ada beberapa cara. Anda dapat menggunakan fungsi

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))
4 numpy pada array atau urutan nilai. Anda juga dapat menggunakan fungsi panda
import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))
_5 untuk mendapatkan persentil ke-n dari seri panda. Berikut ini adalah sintaks untuk keduanya –

# using numpy - 95th percentile value of the array arr
np.percentile(arr, 95)
# using pandas - 95th percentile value of column 'Col' in df
df['Col'].quantile(0.95)

Contoh

Mari kita lihat beberapa contoh penggunaan sintaks di atas untuk mendapatkan persentil di Python

1. Persentil ke-95 dari array atau daftar menggunakan numpy

Untuk mendapatkan nilai persentil ke-n dari sebuah array atau daftar, berikan array (atau daftar) bersama dengan nilai n (persentil yang ingin Anda hitung) ke fungsi

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))
4 numpy. Misalnya, mari kita dapatkan nilai persentil ke-95 dari larik 100 bilangan asli pertama (angka dari 1 hingga 100)

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))

Keluaran

95.05

Anda dapat melihat bahwa kami mendapatkan 95. 05 sebagai keluaran. Perhatikan bahwa 95% nilai dalam larik 100 bilangan asli pertama lebih kecil dari nilai ini

Fungsi di atas akan bekerja dengan cara yang sama pada daftar

import numpy as np

# create a list of 100 numbers
ls = list(range(1, 101))
# get the 95th percentile value
print(np.percentile(ls, 95))
_

Keluaran

95.05

Kami mendapatkan hasil yang sama seperti di atas

2. Nilai persentil berbeda dari larik yang sama

Anda bisa mendapatkan nilai untuk persentil yang berbeda dengan memberikan daftar persentil yang Anda inginkan. Misalnya, mari kita dapatkan nilai persentil ke-25, ke-50, dan ke-75 untuk larik yang sama (100 bilangan asli pertama)

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 25th, 50th, and 75th percentile values
print(np.percentile(arr, [25, 50, 75]))
_

Keluaran

[25.75 50.5  75.25]
_

Kami mendapatkan nilai yang mewakili masing-masing persentil ke-25, ke-50, dan ke-75 dari array

3. Kuantil ke-n dari deret panda

Anda juga dapat menggunakan fungsi panda

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))
_5 untuk mendapatkan persentil ke-n dari seri panda atau kerangka data dengan python. Pertama, mari buat kerangka data sampel

import pandas as pd

# create a pandas dataframe
df = pd.DataFrame({
    'Day' : [i for i in range(1, 101)],
    'Next Day': [i+1 for i in range(1, 101)],
    'Location': ['Japan'] * 100
})
# display the dataframe
df

Keluaran

Kuantil dan persentil dalam python
Kuantil dan persentil dalam python

Di sini, kami membuat kerangka data panda dari dua kolom numerik dan satu kolom teks. Sekarang mari kita hitung nilai persentil ke-95 untuk kolom "Hari". Perhatikan bahwa saat menggunakan fungsi panda

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))
5, berikan nilai persentil ke-n sebagai nilai pecahan. Misalnya lulus 0. 95 untuk mendapatkan nilai persentil ke-95

# get the 95th percentile value of "Day"
df['Day'].quantile(0.95)

Keluaran

95.05

Anda juga dapat menerapkan fungsi yang sama pada kerangka data panda untuk mendapatkan nilai persentil ke-n untuk setiap kolom numerik dalam kerangka data

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))
0

Keluaran

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))
_1

Di sini Anda dapat melihat bahwa kami mendapatkan nilai persentil ke-95 untuk semua kolom numerik dalam kerangka data

Anda juga bisa mendapatkan banyak kuantil sekaligus. Misalnya, mari kita dapatkan nilai persentil ke-25, ke-50, dan ke-75 dari kolom "Hari"

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))
_2

Keluaran

import numpy as np

# create a numpy array
arr = np.array(range(1, 101))
# get the 95th percentile value
print(np.percentile(arr, 95))
_3

Bagaimana persentil bermanfaat?

Beberapa nilai persentil dapat memberi Anda informasi deskriptif penting tentang distribusi data pokok. Misalnya, median bisa menjadi ukuran yang baik untuk tendensi sentral (bisa sangat berguna jika data Anda memiliki outlier yang dapat membelokkan rata-rata), perbedaan nilai persentil ke-75 dan ke-25 memberi Anda Inter Quartile Range yang merupakan ukuran

Dengan ini, kita sampai pada akhir tutorial ini. Contoh kode dan hasil yang ditampilkan dalam tutorial ini telah diimplementasikan di Jupyter Notebook dengan python (versi 3. 8. 3) kernel memiliki versi numpy 1. 18. 5 dan panda versi 1. 0. 5


Berlangganan buletin kami untuk panduan dan tutorial yang lebih informatif
Kami tidak melakukan spam dan Anda dapat memilih keluar kapan saja


Pengarang

  • Kuantil dan persentil dalam python
    Kuantil dan persentil dalam python

    Piyush Raj

    Piyush adalah seorang profesional data yang bersemangat menggunakan data untuk memahami berbagai hal dengan lebih baik dan membuat keputusan berdasarkan informasi. Di masa lalu, dia bekerja sebagai Ilmuwan Data untuk ZS dan memegang gelar teknik dari IIT Roorkee. Hobinya termasuk menonton kriket, membaca, dan mengerjakan proyek sampingan

    Apa perbedaan antara kuantil dan persentil di Python?

    Kuantil mendefinisikan bagian tertentu dari kumpulan data, mis. e. kuantil menentukan berapa banyak nilai dalam distribusi berada di atas atau di bawah batas tertentu. Persentil (atau persentil) adalah ukuran yang digunakan dalam statistik yang menunjukkan nilai di bawah persentase tertentu pengamatan dalam kelompok pengamatan jatuh

    Apa itu kuantil () dengan Python?

    Metode quantile() menghitung kuantil nilai dalam sumbu tertentu . Sumbu default adalah baris. Dengan menentukan sumbu kolom ( axis='columns' ), ​​metode quantile() menghitung kolom quantile dan mengembalikan nilai rata-rata untuk setiap baris.

    Bagaimana Anda menghitung persentil dengan Python?

    persentil()fungsi yang digunakan untuk menghitung persentil ke-n dari data yang diberikan (elemen larik) sepanjang sumbu yang ditentukan. .
    Sintaksis. numpy. persentil(arr, n, sumbu=Tidak ada, keluar=Tidak ada)
    Parameter
    arr. larik masukan
    N. nilai persentil
    sumbu. sumbu sepanjang mana kita ingin menghitung nilai persentil

    Apakah kuantil dan persentil sama?

    Apa bedanya? . Persentil diberikan sebagai nilai persen, nilai seperti 95%, 40%, atau 27%. Kuantil diberikan sebagai nilai desimal, nilai seperti 0. 95, 0. 4, dan 0. 27. Not much. Percentiles are given as percent values, values such as 95%, 40%, or 27%. Quantiles are given as decimal values, values such as 0.95, 0.4, and 0.27.