Sebar plot di python matplotlib

Scatter plot adalah grafik di mana nilai dua variabel diplot sepanjang dua sumbu. Ini adalah jenis plot paling dasar yang membantu Anda memvisualisasikan hubungan antara dua variabel

Konsep

  1. Apa itu plot Pencar?
  2. Plot Scatter dasar dengan python
  3. Korelasi dengan plot Scatter
  4. Mengubah warna kelompok titik
  5. Mengubah Warna dan Penanda
  6. Scatter plot dengan Linear fit plot menggunakan seaborn
  7. Scatter Plot dengan Histogram menggunakan seaborn
  8. Plot gelembung
  9. Analisis Eksplorasi menggunakan mtcars Dataset
    • Beberapa baris yang paling cocok
    • Menyesuaikan warna dan gaya untuk berbagai kategori
    • Anotasi Teks di Scatter Plot
    • Bubble Plot dengan variabel kategori
    • Plot Kategoris

Apa itu plot Pencar?

Scatter plot adalah grafik dari dua set data sepanjang dua sumbu. Ini digunakan untuk memvisualisasikan hubungan antara dua variabel

Jika nilai di sepanjang sumbu Y terlihat meningkat saat sumbu X meningkat (atau menurun), ini dapat mengindikasikan hubungan linier positif (atau negatif). Sedangkan jika titik-titik tersebut terdistribusi secara acak tanpa pola yang jelas, hal tersebut dapat mengindikasikan kurangnya hubungan ketergantungan

Dalam python matplotlib, scatterplot dapat dibuat menggunakan # Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show() 2 atau # Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show() 3. Dengan menggunakan fungsi ini, Anda dapat menambahkan lebih banyak fitur ke plot pencar, seperti mengubah ukuran, warna, atau bentuk titik

Jadi apa perbedaan antara # Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show() 4 vs # Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show() 5?

Perbedaan kedua fungsi tersebut adalah. dengan # Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show() _2 properti apa pun yang Anda terapkan (warna, bentuk, ukuran titik) akan diterapkan di semua titik sedangkan di # Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show() 3 Anda memiliki kontrol lebih besar dalam setiap tampilan titik

Yaitu, di # Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show() 4 Anda dapat mengubah warna, bentuk, dan ukuran setiap titik (titik data) berdasarkan variabel lain. Atau bahkan variabel yang sama (y). Sedangkan, dengan # Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show() _2, properti yang Anda atur akan diterapkan ke semua titik di bagan

Pertama, saya akan mengimpor perpustakaan yang akan saya gunakan

import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) _

Fungsi # Scatterplot of non-random vzriables x=np.arange(1,10,0.2) y= np.exp(x) plt.scatter(x,y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Exponential Relation dataset') plt.show() 0 digunakan untuk mengubah parameter default dari gambar plot

Plot Scatter dasar dengan python

Pertama, mari buat data buatan menggunakan ________ 9 _______1. Anda perlu menentukan no. poin yang Anda butuhkan sebagai argumen

Anda juga dapat menentukan batas bawah dan atas dari variabel acak yang Anda butuhkan

Kemudian gunakan fungsi # Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show() _4 untuk menggambar plot pencar menggunakan matplotlib. Anda perlu menentukan variabel x dan y sebagai argumen

# Scatterplot of non-random vzriables x=np.arange(1,10,0.2) y= np.exp(x) plt.scatter(x,y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Exponential Relation dataset') plt.show() _3 digunakan untuk mengatur judul plot Anda

# Scatterplot of non-random vzriables x=np.arange(1,10,0.2) y= np.exp(x) plt.scatter(x,y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Exponential Relation dataset') plt.show() _4 digunakan untuk menandai sumbu x

# Scatterplot of non-random vzriables x=np.arange(1,10,0.2) y= np.exp(x) plt.scatter(x,y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Exponential Relation dataset') plt.show() _5 digunakan untuk menandai sumbu y

Program Ilmuwan Data Industri MLPlus

Apakah Anda ingin belajar Ilmu Data dari Ilmuwan Data berpengalaman?

Bangun karir ilmu data Anda dengan kualifikasi yang diakui secara global dan diakui industri. Selesaikan proyek dengan data perusahaan nyata dan jadilah Ilmuwan Data bersertifikat dalam waktu kurang dari 12 bulan.

Dapatkan Kursus Python Lengkap Gratis

Bangun karir ilmu data Anda dengan kualifikasi yang diakui secara global dan diakui industri. Dapatkan pola pikir, kepercayaan diri, dan keterampilan yang membuat Data Scientist begitu berharga

# Simple Scatterplot x = range(50) y = range(50) + np.random.randint(0,30,50) plt.scatter(x, y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show()

Anda dapat melihat bahwa ada hubungan linier positif antara titik-titik tersebut. Artinya, saat X bertambah, Y juga bertambah, karena Y sebenarnya hanyalah X + bilangan_acak

Jika Anda ingin warna titik bervariasi tergantung pada nilai Y (atau variabel lain dengan ukuran yang sama), tentukan warna yang harus diambil setiap titik menggunakan argumen # Scatterplot of non-random vzriables x=np.arange(1,10,0.2) y= np.exp(x) plt.scatter(x,y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Exponential Relation dataset') plt.show() 6

Anda juga dapat memberikan variabel berbeda dengan ukuran yang sama dengan X

# Simple Scatterplot with colored points x = range(50) y = range(50) + np.random.randint(0,30,50) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y, c=y, cmap='Spectral') plt.colorbar() plt.title('Simple Scatter plot') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show()

Mari kita membuat dataset dengan relasi yang meningkat secara eksponensial dan memvisualisasikan plotnya

# Scatterplot of non-random vzriables x=np.arange(1,10,0.2) y= np.exp(x) plt.scatter(x,y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Exponential Relation dataset') plt.show() _

# Scatterplot of non-random vzriables x=np.arange(1,10,0.2) y= np.exp(x) plt.scatter(x,y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Exponential Relation dataset') plt.show() 7 digunakan untuk membuat dataset antara batas bawah dan batas atas dengan langkah 'interval' no. poin

Sekarang Anda dapat melihat bahwa ada hubungan eksponensial antara sumbu x dan y

Korelasi dengan plot Scatter

1) Jika nilai y bertambah dengan nilai x, maka dapat dikatakan bahwa variabel tersebut memiliki korelasi positif

2) Jika nilai y berkurang dengan nilai x, maka dapat dikatakan bahwa variabel-variabel tersebut berkorelasi negatif

3) Jika nilai y berubah secara acak bebas dari x, maka dikatakan berkorelasi nol

# Scatterplot and Correlations # Data x=np.random.randn(100) y1= x*5 +9 y2= -5*x y3=np.random.randn(100) # Plot plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.scatter(x, y1, label=f'y1 Correlation = {np.round(np.corrcoef(x,y1)[0,1], 2)}') plt.scatter(x, y2, label=f'y2 Correlation = {np.round(np.corrcoef(x,y2)[0,1], 2)}') plt.scatter(x, y3, label=f'y3 Correlation = {np.round(np.corrcoef(x,y3)[0,1], 2)}') # Plot plt.title('Scatterplot and Correlations') plt.legend() plt.show()

Pada grafik di atas, Anda dapat melihat bahwa garis biru menunjukkan korelasi positif, garis oranye menunjukkan korelasi negatif dan titik hijau tidak menunjukkan hubungan dengan nilai x (berubah secara acak secara independen)

Mengubah warna kelompok titik

Gunakan perintah # Scatterplot of non-random vzriables x=np.arange(1,10,0.2) y= np.exp(x) plt.scatter(x,y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Exponential Relation dataset') plt.show() _8 untuk mengubah warna untuk mewakili plot pencar

# Scatterplot - Color Change x = np.random.randn(50) y1 = np.random.randn(50) y2= np.random.randn(50) # Plot plt.scatter(x,y1,color='blue') plt.scatter(x,y2,color= 'red') plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) # Decorate plt.title('Color Change') plt.xlabel('X - value') plt.ylabel('Y - value') plt.show()

Mengubah Warna dan Penanda

Gunakan perintah # Scatterplot of non-random vzriables x=np.arange(1,10,0.2) y= np.exp(x) plt.scatter(x,y) plt.rcParams.update({'figure.figsize':(10,8), 'figure.dpi':100}) plt.title('Exponential Relation dataset') plt.show() _9 untuk mengubah jenis marker di scatter plot

['. ','o','v','^','>','

Postingan terbaru

LIHAT SEMUA