Agregat bingkai data python berdasarkan bulan

Pandas adalah alat khusus yang memungkinkan kita melakukan manipulasi data yang rumit secara efektif dan efisien. Di dalam panda, kami kebanyakan berurusan dengan kumpulan data dalam bentuk DataFrame. DataFrames adalah struktur data 2 dimensi dalam panda. DataFrames terdiri dari baris, kolom, dan data

Kelompokkan berdasarkan bulan dari bidang tanggal menggunakan Python dan Pandas

Misalkan kita diberi bingkai data dengan kolom yang berisi nilai tipe tanggal dan kolom lain yang berisi beberapa nilai numerik, kita perlu mengelompokkan data dari bingkai data ini sedemikian rupa sehingga data dikelompokkan berdasarkan bulan yang bergantung pada tanggal dari tanggal tersebut.

Untuk tujuan ini, pertama-tama kita akan mengubah kolom tanggal menjadi tipe DateTime dan kemudian kita akan mengelompokkan berdasarkan kolom ini dan menggunakan metode penjumlahan pada objek yang dikelompokkan

Pada artikel ini, kita akan membahas cara mengelompokkan berdasarkan kerangka data berdasarkan tanggal dan waktu di Pandas. Kita akan melihat cara mengelompokkan kerangka data deret waktu menurut Tahun, Bulan, hari, dll. Selain itu, kita juga akan melihat cara mengelompokkan objek berdasarkan waktu seperti menit

Pandas GroupBy memungkinkan kita menentukan instruksi groupby untuk suatu objek. Instruksi yang ditentukan ini akan memilih kolom melalui parameter kunci dari fungsi kerapu bersama dengan parameter level dan/atau sumbu jika diberikan, level indeks objek/kolom target

Sintaksis. panda. Grouper(key=None, level=None, freq=None, axis=0, sort=False)

Di bawah ini adalah beberapa contoh yang menggambarkan cara mengelompokkan berdasarkan kerangka data berdasarkan tanggal dan waktu menggunakan kelas Pandas Grouper

Contoh 1. Kelompokkan berdasarkan bulan

Python3




# importing modules

import pandas as pd

 

# creating a dataframe df_

df= pd.DataFrame(

    {

import0import1import2

import3import4import5import6

import3import4import9import6

import3import4pandas as pd3import6

import3import4pandas as pd7import6

import3import4 1import6

import3import4 5 6

import0 8

import0# creating a dataframe df0import2# creating a dataframe df2# creating a dataframe df3# creating a dataframe df4# creating a dataframe df3# creating a dataframe df6# creating a dataframe df3__________________________________________________________________________________________________________________________________________________________________________G

import0df5import2df7# creating a dataframe df3df9df3=1# creating a dataframe df3____6_______3______________________________________________________________________________________________________________________________________________________________________________G

    pd.DataFrame(0

 6

 

pd.DataFrame(3

pd.DataFrame(4

 

pd.DataFrame(6

________7______7=pd.DataFrame(9    0=    2    3

    4    5=    7    8    9{0

Keluaran

Dalam contoh di atas, kerangka data dikelompokkan menurut kolom Tanggal. Seperti yang telah kami berikan freq = 'M' yang berarti bulan, sehingga data dikelompokkan berdasarkan bulan hingga tanggal terakhir setiap bulan dan memberikan jumlah kolom harga. Kami belum memberikan nilai untuk semua bulan, kemudian juga fungsi groupby menampilkan data untuk semua bulan dan memberikan nilai 0 untuk bulan lainnya

Contoh 2. Kelompokkan berdasarkan hari

Python3




# importing modules

import pandas as pd

 

# creating a dataframe df_

df= pd.DataFrame(

    {

import0import1import2

import3import4import5import6

import3import4import9import6

import3import4pandas as pd3import6

import3import4pandas as pd7import6

import3import4 1import6

import3import4 5 6

import0 8

import0# creating a dataframe df0import2# creating a dataframe df2# creating a dataframe df3# creating a dataframe df4# creating a dataframe df3# creating a dataframe df6# creating a dataframe df3__________________________________________________________________________________________________________________________________________________________________________G

import0df5import2df7# creating a dataframe df3df9df3=1# creating a dataframe df3____6_______3______________________________________________________________________________________________________________________________________________________________________________G

    pd.DataFrame(0

 6

 

import_64

pd.DataFrame(4

 

import_67

________7______7=pd.DataFrame(9    0=    2    3

    4    5=import78import79=import81    8    9{0

Keluaran

Dalam contoh di atas, kerangka data dikelompokkan menurut kolom Tanggal. Seperti yang telah kami berikan freq = ‘5D’ yang berarti lima hari, maka data dikelompokkan berdasarkan selang waktu 5 hari setiap bulan sampai dengan tanggal terakhir yang diberikan pada kolom tanggal

Contoh 3. Kelompokkan berdasarkan tahun

Python3




import_85

import pandas as pd

 

import_89

df= pd.DataFrame(

    {

import0import1import2

 

import_3pandas as pd00

import_3pandas as pd02

import3import4pandas as pd05import6

import3import4pandas as pd09import6

import3import4pandas as pd13import6

import3import4pandas as pd17import6

import3import4pandas as pd21import6

import3import4pandas as pd25 6

import0 8

import0# creating a dataframe df0import2# creating a dataframe df2# creating a dataframe df3# creating a dataframe df4# creating a dataframe df3# creating a dataframe df6# creating a dataframe df3__________________________________________________________________________________________________________________________________________________________________________G

import0df5import2df7# creating a dataframe df3df9df3=1# creating a dataframe df3____6_______3______________________________________________________________________________________________________________________________________________________________________________G

    pd.DataFrame(0

 6

pd.DataFrame(3

pd.DataFrame(4

 

pandas as pd_65

________7______7=pd.DataFrame(9pandas as pd69=pandas as pd71    8    9{0

Keluaran

Dalam contoh di atas, kerangka data dikelompokkan menurut kolom Tanggal. Seperti yang telah kami berikan freq = '2Y' yang berarti 2 tahun, sehingga data dikelompokkan dalam interval 2 tahun

Contoh 4. Kelompokkan berdasarkan menit

Python3




import_85

import pandas as pd

 

pandas as pd_79

pandas as pd_80

________2______81= pandas as pd83pandas as pd84pandas as pd85=pandas as pd87pandas as pd69=pandas as pd90 6

 

pandas as pd_93

pandas as pd_94

df= pandas as pd97import1pandas as pd99# creating a dataframe df0import2# creating a dataframe df2# creating a dataframe df3# creating a dataframe df4# creating a dataframe df3# creating a dataframe df6# creating a dataframe df3# creating a dataframe df8# creating a dataframe df3df0# creating a dataframe df3df2# creating a dataframe df3 14# creating a dataframe df3 16# creating a dataframe df3 18# creating a dataframe df3pandas as pd87 8

 22df5import2df7# creating a dataframe df3df9# creating a dataframe df3=1# creating a dataframe df3=3# creating a dataframe df3=5# creating a dataframe df3=7# creating a dataframe df3 37# creating a dataframe df3 39# creating a dataframe df3 41# creating a dataframe df3 43 44

Bagaimana cara mengelompokkan berdasarkan data bulan dengan Python?

Agregat berdasarkan nama bulan . Ini mudah menggunakan fungsi month_name() yang disediakan oleh pengakses dt . Jangan lupa tanda kurung.

Bagaimana cara memfilter bingkai data berdasarkan bulan?

Anda dapat menggunakan df[df['Tanggal']. dt. strftime('%Y-%m')=='2021-11'] metode untuk memfilter menurut bulan. Anda juga dapat menggunakan df[df['Tanggal'].

Bagaimana cara mendapatkan data bijaksana bulan di panda?

month() function mengekstrak bulan dari kolom tanggal di panda.

Bagaimana Anda menggabungkan data dalam DataFrame dengan Python?

Ada tiga cara utama untuk mengelompokkan dan menggabungkan data di Pandas. .
Menggunakan fungsi groupby()
Menggunakan pd. fungsi pivot_table()
Menggunakan pd. tab silang() fungsi