Distribusi Frekuensi dan Visualisasi Data

 DISTRIBUSI FREKUENSI

 

Definisi dan Tujuan

Merupakan tabel ringkasan data yang menunjukkan frekuensi/banyaknya item/obyek pada setiap kelas yang ada. Dengan tujuan mendapatkan informasi lebih dalam tentang data yang ada yang tidak dapat secara cepat diperoleh dengan melihat data aslinya.

Pembentukan Tabel Distribusi Frekuensi

1. Tentukan banyaknya kelas

2. Tentukan interval/selang kelas
Semua data harus bisa dimasukkan dalam kelas-kelas TDF, tidak ada yang tertinggal dan satu data hanya dapat dimasukkan ke dalam satu kelas, tidak terjadi OVERLAPPING

3. Sorting data, lazimnya Ascending: mulai dari nilai terkecil (minimal) agar range(selisih nilai terbesar dengan terkecil) data diketahui dan mempermudah penghitungan frekuensi tiap kelas

 

Penentuan Banyak Kelas dan Interval Kelas

 

Banyak Kelas

Dengan menggunakan aturan STURGES

Banyak kelas –> pembulatan ke atas/ke bawah (Ceiling/Floor)

k = 1 + 3.322 log n
k = banyak kelas
n = banyak data

Contoh  : 50 data
k = 1 + 3.322 log 50 = 1 + 3.322 (1.6989..) = 1 + 5.6439… = 6.6439…

k bisa dibulatkan menjadi k = 6 (fungsi floor [6.6439…] )

atau k = 7 (fungsi ceiling [6.6439..] )

 

Interval Kelas

Interval kelas = Beda Batas Bawah Kelas ke-i dengan Batas Bawah kelas ke-i + 1
Interval kelas = Beda Batas Atas Kelas ke-i dengan Batas Atas kelas ke-i + 1

Batas Bawah Kelas ke-1 = Nilai data terkecil (Minimal)

i=r/k

di mana i = interval kelas
k = banyak Kelas
r = range data

contoh : Kita mempunyai data dengan nilai maksimal 63 dan nilai minimal 16

dengan demikian r = 63 – 16 = 47

Bila kita memilih k = 6 kelas maka : i=r/k  = 47/6 = 7, 8333 = 8

Bila kita memilih k= 7 kelas maka : i=r/k = 47/7 = 6 ,714 = 7

 

Tepi Batas Kelas:
Tepi Batas Bawah kelas ke-i =[ Batas Bawah kelas ke-i + Batas Atas kelas ke (i-1)] / 2

Tepi Batas Atas kelas ke-i = [Batas Atas kelas ke-i + Batas Bawah kelas ke (i+1)] / 2

Jenis Distribusi Frekuensi


a. Distribusi Frekuensi Relatif
b. Distribusi Frekuensi Kumulatif

 

  • Distribusi Frekuensi Relatif

Tabel Distribusi Frekuensi Relatif




Titik Tengah Kelas ke-i = [Batas Bawah Kelas ke-i + Batas Atas Kelas ke-i] / 2
Frekuensi Relatif kelas ke-i = Frekuensi kelas ke-i / Total Pengamatan (n)

 

  • Distribusi Frekuensi Kumulatif

a. TDFK kurang dari (<)
b. TDFK lebih dari (>)

a. TDFK KURANG DARI (<)

-Banyak kelas dalam TDFK kurang dari = Banyak Kelas TDF + 1
-Kelas TDFK kurang dari dibentuk dengan menggunakan batas bawah kelas TDF
-Kelas terakhir dalam TDFK kurang dari dibentuk dengan batas bawah kelas ke-k+1 pada TDF

 

b. TDFK LEBIH DARI (>)

-Banyak kelas dalam TDFK lebih dari = Banyak Kelas TDF + 1
-Kelas TDFK-lebihdari dibentuk dengan menggunakan batas atas kelas TDF!
-Kelas pertama dalam TDFK lebih dari dibentuk dari Batas Atas kelas ke-0 pada TDF

 

 

Penyajian TDF dalam Grafik/Diagram


1. TDF → disajikan dalam diagram batang atau histogram dan/atau poligon
2. TDFR → disajikan dalam diagram batang atau histogram dan/atau poligon
3. TDFK kurang dari → disajikan dalam OGIVE kurang dari
4. TDFK lebih dari → disajikan dalam OGIVE lebih dari

Histogram berbeda dengan Diagram Batang, Diagram Batang digambar dengan
menggunakan batas atas dan batas bawah kelas, sedangkan Histogram menggunakan
TBB dan TBA kelas.









Pengertian visualisasi data

Visualisasi data adalah proses membuat representasi visual dari data.

Visualisasi data merupakan alat yang ampuh untuk menjelajahi kumpulan data yang besar dan kompleks.

Memvisualisasikan data membantu pengguna untuk memahami pola, tren, hubungan, dan outlier yang tersembunyi di dalam data yang besar dan kompleks.

Visualisasi data atau data visualization juga dapat didefinisikan sebagai bentuk grafis atau visual dari data dan informasi.

Visualisasi data mengacu pada teknik yang digunakan untuk mengkomunikasi data atau informasi dengan membuatnya sebagai objek visual (misalnya, titik, garis, atau batang) dalam grafik.


Visualisasi data merupakan ilmu dan seni.

Ilmu dalam artian kita perlu memperhatikan panduan dan aturan ilmiah yang mengikatnya.

Seni dalam artian kita bisa menggunakan dan mengkombinasikan penggunaan variabel dan elemen grafis untuk membuat visual data yang efektif dan menarik.

Tujuan visualisasi data

Setidaknya ada tiga tujuan visualisasi data, yaitu:

  • mempresentasikan data dan informasi
  • membantu eksplorasi data
  • metode untuk analisis data


    Mempresentasikan data dan informasi

    Tujuan utama dari visualisasi data adalah untuk mengkomunikasikan informasi secara jelas dan efisien kepada pengguna.

    Melalui visualisasi yang baik, data kompleks yang ditampilkan secara visual menjadi lebih mudah dipahami oleh orang awam.

    Selain itu, visualisasi yang efektif membantu pengguna dalam menganalisis dan penalaran data. Kita akan pelajari bagian ini 

    Membantu proses eksplorasi data

    Dalam konteks statistika dan data science, proses analisis data menggunakan grafik merupakan proses yang vital.

    Proses ini masuk ke dalam tahap Exploratory Data Analysis (EDA).

    Visualisasi data yang efektif merupakan langkah awal dalam sebuah analisis data yang baik.

    Hal ini dikarenakan data yang ditampilkan secara visual dapat menunjukkan pola-pola yang tidak bisa disampaikan oleh data berupa teks atau angka.

    Maka, langkah pertama dalam proses analisis data adalah membuat grafik-grafik dari data dan memahaminya.

    Metode analisis data

    Konsep ini memunculkan istilah visual analytics.

    Visual analytics atau analisis visual merupakan ilmu untuk melakukan penalaran analitik (reasoning analytics) dengan didukung oleh antarmuka visual yang interaktif.

    Dengan perkembangan produksi data yang semakin cepat, metode ini memungkinkan pembuat keputusan menggunakan fleksibilitas, kreativitas, dan pengetahuan latar belakang mereka.

    Selain itu, metode ini dapat digunakan untuk memaksimalkan kapasitas penyimpanan dan pemrosesan yang sangat besar dari komputer saat ini untuk mendapatkan wawasan tentang masalah yang kompleks.

    Ditambah dengan proses pembuatan dan penggunaan visualisasi data yang efektif, proses analisis dengan berdasarkan visual bisa sangat powerful.

    Jenis visualisasi data

    Terdapat banyak bentuk atau jenis visualisasi yang telah umum digunakan.

    Berikut adalah 15 buah di antaranya:

    • Column Chart
    • Bar Graph
    • Stacked Bar Graph
    • Stacked Column Chart
    • Area Chart
    • Dual Axis Chart
    • Line Graph
    • Mekko Chart
    • Pie Chart
    • Waterfall Chart
    • Bubble Chart
    • Scatter Plot Chart
    • Bullet Graph
    • Funnel Chart
    • Heat Map
    jenis visualisasi data

    Setiap jenis grafik dapat meningkatkan kemudahan dalam membaca dan interpretasi data.

    Namun, tetapi setiap grafik memiliki karakteristik khusus yang sangat spesifik pada suatu tujuan visualisasi atau tipe data tertentu.

    Lalu, bagaimana cara menentukan bentuk visualisasi data yang tepat?

    Menentukan jenis visualisasi terbaik

    Salah satu bagian terpenting dalam proses visualisasi data adalah memilih diagram atau jenis visualisasi terbaik.

    Hal ini dapat menjadi lebih rumit karena biasanya suatu data dapat divisualkan menggunakan lebih dari satu jenis grafik.

    Sedangkan kita juga harus memastikan pesan atau tujuan visualisasi dapat tersampaikan dengan jelas dan akurat.

    Harus selalu diingat, bahwa visualisasi data hanya berguna jika mencapai tujuannya.


Komentar

Postingan populer dari blog ini

Normal Approximation terhadap Binomial Distributions