Distribusi Frekuensi dan Visualisasi Data
DISTRIBUSI FREKUENSI
Definisi dan Tujuan
Merupakan tabel ringkasan data yang menunjukkan frekuensi/banyaknya item/obyek pada setiap kelas yang ada. Dengan tujuan mendapatkan informasi lebih dalam tentang data yang ada yang tidak dapat secara cepat diperoleh dengan melihat data aslinya.
Pembentukan Tabel Distribusi Frekuensi
1. Tentukan banyaknya kelas
2. Tentukan interval/selang kelas
Semua data harus bisa dimasukkan dalam kelas-kelas TDF, tidak ada yang tertinggal dan satu data hanya dapat dimasukkan ke dalam satu kelas, tidak terjadi OVERLAPPING
3. Sorting data, lazimnya Ascending: mulai dari nilai terkecil (minimal) agar range(selisih nilai terbesar dengan terkecil) data diketahui dan mempermudah penghitungan frekuensi tiap kelas
Penentuan Banyak Kelas dan Interval Kelas
Banyak Kelas
Dengan menggunakan aturan STURGES
Banyak kelas –> pembulatan ke atas/ke bawah (Ceiling/Floor)
k = 1 + 3.322 log n
k = banyak kelas
n = banyak data
Contoh : 50 data
k = 1 + 3.322 log 50 = 1 + 3.322 (1.6989..) = 1 + 5.6439… = 6.6439…
k bisa dibulatkan menjadi k = 6 (fungsi floor [6.6439…] )
atau k = 7 (fungsi ceiling [6.6439..] )
Interval Kelas
Interval kelas = Beda Batas Bawah Kelas ke-i dengan Batas Bawah kelas ke-i + 1
Interval kelas = Beda Batas Atas Kelas ke-i dengan Batas Atas kelas ke-i + 1
Batas Bawah Kelas ke-1 = Nilai data terkecil (Minimal)
i=r/k
di mana i = interval kelas
k = banyak Kelas
r = range data
contoh : Kita mempunyai data dengan nilai maksimal 63 dan nilai minimal 16
dengan demikian r = 63 – 16 = 47
Bila kita memilih k = 6 kelas maka : i=r/k = 47/6 = 7, 8333 = 8
Bila kita memilih k= 7 kelas maka : i=r/k = 47/7 = 6 ,714 = 7
Tepi Batas Kelas:
Tepi Batas Bawah kelas ke-i =[ Batas Bawah kelas ke-i + Batas Atas kelas ke (i-1)] / 2
Tepi Batas Atas kelas ke-i = [Batas Atas kelas ke-i + Batas Bawah kelas ke (i+1)] / 2
Jenis Distribusi Frekuensi
a. Distribusi Frekuensi Relatif
b. Distribusi Frekuensi Kumulatif
- Distribusi Frekuensi Relatif
Tabel Distribusi Frekuensi Relatif
Titik Tengah Kelas ke-i = [Batas Bawah Kelas ke-i + Batas Atas Kelas ke-i] / 2
Frekuensi Relatif kelas ke-i = Frekuensi kelas ke-i / Total Pengamatan (n)
- Distribusi Frekuensi Kumulatif
a. TDFK kurang dari (<)
b. TDFK lebih dari (>)
a. TDFK KURANG DARI (<)
-Banyak kelas dalam TDFK kurang dari = Banyak Kelas TDF + 1
-Kelas TDFK kurang dari dibentuk dengan menggunakan batas bawah kelas TDF
-Kelas terakhir dalam TDFK kurang dari dibentuk dengan batas bawah kelas ke-k+1 pada TDF
b. TDFK LEBIH DARI (>)
-Banyak kelas dalam TDFK lebih dari = Banyak Kelas TDF + 1
-Kelas TDFK-lebihdari dibentuk dengan menggunakan batas atas kelas TDF!
-Kelas pertama dalam TDFK lebih dari dibentuk dari Batas Atas kelas ke-0 pada TDF
Penyajian TDF dalam Grafik/Diagram
1. TDF → disajikan dalam diagram batang atau histogram dan/atau poligon
2. TDFR → disajikan dalam diagram batang atau histogram dan/atau poligon
3. TDFK kurang dari → disajikan dalam OGIVE kurang dari
4. TDFK lebih dari → disajikan dalam OGIVE lebih dari
Histogram berbeda dengan Diagram Batang, Diagram Batang digambar dengan
menggunakan batas atas dan batas bawah kelas, sedangkan Histogram menggunakan
TBB dan TBA kelas.
Pengertian visualisasi data
Visualisasi data adalah proses membuat representasi visual dari data.
Visualisasi data merupakan alat yang ampuh untuk menjelajahi kumpulan data yang besar dan kompleks.
Memvisualisasikan data membantu pengguna untuk memahami pola, tren, hubungan, dan outlier yang tersembunyi di dalam data yang besar dan kompleks.
Visualisasi data atau data visualization juga dapat didefinisikan sebagai bentuk grafis atau visual dari data dan informasi.
Visualisasi data mengacu pada teknik yang digunakan untuk mengkomunikasi data atau informasi dengan membuatnya sebagai objek visual (misalnya, titik, garis, atau batang) dalam grafik.
Visualisasi data merupakan ilmu dan seni.
Ilmu dalam artian kita perlu memperhatikan panduan dan aturan ilmiah yang mengikatnya.
Seni dalam artian kita bisa menggunakan dan mengkombinasikan penggunaan variabel dan elemen grafis untuk membuat visual data yang efektif dan menarik.
Tujuan visualisasi data
Setidaknya ada tiga tujuan visualisasi data, yaitu:
- mempresentasikan data dan informasi
- membantu eksplorasi data
- metode untuk analisis data
- Column Chart
- Bar Graph
- Stacked Bar Graph
- Stacked Column Chart
- Area Chart
- Dual Axis Chart
- Line Graph
- Mekko Chart
- Pie Chart
- Waterfall Chart
- Bubble Chart
- Scatter Plot Chart
- Bullet Graph
- Funnel Chart
- Heat Map
Mempresentasikan data dan informasi
Tujuan utama dari visualisasi data adalah untuk mengkomunikasikan informasi secara jelas dan efisien kepada pengguna.
Melalui visualisasi yang baik, data kompleks yang ditampilkan secara visual menjadi lebih mudah dipahami oleh orang awam.
Selain itu, visualisasi yang efektif membantu pengguna dalam menganalisis dan penalaran data. Kita akan pelajari bagian ini
Membantu proses eksplorasi data
Dalam konteks statistika dan data science, proses analisis data menggunakan grafik merupakan proses yang vital.
Proses ini masuk ke dalam tahap Exploratory Data Analysis (EDA).
Visualisasi data yang efektif merupakan langkah awal dalam sebuah analisis data yang baik.
Hal ini dikarenakan data yang ditampilkan secara visual dapat menunjukkan pola-pola yang tidak bisa disampaikan oleh data berupa teks atau angka.
Maka, langkah pertama dalam proses analisis data adalah membuat grafik-grafik dari data dan memahaminya.
Metode analisis data
Konsep ini memunculkan istilah visual analytics.
Visual analytics atau analisis visual merupakan ilmu untuk melakukan penalaran analitik (reasoning analytics) dengan didukung oleh antarmuka visual yang interaktif.
Dengan perkembangan produksi data yang semakin cepat, metode ini memungkinkan pembuat keputusan menggunakan fleksibilitas, kreativitas, dan pengetahuan latar belakang mereka.
Selain itu, metode ini dapat digunakan untuk memaksimalkan kapasitas penyimpanan dan pemrosesan yang sangat besar dari komputer saat ini untuk mendapatkan wawasan tentang masalah yang kompleks.
Ditambah dengan proses pembuatan dan penggunaan visualisasi data yang efektif, proses analisis dengan berdasarkan visual bisa sangat powerful.
Jenis visualisasi data
Terdapat banyak bentuk atau jenis visualisasi yang telah umum digunakan.
Berikut adalah 15 buah di antaranya:

Setiap jenis grafik dapat meningkatkan kemudahan dalam membaca dan interpretasi data.
Namun, tetapi setiap grafik memiliki karakteristik khusus yang sangat spesifik pada suatu tujuan visualisasi atau tipe data tertentu.
Lalu, bagaimana cara menentukan bentuk visualisasi data yang tepat?
Menentukan jenis visualisasi terbaik
Salah satu bagian terpenting dalam proses visualisasi data adalah memilih diagram atau jenis visualisasi terbaik.
Hal ini dapat menjadi lebih rumit karena biasanya suatu data dapat divisualkan menggunakan lebih dari satu jenis grafik.
Sedangkan kita juga harus memastikan pesan atau tujuan visualisasi dapat tersampaikan dengan jelas dan akurat.
Harus selalu diingat, bahwa visualisasi data hanya berguna jika mencapai tujuannya.
Komentar
Posting Komentar