Data dan Penyajiannya

Data yang dimaksud disini adalah sekumpulan angka/bukan angka yang memiliki arti dan dapat memberikan informasi. Data dalam statistika dikelompokkan berdasarkan sifat-sifatnya. Mengetahui jenis data sangatlah penting karena untuk setiap jenis data yang berbeda akan memiliki metode penyajian, analisis, dan pengambilan keputusan yang berbeda pula.

Jenis Data

Data dapat dikelompokkan menjadi data kualitatif dan data kuantitatif. Data kualitatif merupakan data yang tidak berupa angka. Contohnya adalah data data jenis kelamin dan golongan darah pasien. Sedangkan data yang berupa angka disebut juga dengan data kuantitatif, misalnya data usia dan berat badan pasien.

Data kuantitatif sendiri dibedakan menjadi data diskrit dan kontinu. Contoh data diskrit adalah data jumlah anggota keluarga di setiap rumah tangga di kota A. Nilai data yang mungkin adalah 1, 2, 3, …, dst. Contoh data kontinu adalah data IPK mahasiswa di fakultas B. Nilai data yang mungkin adalah antara 1 sampai 4. Pada data ini, pada selang/interval 1 sampai 4 terdapat tak berhingga nilai yang mungkin.

Berdasarkan cara memperolehnya, data dibagi menjadi dua, yaitu data yang diperoleh langsung dari objeknya (data primer) dan data yang diperoleh tidak langsung dari objeknya (data sekunder). Data primer dapat diperoleh dengan wawancara, kuesioner, maupun observasi langsung di lapangan atau laboratorium.

Terdapat 4 tingkatan data dalam statistika. Tingkatan paling rendah adalah data nominal. Pada data nominal, tidak ada pemeringkatan data. Misalnya, pada data jenis kelamin, laki-laki dan perempuan dianggap memiliki peringkat yang sama. Tingkatan kedua adalah data ordinal. Pada data ini, sudah ada pemeringkatan data. Misal pada data tingkat pendidikan terakhir responden, bisa terlihat jelas bahwa ada perbedaan peringkat antara sekolah dasar, SMP, SMA, dan perguruan tinggi. 

Tingkatan selanjutnya adalah data interval dan tingkatan tertinggi adalah data rasio. Hanya data kuantitatif yang bisa masuk dalam tingkatan interval dan rasio. Pada dua tingkatan ini terdapat pemeringkatan data. Namun, pada data interval titik nol tidak tetap. Contoh data interval adalah suhu udara karena suhu udara ketika diukur pada alat ukur lain titik nolnya akan berubah 0^{0}C=32^{0} F . Contoh data rasio adalah berat karena pada data berat titik nol tetap 0~kg=0~gram=0~ton.

Penyajian Data

Data dapat disajikan dalam bentuk grafik/plot/diagram agar lebih menarik dan informatif. Jenis grafik/plot/diagram yang bisa digunakan sangat bergantung pada jenis data. Sebagai contoh, diagram batang (bar chart) digunakan untuk menyajikan data diskrit atau data ketegorik/kualitatif. Sedangkan histogram digunakan untuk menyajikan data kontinu. Diagram batang dan daun (stem and leaf plot) dan diagram kotak (boxplot) banyak ditemui dalam output software statistika, diantaranya adalah SPSS, Minitab, dan R.

Stem and leaf plot

Secara umum diagram ini dapat menggambarkan bentuk visual dan sebaran data dengan menggunakan data aslinya. Batang (stem) berada di sebelah kiri garis tegak sebagai pengganti interval dan merupakan angka yang memiliki level lebih besar daripada angka pada daun (leaf). Adapun daun berada di sebelah kanan garis tegak dan ditulis dengan bilangan sisanya. Sebagai contoh batang adalah puluhan, maka daunnya adalah satuan.

Dari stem and leaf plot akan langsung diperoleh informasi tentang nilai data terendah, nilai data tertinggi, quartil data, modus, dan sebaran data. Sebagai contoh, pada gambar di atas, nilai data terendah adalah 34 dan nilai data tertinggi adalah 98.

Boxplot

Boxplot merupakan salah satu cara menyajikan data numerik melalui lima ukuran yaitu, nilai data terendah (minimum), nilai data tertinggi (maksimum), quartil 1, quartil 2 atau median, dan quartil 3. Selain untuk melihat sebaran data, plot jenis ini juga dapat digunakan untuk mendeteksi outlier atau nilai data yang jauh berbeda dengan nilai data lainnya.