Senin, 11 Maret 2019

Varian dan Standar Deviasi (Simpangan Baku)

Varian dan Standar Deviasi (Simpangan Baku)

Varian dan standar deviasi (simpangan baku) adalah ukuran-ukuran keragaman (variasi) data statistik yang paling sering digunakan. Standar deviasi (simpangan baku) merupakan akar kuadrat dari varian.s=\sqrt{s^2}Oleh karena itu, jika salah satu nilai dari kedua ukuran tersebut diketahui maka akan diketahui juga nilai ukuran yang lain.
Penghitungan
Dasar penghitungan varian dan standar deviasi adalah keinginan untuk mengetahui keragaman suatu kelompok data. Salah satu cara untuk mengetahui keragaman dari suatu kelompok data adalah dengan mengurangi setiap nilai data dengan rata-rata kelompok data tersebut, selanjutnya semua hasilnya dijumlahkan.

Namun cara seperti itu tidak bisa digunakan karena hasilnya akan selalu menjadi 0.

Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap pengurangan nilai data dan rata-rata kelompok data tersebut, selanjutnya dilakukan penjumlahan. Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif.

Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan ukuran data (n).

Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi. Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel.

Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka nsebagai pembagi penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilai varian sampel mendekati varian populasi. Oleh karena itu rumus varian sampel menjadi: 


Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Misalkan satuan nilai rata-rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai satuannya maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan baku).


Untuk mempermudah penghitungan, rumus varian dan standar deviasi (simpangan baku) tersebut bisa diturunkan :

Rumus varian :


Rumus standar deviasi (simpangan baku) :


Keterangan:
s2 = varian
s = standar deviasi (simpangan baku)
xi = nilai x ke-i
 = rata-rata
n = ukuran sampel


Contoh Penghitungan

Misalkan dalam suatu kelas, tinggi badan beberapa orang siswa yang dijadikan sampel adalah sebagai berikut. 

172, 167, 180, 170, 169, 160, 175, 165, 173, 170

Dari data tersebut diketahui bahwa jumlah data (n) = 10, dan (n - 1) = 9. Selanjutnya dapat dihitung komponen untuk rumus varian.


Dari tabel tersebut dapat ketahui:

 

Dengan demikian, jika dimasukkan ke dalam rumus varian, maka hasilnya adalah sebagai berikut.

Dari penghitungan, diperoleh nilai varian sama dengan 30,32.

Dari nilai tersebut bisa langsung diperoleh nilai standar deviasi (simpangan baku) dengan cara mengakarkuadratkan nilai varian.

Ukuran Gejala Pusat Data Berkelompok

UKURAN GEJALA PUSAT DATA BERKELOMPOK
Ukuran gejala pusat dan ukuran letak masih merupakan bagian dari statistik deskriptif. Ada beberapa macam ukuran gejala pusat , yaitu rata-rata hitung, rata- rata ukur, rata-rata harmonik, median dan modus. Sedangkan ukuran letak meliputi kuartil, desil dan persentil. Bila ukuran tersebut diambil dari sampel disebut statistik dan jika ukuran diambil dari populasi disebut parameter.

UKURAN GEJALA PUSAT
Ukuran gejala pusat adalah suatu ukuran yang digunakan untuk mengetahui kumpulan data mengenai sampel atau populasi yang disajikan dalam tabel atau diagram, yang dapat mewakili sampel atau populasi. Ada beberapa macam ukuran tendensi sentral, yaitu rata-rata (mean), median, modus, kuartil, desil dan persentil. Gejala pusat sebagai nilai rata-rata yang mempunyai kecenderungan memusat, sehingga sering disebut ukuran kecenderungan memusat (measures of central tendency). Beberapa jenis rata-rata yang sering digunakan adalah rata-rata hitung (arithmetic mean atau sering disingkat mean saja), lalu rata-rata ukur (geometric mean), kemudian rata-rata harmonis (harmonic mean). Dan umumnya terdapat istilah mean ,median, dan modus.
Gejala pusat pada hakekatnya menganggap rata-rata (average) dapat merupakan nilai yang cukup representatif bagi penggambaran nilai-nilai yang terdapat dalam data yang bersangkutan. Rata-rata sedemikian itu dapat dianggap sebagai nilai sentral dan dapat digunakan sebagai pengukuran lokasi sebuah distribusi frekuensi. Statistik mengenal bermacam-macam rata-rata dengan nama-nama yang khas, yaitu rata-rata hitung (mean), median, modus, rata-rata ukur dan rata-rata harmonis itu semua merupakan jenis rata-rata yang lazim digunakan sebagai pengukuran lokasi atau pengukuran tendensi sentral (central tendency) dari sebuah distribusi.

A. Rata-rata Hitung (Mean)
Statistik yang paling banyak digunakan ukuran gejala pusat adalah Rata-rata hitung (Mean). Rata-rata hitung didefinisikan sebagai jumlah semua skor untuk variabel dan kemudian dibagi dengan jumlah pengamatan. Oleh karena itu, rumus untuk rata-rata hitung adalah sebagai berikut:
Sebagai contoh, mengambil data yang disajikan dalam Tabel :
Jumlah pengamatan (ΣX) adalah 1 + 5 + 7 + 2 + 10 + 4 + 6 + 5 + 4 + 6 = 50. Lalu, kita membagi nilai ini dengan n, yang pada contoh ini adalah 10 karena kita memiliki 10 pengamatan. Jadi, 50/10 = 5. Rata-rata hitung untuk set pengamatan ini adalah 5. Software statistik SPSS menyediakan beberapa cara untuk menghitung rata-rata untuk sebuah variabel. Perintah Mean dapat ditemukan di bawah Descriptives, kemudian Frequencies, Explore, dan akhirnyaMean. Selain itu, rata-rata dapat menjadi tambahkan output untuk perhitungan lainnya,seperti regresi ganda. Output untuk mean Descriptives disajikan pada Gambar :
Seperti yang terlihat pada output, variabel “titik data” memiliki total 10 observasi (dilihat di bawah kolom N), nilai terendah dalam kumpulan data adalah 1, nilai tertinggi adalah 10, rata-rata adalah 5, dan standar deviasi 2,539.
Ada dua masalah utama yang perlu Anda ketahui ketika menggunakan rata-rata hitung.

  1. Rata-rata hitung dapat dipengaruhi oleh outliers, atau data nilai-nilai yang berada di luar jangkauan mayoritas titik data. Outliers dapat menarikmean menuju daerah outliers, sehingga menghasilkan nilai Mean yang bias. Sebagai contoh, jika data yang ditetapkan dalam Gambar 1 termasuk data titik (yang akan pengamatan 11) dari 40, mean akan menjadi 8.2. Jadi, ketika kumpulan data sangat miring, itu dapat lebih signifikan untuk menggunakan ukuran gejala pusat yang lain (misalnya, median atau modus).
  2. Rata-rata hitung sulit untuk ditafsirkan ketika variabel yang dihitung adalah variabel nominal dengan dua tingkatan (misalnya, jenis kelamin) dan tidak signifikan ketika ada lebih dari dua tingkat atau kelompok untuk suatu variabel (misalnya, etnis). Mean akan konsisten saat pengukuran dengan pengulangan (repeated measures) pada variabel yang sama, rata-rata hitung cenderung untuk tidak berubah secara radikal (selama tidak ada ekstrim outliers dalam kumpulan data).

B. Modus
Modus paling banyak digunakan pada penelitian kualitatif. Dalam penelitian kualitatif, hal yang paling banyak menyebabkan suatu keadaan sering di anggap penyebab keadaan tersebut. Misalnya kebanyakan kecelakaan lalulintas disebabkan oleh pengemudi yang mabuk. Pengemudi yang mabuk dalam hal ini adalah “modus”. Dalam data berbentuk kuantitatif, modus sangat mudah untuk dideteksi. Dengan melihat data kita tinggal menentukan angka berapa yang paling sering muncul. Angka yang sering muncul itulah yang kita sebut dengan modus.
Pada data nilai siswa pada mata pelajaran sejarah kebudayaan Islam di atas terlihat bahwa angka yang paling sering muncul adalah 67 yang muncul sebanyak tiga kali dan tidak ada yang muncul sebanyak itu dari data yang lain. Akan tetapi pada data yang telah tersusun dalam tabel frekuensi, modus dapat di cari dengan menggunakan rumus:
Keterangan:
b= batas bawah kelas modus yaitu kelas yang memiliki frekuensi terbanyak
p= panjang kelas modus
b1 = frekuensi kelas modus dikurangi frekuensi kelas interval dengan tanda kelas yang lebih kecil sebelum tanda kelas modus.
b2 = frekuensi kelas modal dikurangi frekuensi kelas interval dengan tanda kelas yang lebih besar sesudah tanda kelas modus.
Misalnya dari tabel frekuensi di atas kita dapat menghitung modusnya. Dengan memperhatikan tabel kita akan menemukan
b = 70,5
p = 10
b1 = 7 – 5 = 2
b2 = 7 – 3 = 4
Dengan memasukkan data tersebut ke dalam rumus akan kita dapatkan
Kembali kita menemukan bahwa menghitung modus pada data berkelompok berbeda dengan menghitung modus pada data tunggal. Aspek ramalan yang kita gunakan pada penentuan modus dengan menggunakan data berkelompok turut menentukan hasil modus yang kita temukan. Ternyata menentukan modus dengan tidak mengelompokkan data lebih tepat daripada kita mengelompokkan data terlebih dahulu.

C. Median
Median adalah datum yang membagi data menjadi dua kelompok, 50 persen data kurang dari nilai median dan 50 persen data lebih besar dari median. Pada data tunggal, pencarian nilai median dilakukan dengan cara mengurutkan data dari nilai terkecil ke nilai terbesar. Kemudian nilai tengah data yang telah diurutkan itu merupakan nilai median.
Bagaimana menentukan nilai median dari data berkelompok? Bagaimana penurunan formula nilai median untuk data berkelompok hingga menjadi rumus sebagai berikut:
di mana:
Lo = tepi bawah dari kelas limit yang mengandung median,
Me = nilai median,
n = banyaknya data,
Fk = frekuensi kumulatif sebelum kelas yang memuat median,
f0 = frekuensi kelas yang memuat median,
c = panjang intreval kelas.

Perhatikan Tabel berikut:

Bentuk histogram dari Tabel Di atas adalah:
 
Oleh karena banyaknya data 64, maka nilai median jatuh pada data ke-32. Garis merah horizontal menunjukkan posisi data ke-32 sementara garis hijau muda vertikal menunjukkan median data berkelompok dari data di atas. Jumlah kumulatif hingga kelas limit ketiga adalah 22. Berarti, posisi median berada pada data ke-10 (32 – 22) pada kelas limit keempat. Bilangan ini diperoleh dari (n/2 – Fk).
Median data berkelompok dihitung berdasarkan interpolasi dari posisi data pada kelas limit yang mengandung median. Secara matematis, persamaannya dapat ditulis sebagai berikut: 
Sehingga dengan manipulasi matematik akan diperoleh persamaan:
 
Di mana: Lu – Lo menyatakan panjang interval kelas dan Fk* – Fk menunjukkan frekuensi kelas limit median f0. Dengan demikian, median data berkelompok yang dihasilkan sama dengan:
 
Demikian asal muasal median untuk data berkelompok.