DASAR-DASAR
STATISTIKA
1.1 Pengertian
Statistik, Data, dan Statistika
Sebelum berbicara tentang statistik sebagai ilmu, maka
perlu dipahami mengenai statistik sebagai data dan hasil perhitungan. Istilah statistik pada mulanya diturunkan dari istilah
bahasa latin ratio status yaitu mengenai
studi politik atau seni bagi pemerintahan. Setelah itu, dikenal istilah
statista yang kurang lebih artinya pengalaman seseorang dalam masalah-masalah
kemasyarakatan.
1.
Pengertian
statistik menurut London
Statistical Society mendefinisikan
statistik sebagai fakta-fakta yang dikalkulasikan untuk menggambarkan kondisi
masa lalu, sekarang, dan masa depan pada suatu masyarakat. Dari definisi ini
dapat ditarik suatu pengertian statistika bahwa fakta yang disajikan adalah data
yang sudah mengalami suatu pengolahan tertentu.
Kegunaan dari fakta yang semakin luas bukan saja mencerminkan kondisi
sekarang tetapi dapat dipergunakan sebagai dasar perkiraan kondisi di masa yang
akan datang. 2.
2.
Pengertian statistik menurut A.C. Moreau de Jones (1947)
yaitu ilmu mengenai fakta-fakta sosial yang dinyatakan dalam angka-angka.
3.
Sedangkan, menurut K.F.W. Dieterici (1850) statistik
adalah pernyataan dalam gambar-gambar dan fakta-fakta mengenai kondisi suatu
negara.
Kegiatan dalam statistik adalah kegiatan yang erat
hubungannya dengan angka-angka. Angka-angka mengandung informasi yang sesuai
dengan masalah yang berkaitan dengan angka-angka tersebut. Sebagai contoh angka
mengenai jumlah penduduk yaitu angka yang memuat informasi tentang penduduk
seperti jumlah penduduk, pekerjaan, umur, jenis kelamin, distribusi wilayah
tempat tinggal, kesehatan, dan lain saebagainya; tetapi yang terdapat dalam
masyarakat tentu tidak sesederhana yang dicontohkan, di mana masalahnya sangat
komplek.
Oleh sebab itu, kegiatan statistika mulai
berkembang tidak hanya sekedar mengumpulkan angka-angka tetapi meliputi upaya
menafsirkan angka-angka itu. Selain itu, berkembang pula cara-cara mendapatkan
angka-angka tersebut dan informasi yang terkandung di dalamnya dan mudah
dilakukan pengumpulannya dengan biaya yang tidak terlalu mahal.
1.2 Data, Statistik, dan Data Statistik
Di dalam suatu penelitian seorang peneliti berusaha
mengungkapkan gejala-gejala alam, sosial, ekonomi, dan budaya sesuai dengan
tujuan penelitiannya, Apabila gejala tersebut diterjemahkan ke dalam bahasa
statistika, maka penelitian dapat diartikan sebagai suatu usaha untuk
mengungkapkan gejala alam tersebut secara angka-angka atau numerik.
Gejala-gejala yang dimaksud disebut dengan data (bentuk jamak dari datum; dan datum adalah individu data). Jadi, data atau datum adalah sesuatu yang
diketahui yang dicatat dengan angka atau yang dapat diangkakan. Atau, juga dapat dikatakan bahwa data adalah
sekumpulan angka yang dapat menggambarkan sesuatu dan mempunyai pengertian yang
jelas serta tujuan yang jelas.
Ada pula yang menyatakan bahwa data adalah keterangan
mengenai sesuatu untuk tujuan tertentu, baik yang berupa angka, kalimat, dan
uraian, maupun laporan tertulis atau lisan.
Upaya mendapatkan data dapat berasal dari eksploitasi, survei, estimasi,
percobaan, dan imajinasi, maupun simulasi. Data yang didapat seperti apa yang
disebutkan di muka tidak langsung dapat mengungkapkan sesuatu yang sesuai
dengan apa yang diharapkan dari tujuan dari pengumpulan data tersebut atau
untuk apa data tersebut dikumpulkan (dicari).
Akan tetapi, agar supaya data yang telah terkumpul dapat dipakai untuk
menjawab tujuan dari data pengumpulan data tersebut, maka perlu dilakukan
analisis data yang sesuai dengan tujuan dari pengumpulan data tersebut.
Analisis data menggunakan alat analisis yang disebut
dengan “statistika”. Staistika
selain sebagai ilmu statistik, juga merupakan suatu alat analisis data, sehingga
lengkapnya disebut analisis statistika.
Analisis statistika adalah pengolahan data statistik agar dapat
memberikan gambaran yang jelas tentang data yang telah dikumpulkan, untuk
dipakai dalam menyimpulkan tujuan dari data tersebut dikumpulkan.
Macam analisis statistika untuk pengolahan data jumlahnya
sangat banyak, tergantung pada jenis data yang akan diolah dan tujuan
pengolahan data, serta kesiapan dari perangkat lunak dan perangkat keras
seperti kalkulator, komputer dan program-programnya (solf-wares), serta kemahiran dan pemahaman menggunakan alat tersebut.
Yang tak kalah pentingya juga yaitu interpretasi dari
keluaran (output) hasil analisis, hal
ini akan menjadi tugas utama para mahasiswa dalam belajar statistika dan
analisisnya.
Seperti apa yang diungkapkan di muka, bahwa data
adalah sesuatu gejala-gejala yang diungkapkan dengan angka atau yang bersifat
numerik, atau sesuatu yang dapat diangkakan.
Selain itu pula, bahwa data juga disebut dengan “statistik” yang berarti sebagian dari populasi data atau parameter
yang diwakilinya. Dalam hal ini, data di
sini dimaksudkan adalah pengamatan dan pencatatan dalam bentuk angka atau
numerik dari sampel atau sebagian dari populasi. Dalam statistika data disamakan dengan statistik,
sehingga analisis data sama artinya dengan analisis statistik. Sesuatu
yang dianggap juga dapat merupakan data walaupun data demikian belum tentu
benar, sebab masih merupakan suatu pernyataan yang sangat lemah yang memerlukan
pengujian sebelum data itu dipergunakan sebagai dasar pembuatan keputusan. Di dalam prakteknya sering suatu anggapan
dipakai suatu dasar untuk membuat suatu
keputusan.
Akan tetapi, perlu
ditekankan bahwa antara statistik
dan statistika mempunyai arti sangat
yang berbeda. Perbedaan tersebut adalah: statistik berarti data, dan statistika
adalah ilmu yang mempelajari statistik atau alat yang digunakan untuk mengolah
data atau statistik.
Jadi analisis statistika
diartinya analisis data yang didasarkan pada ilmu statistik atau statisitika. Kadang-kala pernyataan sering menjadi
berlebihan yaitu analisis data statistik,
yang mana pernyataan ini mengindikasikan suatu analisis data berdasarkan ilmu
statistik, di mana data statistik yang juga berarti data atau
statistik.
Jelaslah, bahwa data
sama dengan statistik, maka pembicaraan selanjutnya analisis data sama maknanya
dengan analisis statistik. Sehingga,
dalam penelitian ekperimen, survey, eksplorasi, simulasi atau komperatif
diharapkan dalam analisis statistik haruslah didahului dengan adanya hipotesis yang akan diuji atau
dibuktikan, atau dengan kata lain bahwa dalam penelitian yang memakai hipotesis
dapat diuji atau dibuktikan kebenarannya dengan menggunakan analisis statistik
pada taraf nyata, atau selang kepercayaan, atau pada tinggkat kesalahan, atau
disebut taraf nyata pada nilai tertentu.
Tentu saja data
dianggap baik apabila data tersebut memenuhi syarat seperti:
1. Objektif. Objektif artinya data harus sesuai dengan
keadaan yang sebenarnya. Misalnya kebutuhan tenaga untuk kapal pesiar dari
Propinsi Bali meningkat, disebabkan oleh pekerja-pekerja dari Bali di kapal
pesiar lebih ulet dan serius.
2. Mewakili. Mewakili arinya sampel sesuai dengan
populasinya. Laporan mengenai jumlah
penduduk yang berdasarkan pulau yang padat penduduknya, laporan mengenai
kebutuhan tenaga untuk kapal pesiar sesuai dengan keperluan, maka data yang
demikian disebut tidak mewakili.
3. Kesalahan baku
(standar error) harus kecil. Data yang
baik haruslah mempunyai kesalahan baku yang kecil artinya penyimpangan data
terhadap nilai rata-ratanya harus kecil. Data dengan kesalahan baku yang kecil
adalah sangat baik, apabila
diapakai dasar pendugaan atau perkiraan (estimasi), maka perkiraan hampir sama dengan aslinya. Mengenai kesalahan baku dan estimasi akan dibicarakan
kemudian.
4. Tetap
waktu. Syarat tepat waktu
sangat diperlukan apabila data itu dipakai sebagai alat kontrol dan
evaluasi. Hal ini dimaksudkan supaya
dengan cepat dapat dilakukan perbaikan-perbaikan, atau apabila ada
kesalahan-kesalahan di dalam suatu program tertentu maka cepat dapat ditangani.
Misalnya pemerintah ingin mengetahui
dampak negatif dari kesalahan daftar pelilih tetap untuk PEMILU, maka kesalahan
daftar pelilih tetap untuk PEMILU harus segera direvisi sesuai dengan jumlah
pemilih yang sebenarnya harus dapat memilih, soal GOLPUT adalah masalah
lain. Hal ini harus
dapat diatasi dengan kartu penduduk tunggal bukan ganda.
5. Relevan. Data yang dikumpulkan harus ada
relevansinya atau kaitannya atau hubungannya dengan masalah yang sedang
dihadapi. Misalnya pemerintah mengetahui
adanya penurunan subsidi minyak tanah akan mengakibatkan harga minyak akan
meninggkat dan menimbulkan kerawan pada penduduk miskin desa dan kota pada
tahun terakhir ini, maka data baru segera dikumpulkan yang berhubungan dengan
harga dan konsumsi minyak tanah agar jangan meninbulkan masalah baru bagi
masarakat miskin.
Data yang
akan dianalisis dapat dibedakan menjadi:
1. Data menurut sifatnya:
(1) data
kualitatif yaitu data yang berbentuk angka semu, dapat berbentuk kata-kata
atau pernytaan. Misal: pengembalian kredit sangat
lancar, harga bahan makanan pokok meningkat,
dampak pendidikan sangat membantu, dan
jenis kelamin pria dikodekan dengan 1 dan perempuan dengan kode 0.
(2) data
kuantitatif yaitu data yang berbentuk angka atau bilangan asli. Misal: rata-rata nilai ujian statistika 45,
jumlah pekerja di kapal pesiar 15.000 orang dari Daerah Bali, suhu rata-rata
tahun 2009 setinggi 340 C.
Dibandingkan dengan data kualitatif, data kuantitatif
lebih nyata dan lebih jelas, tetapi tidak semua masalah dapat dinyatakan dengan
data kuantitatif.
2. Data menurut sumbernya:
(1) data
internal yaitu data yang menggambarkan kegiatan di dalam suatu organisasi
atau suatu lingkungan tertentu. Misal:
data jumlah mahasiswa, data perlengkapan, jumlah penduduk, data sumber alam, dan
lain-lain dari lembaga yang diambil datanya.
(2)
data eksternal yaitu data yang
menggambarkan data kegiatan di luar suatu organisasi atau suatu lingkungan
tertentu. Misal: bagi suatu
negara data eksternal berupa bagaimana daya saing barang-barang ekspor di
pasaran internasional. Data eksternal
bagi suatu perusahaan, bagaimana tanggapan masyarakat terhadap produk baru yang
dijual di pasaran. Data yang dikumpulkan
secara tidak langngsung dari luar lembaganya.
3. Data menurut cara memperolehnya:
(1) data primer
yaitu data yang dikumpulkan dari sumber aslinya dan diolah langsung oleh suatu
badan organisasi atau perseorangan.
Misal: data hasil penelitian seorang mahasiswa pada akhir
studinya di Perguruan Tinggi Sekolah Tinggi Perhotelan International Bali. Pemerintah ingin mengetahui dampak dari hasil
penelitian tersebut terhadap minat orang-orang Bali yang ingin bekerja di kapal
pesiar melalui departemen yang terkait,
hasil penelitian ini disebut data primer.
(2) data
skunder yaitu data yang dikumpulkan dari bukan sumber aslinya dan tidak diolah langsung oleh suatu badan
organisasi atau perseorangan yang memakainya.
Misal: Laporan tahunan dipakai oleh
pemerintah atau lembaga yang ingin mengetahui keinginan pelaku pasar untuk
mengetahui devaluasi uang rupiah terhadap harga-harga di pasaran, pemerintah
melalui departemen yang terkait melakukan penelitian maka data yang diperoleh
disebut data skunder.
4. Data menurut waktu pengumpulannya:
(1) cross
section data atau data sesaat
yaitu data yang dikumpulkan pada suatu kurun waktu
tertentu saja.
Misal: data dari hasil sensus penduduk
Indonesia tahun 2007 yang dipakai menggambarkan keadaan penduduk tahun 2007 sd
tahun 2009.
(2) times
series data atau data berkala
atau data runut waktu yaitu data yang dikumpulkan dari waktu ke waktu tertentu.
Misal: bagaimana meningkan pengiriman tenaga kerja kapal
pesiar lima tahun terakhir per bulan akibat dari peninggkatan permintaan. Data
berkala berguna sebagai dasar pembuatan ramalan yang berkaitan langsung dengan
suatu perencanaan, karena memberikan gambaran tentang kemampuan di masa yang
akan datang, berdasarkan data yang sedang dikumpulkan atau data masa lalu.
5. Data menurut pengelompokkan
Menurut Stevens (dikutif Masri, 1995), pada dasarnya data atau statistik dikelompokan
atau digolongan sesuai dengan ukuran atau skala yang digunakan yaitu.
(1) data skala nominal atau ukuran nominal adalah
ukuran data yang paling sederhana, di mana angka atau numerik diberikan kepada
obyek yang berarti sebagai label atau kode saja, dan anggka tidak menunjukkan arti
apa-apa. Obyek dikelompokan dalam set, dan pada semua anggota set diberikan
angka. Set tersebut tidak boleh tumpang
tindih. Misalnya; untuk variabel jenis
kelamin diberikan kode 1 untuk pria dan kode 0 untuk wanita. Angka 1 dan angka 0 tersebut digunakan tidak sebagai nilai, tetapi sekedar kode
bahwa responden yang mempunyai kode 1 adalah Pria dan yang mempunyai kode 0
adalah wanita. Jelas kelihatan, bahwa
angka yang diberikan tidak menunujukkan bahwa tingkat wanita lebih rendahi dari
pada pria ataupun sebalinya. Angka
tersebut tidak memberikan arti apa-apa jika ditambahkan. Melalui tingkat ukuran
nominal ini, peneliti dapat mengelompokkan respondennya ke dalam dua kategori
atau lebih variabel tertentu; misalnya jenis kelamin, status pekerjaan, jenis
kerjaan, agama, dan variabel lainnya.
(2) data
skala ordinal atau ukuran ordinal adalah angka
yang diberikan di mana angka-angka tersebut mengandung pengertian
tingkatan. Ukuran ordinal digunakan
untuk mengurutkan obyek dari yang terendah ke tertinggi atau sebaliknya. Ukuran ini tidak memberikan nilai absolut
pada obyek tetapi hanya memberikan ranking atau tingkatan saja. Misalnya terdapat lima jenis varietas padi
yaitu varietas A, B, C, D, dan E dengan hasil produksinya masing-masing: 1,5
ton; 4,7 ton; 4,0 ton; 3,0 ton;
dan 2,8 ton. Maka ukuran secara
ordinal untuk varietas-varietas padi adalah sebagai berikut .
Nomor
|
Varietas
|
Nomor
|
Rangking
|
Hasil (Ton)
|
1
|
A
|
1
|
1
|
1,5
|
2
|
B
|
2
|
5
|
4,7
|
3
|
C
|
3
|
4
|
4,0
|
4
|
D
|
4
|
3
|
3,o
|
5
|
E
|
5
|
2
|
2,8
|
Beberapa
sifat dari ukuran ordinal adalah: (1) ukuran
ordinal hanya menyatakan ranking atau tingkatan, (2) ukuran
ordinal tidak menyatakan nilai absolut, dan (3) ukuran ordinal
menyatakan bahwa jarak atau space
antara dua angka atau rank tersebut tidak sama besarnya.
Skala ranking bukanlah skala
yang mempunyai interval yang sama. Atau
dua nilai rank yang berneda tidak syah bila dijumlahkan. Umpamanya
3 + 5 ≠ 8.
Dalam penelitian sosial skala
sikap, pengetahuan, ketrampilan, ataupun prestasi yang banyak digunakan adalah
ukuran atau skala ordinal.
Misalnya; jika enam orang siswa, A, B, C, D, E, dan F diukur dengan
ukuran interval pada skala prestasi dengan ukuran 1, 2, 3, 4, 5, dan 6 maka
dapat dikatakan bahwa beda prestasi antara A dan D adalah 4 -1 = 3, beda
prestasi antara F dan B adalah 6 - 2 = 4.
Akan tetapi, tidak boleh disimpulkan bahwa prestasi D adalah empat kali
dari prestasi A ataupun prestasi F tiga kali dari prestasi B.
(3) data skala interval atau ukuran interval adalah adalah suatu pemberian angka kepada set dari
obyek-obyek yang mempunyai sifat-sifat ukuran ordinal dan ditambah satu sifat
lain yaitu mempunyai jarak yang sama. Pada pengukuran interval memperlihatkan jarak yang sama dari ciri atau
sifak obyek yang diukur. Dalam penelitian skala interval dinyatakan dengan
bilangan cacah, yang menyatakan individu secara uruh seperti anak kambing Si
Amat 6 ekor, kopi yang disediakan hanya 10 cangkir, enam orang siswa, A, B, C,
D, E, dan F tingginya yang berbeda. Ukuran interval memenuhi aturan operasional
matematika seperti empat ekor kerbau mati satu ekor, maka tinggal tiga ekor
atau (4 – 1 = 3) ekor.
(4) data
skala rasio atau ukuran rasio adalah ukuran yang mencakup semua ukuran di atas, ditambah dengan satu
sifat lain, yaitu ukuran ini memberikan keterangan tentang nilai absolut dari
obyek yang diukur. Ukuran rasio mempunyai titik nol, karena itu interval jarak
tidak dinyatakan dengan beda angka rata-rata kelompok, tetapi dibandingkan
dengan titik 0 di atas sebagai titik acuan. Karena ada titik 0 tersebut, maka
ukuran rasio dapat dibuat perkalian ataupun pembagian. Angka pada skala ratio
menunjukan nilai sebenarnya dari obyek yang diukur. Ukuran rasio banyak sekali digunakan dalam ilmu
sosial maupun eksakta. Beberapa contoh variabel yang menggunakan ukuran ratio
adalah persentase anak hidup normal, tingkat ketergantungan, tingkat pengangguran,
dan lain sebagainya
Sesuai dengan jenis skala
pengukuran yang digunakan, maka variabel penelitian juga dibagi menjadi empat
yaitu: (1) variabel nominal adalah variabel yang dikatagorikan secara
diskrit dan saling terpisah satu sama
lainnya (mutually eklusive) seperti; status perkawinan, jenis kelamin, jenis
pekerjaan, dan sebagainya. (2) variabel ordinal adalah
variabel yang disusun atas dasar ranking seperti prestasi mahasiswa, perlombaan
catur, sukarnya suatu pekerjaan, dan sebagainya. (3) variabel interval adalah variabel yang diukur dengan ukuran
interval seperti penghasilan, sikap, pengetahuan, ketarmpilan, dan sebagainya. Dan (4) variabel rasio adalah variabel yang disusun dengan ukuran rasio
seperti dependency ratio, tingkat
pengangguran, dan tingkat kegagalan, dan sebagainya.
1.3 Hipotesis dan
Pengujiannya
Pengertian hipotesis yang terdiri atas dua kata yaitu
hipo dan tesa, hipo yang berarti sementara dan tesa yang berarti pernyataan,
sehingga hipotesis diartikan pernyataan sementara yang pada umunya diperoleh
dari: telahaan kepustakaan, hasil penelitian sebelumnya, kemampuan berfikir
yang brilion, dan daya intuisi yang tidak terfikirkan sebelumnya, serta
dari pernyataan pemegang otoritas.
Dengan adanya hipotesis yang
merupakan pernyataan sementara atau jawaban sementara dari suatu permasalah
yang telah dirumuskan, sehingga pernyataan tersebut harus dibuktikan
kebenarannya dengan mengunakan analisis statistika (analisis berdasarkan ilmu
statistik) dari data emperis atau data yang diperoleh dari hasil penelitian
pada taraf kesalahan (p = α) tertentu
atau selang kepercayaan (SK) tertentu.
Dalam pengujian
hipotesis, terdapat dua macam rumusan hipotesis yaitu: Hipotesis Nul yang disimbukan dengan H0 dan Hipotesis Alternatif
atau Hipotesis Tandingan atau Hipotesis Pilihan yang disimbulkan dengan H1 atau Ha. Hipotesis alternatif (H1) merupakan pilihan salah
satu pernyataan yang akan diuji dari segugusan pernyataan-pernyataan yang ada, selain
hipotesis nul (H0). Pengujian yang berdasarkan suatu hipotesis disebut uji hipotesis di mana datanya dari data pengamatan, yang akan menghasilkan
keputusan: tolak hipotesis atau
sebaliknya terima hipotesis.
Yang dimaksud dengan
hipotesis dalam pernyataan
hipotesis yaitu: hipotesis
nul atau H0.
Dari analisis statistika
terhadap data penelitian atau percobaan terdapat suatu
istilah selang kepercayaan (SK) dengan nilai SK = 1 - α di mana α adalah taraf nyata
tertentu. Sehingga didapatkan pernyataan yang
tetap dan teruji atau terbuktikan yaitu: tolak hipotesis atau terima hipotesis. Pernyataan yang tetap ini disebut dengan tesis.
Penentuan taraf nyata (α) atau selang kepercayaan (SK = 1 - α) didasarkan pada jenis kesalahan yang terjadi dalam melakukan
pengukuran, pengumpulan, dan analisis data.
Terdapat dua tipe kesalahan, yaitu tipe
kesalahan I yang menyatakan tolak H0 padahal H0 benar, yang seharusnya diterima dan tipe kesalahan II yang menyatakan terima H0
padahal H0 salah yang seharusnya ditolak. Pernyataan yang benar dalam
hipotesis adalah terima H0 apabila H0 benar dan sebaliknya tolak H0 apabila H0
salah. Kesalahan tipe I, disebut dengan taraf
nyata (α), dan kesalahan tipe II, disebut
kuasa uji, yang disimbulkan dengan beta (β).
Dalam analisis
statistika yang lebih umum digunakan adalah jenis kesalahan I atau dengan
istilah taraf nyata (α) atau peluang (p) atau sering pula
dinyatakan dengan selang kepercayaan (convident interval = SK = 1 – α). Dalam penelitian besarnya nialai α berkisar antara 0,1% sampai dengan 15% atau 20%
tergantung pada jenis penelitian.
Biasanya untuk
penelitian biologi dengan range α antara 5% sampai dengan
1%, penelitian kedokteran dengan range α antara 1% sampai dengan 0,1%, dan penelitian sosial, budaya, dan ekonomi
dengan range α antara 5% sampai dengan 15% bahkan kadang-kadang 20%. Sehingga nilai selang kepercayaan (SK) tergantung pada nilai α (taraf nyata) yang digunakan.
Contoh suatu pernyataan
hipotesis: terdapat perbedaan antara hasil padi
sawah di dataran rendah dengan di dataran tinggi. Pernyataan tersebut dapat ditulis dengan rumusan hipotesis. dan di mana adalah hasil padi pada dataran rendah dan adalah hasil padi pada
dataran tinggi.
1.4 Macam Analiasis Statistika
Perkembangan analisis satistika demikian pesatnya seiring
dengan perkembangan teknologi komputer
yang dilengkapi dengan perangkat lunaknya.
Hal ini seiring dengan kebutuhan para pengguna analisis statistika yang
mehendaki bantuan analisis statistika yang lebih komprehensif.
Beberapa macam analisis statistika sebagai alat analisis data, secara garis
besarnya dapat dibedakan menjadi dua
bagian besar yaitu: (1) analisis parametrik dan (2)
analisis non parametrik. Analisis parametrik adalah analisis
statistika yang didasarkan atas data yang bersifat numerik kuantitatif yaitu
data dengan skala interval dan rasio, dengan syarat bahwa data mempunyai
sebaran normal dan varians yang homogen.
Sedangkan, analisis non parametrik merupakan analisis data, dengan bebas
sebaran dan datanya dapat berupa data nominnal ataupun data ordinal.
Analisis statistika mendasarkan diri pada rumus-rumus
dasar yang menjadi pedoman analisis, apapun bentuk analisisnya, baik analisis
deskriptif, komparatif, dan asosiatif, maupun analisis lainnya. Di sisi lain,
masih banyak para pengguna statistika yang menggunakan analisis staatistika tanpa
pengetahuan dasar analisis yang kuat, apa yang dilakukannya hanya berdasarkan output
solf-wares yang ada tanpa mengertian apa maksud
dari keluaraan analisis tersebut. Untuk hal ini, maka perlu diunggkapkan
dasar-dasar analisis statistika yang umum digunakan seperti uraian berikut.
1.5 Dasar-dasar Analiasis Statistika
Analisis statistika diawali dengan penjumlah atau sigma
dengan tanda (∑) digunakan sebagai bentuk penjumlahan secara terurut dan p (phi) sebagai tanda perkalian
secara bertururutan dan tentunya tidak atau belum mempunyai arti jika tidak
atau belum diikuti oleh banyaknya nilai atau angka yang akan dijumlahkan atau dikalikan.
Yang lebih umum digunakan orang adalah tanda sigma (∑). Dari hasil penjumlahan,
selanjutnya akan didapatkan nilai rata-rata hitung atau mean atau average (). Sedangkan, dari hasil
perkalian dengan phi (p) dan
perhitungannya didapatkan hasil rata-rata geometrik (G) atau rata-rata
ukur (U) dan sebagainya.
Untuk lebih jelasnya perlu penyajian data yang tersusun
menurut baris atau kolom tunggal atau data yang tersesusun menurut baris dan kolom
bersama.
Misalnya terdapat variabel X, sebutlah dengan nama X adalah berat badan
orang laki-laki dewasa. Ada sepuluh
orang laki-laki dewasa yang diukur beratnya dengan data berikut di bawah ini.
Contoh Data Pengamatan Berat Badan
No.
|
X =
berat badan (kg)
|
No.
|
X =
berat badan (kg)
|
1
|
52,3
|
6
|
53,9
|
2
|
60,4
|
7
|
55,8
|
3
|
50,5
|
8
|
50,8
|
4
|
58,7
|
9
|
57,3
|
5
|
58,4
|
10
|
65,4
|
Total berat badan dari kesepuluh orang tersebut di atas dapat
ditulis dengan:
Total
= X1 + X2 + X3 + X4 + X5 + X6 + X7 + X8 + X9 + X10.
.
= 52,3 + 50,4 + 50,5 + 48,7 +
58,4 + 53,9 + 55,6 + 50,8 + 57,3 + 65,4
= 553,3.
Yaitu
berat orang No. 1 + berat orang No. 2 + . . .
+ berat orang No. 10.
Biasanya untuk menulis angka-angka di atas, dan lebih
bersifat umum maka untuk hal tersebut dinyatakan dengan berat orang No. 1
diberi tanda X1, berat
orang No. 2 diberi tanda X2,
dan seterusnya sampai berat orang No. 10 diberi tanda X10. Dapat
ditulis dengan Total = yang artinya dalam
hal ini berat badan total tersebut adalah dijumlahkan mulai dari X1 (untuk i = 1)
sampai dengan X10
(untuk i = 10).
Tanda titik tiga ( . . . ) dengan
arti dan seterusnya (dst) sampai dengan (sd). Dengan demikian, jika mempunyai n buah data pengamatan maka
penulisannya menjadi:
Total = = Y1 +
Y2 + . . . + Yn
(untuk penjumlahan satu baris atau kolom).
Nilai rata-ratanya disimbulkan dengan = .
Dari data di atas rata-rata samaa dengan = 553,4/10 = 55,34.
Total = = Y11 +
Y12 + . . . +
Ybk
(untuk penjumlahan dua arah, baris dan kolom).
Nilai rata-ratanya disimbulkan dengan = .
1.6 Aturan Sigma dan Turunanya
1. Sigma dari suatu nilai deviasi Xi dengan rata-ratanya sama dengan nol. Dapat ditulis
dengan: = 0. (d =
Xi - k) d = deviasi)
Deviasi dengan rata-ratanya = (Xi -) disimbulkan dengan (huruf kecil).
Jadi (Xi -) = . Di mana = 0,
Hal ini dapat dibuktikan dengan:
= = 0,
=
= (di mana adalah bilangan
konstan).
=
(sigma bilangan konstan = n kali bil kontans atau ∑k = nk)
=
=
= 0
2. Jumlah Kuadrat (JK)
Jumlah
Kuadrat dengan rumus sigma kuadrat deviasi dengan rata-ratanya ditulis dengan:
atau
Hal di atas dapat dijabarkan menjadi:
=
=
=
Dari
uraian di atas, penyelesaiannya menjadi seperti di bawah ini.
=
=
=
=
=
Nilai atau atau dinamakan: “Jumlah Kuadrat Simpangan” dan kata simpangan dibaca
dalam hati sehingga rumus: == disebut JK (= jumlah
kuadrat).
Jadi
rumus JK (Jumlah Kuadrat = Sum of Square )
=
Lebih umum ditulis dengan: JK =
= (ditulis dengan huruf kecil).
3. Kuadrat Tengah (KT) atau Varians
dan Kovarians (Covar)
Varians atau KT dengan rumus:
dan
Varians populasi
(σX2) = JK/n = =
Varians sampel (SX2) = JK/(n – 1) = =
Varians populasi
(σYY) = JK/n
=
Varians sampel (SYY) =
JK/(n – 1) =
(n -1 disebut derajat bebas = DB)
Perhatikan
cara penulisan kedua macam varians di atas !!!!!
Apabila satu komponen variabel Xi
atau Yi, pada varians X atau varians Y di atas diganti
dengan satu variabel Yi atau Xi maka
varians akan berubah menjadi kovarians dengan rumus seperti berikut ini.
Kovarians (Kovar = Cov) dengan rumus seperti berikut ini.
Kovarians populasi XY () =
Kovarians sampel XY () =
(n -1
disebut derajat bebas = DB)
Sehingga, dari uraian di atas dapat disingkat menjadi:
Var X
(populasi = σX2) =
=
Covar XY (populasi = ) =
) =
=
(ditulis dengan huruf kecil)
4. Simpangan baku atau standar deviasi
(S atau )
Simpangan Baku
atau Standar Deviasi (SX)
dengan rumus:
atau (X
adalah kode data)
5. Salah baku atau standar error (SE atau )
Salah
Baku atau Standar Error (sE) dengan rumus:
6. Nilai baku
atau nilai standar (Z)
Nilai baku atau
nilai standar dengan rumus:
Nilai standar dengan sifatnya: rata-ratanya () sama dengan nol, dan varians Z = 1
7. Koefisien keragaman (KK) atau
koefisien variasi (CV)
Koefisien
Keragaman (KK) dengan rumus:
1.7 Conntoh
dasar-dasar statistika
Data
Pengamatan Hasil analisis Varian dan
Kovarians
No.
|
X
|
Y
|
Z
|
|
Variabel
|
X
|
Y
|
Z
|
1
|
511,3
|
57,3
|
64,3
|
|
X
|
18609,17
|
|
|
2
|
60,4
|
65,4
|
761,4
|
|
Y
|
-132,144
|
45,107
|
|
3
|
50,5
|
57,5
|
50,5
|
|
Z
|
-2695,800
|
405,374
|
44622.860
|
4
|
58,7
|
65,7
|
58,7
|
|
SD
|
143,795
|
7,0794
|
222,668
|
5
|
58,4
|
51,4
|
44,4
|
|
Var
Pop
|
20676,850
|
50,118
|
49580,960
|
6
|
53,9
|
46,9
|
39,9
|
|
Var
Samp
|
18609,170
|
45.1065
|
44622,860
|
7
|
55,8
|
65,8
|
75,8
|
|
Sigma
|
15925,010
|
457,559
|
44845,530
|
8
|
50,8
|
60,8
|
70,8
|
|
Contoh analisis: Varians diketik tebal pada
diagonal dan kovarians pada off diagonal diketik Italik dari
data di sebelah, dengan nilai total (sigma) dan nilai rata-ratanya.
|
|||
9
|
57,3
|
68,3
|
79,3
|
|
||||
10
|
65,4
|
65,4
|
44,0
|
|
Sigma ingat belum lengkap
Rata2
No comments:
Post a Comment