Data (bentuk jamak.- bentuk tunggalnya datum) adalah katagori dan bilangan atau angka yang dihasilkan dari pengamatan yang bersifat agregatif. Pengamatan dikatakan agregatif jika pengamatan atau pengukuran tersebut dilakukan minimal terhadap satu individu tapi beberapa kali pengukuran atau satu kali pengukuran dari beberapa individu. Oleh karena itu istilah yang dipakai dalam statistika adalah data (jarang sekali menggunakan istilah datum) karna pengamatan yang bersifat agregatif akan menghasilkan banyak datum.
Jenis-jenis data dapat diklasifikasikan berdasarkan sudut pandang tertentu. Data dapat dikalsisfikasikan berdasarkan sifatnya, bentuk angka dan skala nilai dan sumber dari mana dat itu siperoleh. Secara garis besar, macam dan jenis data statistik dapat diklasifikasikan sebagai berikut:
Berdasarkan bentuk angkanya, data dapat dibedakan ke dalam data tunggal dan data dikelompokan.
Data tunggal adalah data yang setiap datum terdiri atas satu unit bilangan. Sedangkan data dikelompokkan adalah data yang setiap datumnya terdiri atas beberapa bilangan. Ketika anda mengatakan ada 5 siswa yang mendapat nilai 8, dan 6 siswa mendapat nilai 7, nilai 8 dan 7 adalah data tunggal. Jika anda mengatakan ada 10 siswa yang mendapat nilai 4-6, dan ada lima siswa yang mendapat nilai 6,5-9. Data nilai 4-6 dan 6,5 – 9, itu adalah data yang dikelompokkan.
Berdasarkan skala yang dipergunakan, data dapat diklasifikasikan ke dalam data nominal, data ordinal, data interval, dan data rasio
Data nominal adalah angka yang hanya berfungsi sebagai symbol penggolongan dari beberapa jenis objek. Misalnya jenis kelamin, lk=1, pr=0 ; penggolongan agama disimbolkan dengan 1=Islam, 2=Kristen, 3=Katolik, 4=Hindu dan 5=Budha, dan lain-lain. Angka-angka tersebut tidak berfungsi sebagai bilangan, oleh karena itu tidak dapat dioperasikan dalam perhitungan. Angka 3 pada penggolongan agama tidak berarti 3x1. Kristen tidak sama dengan 3 x Islam. Seorang Budha dan seorang Islam tidak sama dengan 6. Hindu tidak dapat diartikan lebih baik satu daripada katolik.
Data nominal merupakan upaya mengubah variable kualitatif menjadi variable kuantitatif. Pada data nominal hanya dibebani satu syarat yaitu kategori-kategori yang dibuat harus eksklusif dan memeras. Ekslusif artinya satu objek tidak boleh dapat masuk ke lebih dari satu kategori. Misalnya anda membuat kategori Laki-laki=1, perempuan=0 dan anak-anak = 2. (penggolongan ini keliru; mengapa?). Memeras artinya kategori-kategori harus cukup untuk menampung semua objek yang diobservasi.
Data Ordinal adalah skala atau bilangan-bilangan yang menunjukkan adanya peringkat. Misalnya empat anak (Abdul, Burhan, Cahyadi dan Dudi) memiliki nilai ulangan 5, 6, 8, 9. Disini anak yang mendapat nilai 8 jelas berada pada peringkat di atas anak yang bernilai 6, dan seterusnya. Dalam data ordinal, disamping memenuhi syarat eksklusif dan memeras juga harus menunjukkan urutan besarnya variable. Namun perlu diperhatikan bahwa jarak antar urutan tidak mesti sama. Jika anak tersebut diatas diurutkan berdasarkan nilai tersebut maka Dudi=1, Cahyadi=2, Burhan=3 dan Abdul=4. Namun jarak nilai antara peringkat 1 dan 2 tidak sama dengan jarak nilai antara peringat 2 dan 3.
Data Interval adalah data yang memuat skala interval. Skala interval adalah skala yang disamping memiliki semua sifat data ordinal juga memilki jarak tertentu yang sama antara satu nilai dengan nilai lainnya. Namun tidak menunjukkan perbandingan yang tetap. Sebagai contoh. Pada sebuah kuis yang diikuti oleh tiga peserta, pengarah memberikan skor awal sebagai modal masing-masing 50. Setiap jawaban yang benar akan menambah skor sebanyak 10. Jika ketiga peserta memliliki skor 60, 70 dan 80, maka jarak dari 60 ke 70 sama dengan dari 70 ke 80 (yakni berbeda satu jawaban benar) namun jika peserta A memiliki skor 60 dan peserta B memiliki skor 120 apakah jawaban benar B dua kali banyaknya jawaban benar peserta A? mengapa ?
Data rasio adalah data yang menggunakan skala rasio. Skala rasio adalah skala yang disamping memenuhi semua sifat skala interval, juga memiliki sifat tambahan yaitu memiliki nol secara mutlak. Perbedaan antara panjang 3 meter dan 6 meter sama denga perbedaan antara 6 meter dan 9 meter. Disamping itu juga panjang 6 metr sama dengan dua kali panjang 3 meter. Bandingkan dengan skala interval.
Berdasarkan waktunya, data diklasifikasikan ke dalam data seketika (cross section data) dan data Urutan waktu (time series data /longitudinal/ bujur). Cross section data adalah data yang menunjukkan keadaan suatu waktu dari suatu hal. Misalnya jumlah siswa tahun pelajaran 2008/2009. Sedangkan time series data adalah data yang menunjukkan perkembangan gejala suatu hal. Misalnya perkembangan berat badan balita setiap bulan pada KMS di Posyandu.
Berdasarkan sumber dari mana data itu diperoleh, ada dua macam yaitu data primer dan data sekunder.
Data primer adalah data yang diperoleh dari sumber pertama sedangkan data sekunder adalah data yang diperoleh dari tangan kedua.