PENGERTIAN DAN FANFAAT DATA

Pengertian Dan Fanfaat Data 
Ada poly pengertian tentang data, secara sederhana data dapat diartikan sebagai berita mengenai sesuatu (www.ketut.web.id). Menurut Vercellis,(2009:6) pada risyana.wordpress.com, data mendeskripsikan sebuah representasi warta yang tersusun secara terstruktur, dengan istilah lain bahwa “Generally, data represent a structured codification of single primary entities, as well as of transactions involving two or more primary entities .” Sedangkan berdasarkan Wawan dan Munir (2006:1) dalam risyana.wordpress.com bahwa “Data merupakan nilai yg merepresantasikan deskripsi dari suatu objek atau kejadian.”

Dalam Kamus Besar Bahasa Indonesia, data adalah kabar yg benar serta nyata. Data juga dapat diartikan sebagai sesuatu yg dipakai atau diharapkan pada penelitian dengan memakai parameter tertentu yg telah ditentukan (Priyatno:2008). Dengan demikian dapat disimpulkan bahwa data adalah suatu objek, peristiwa, atau berita yg terdokumentasikan menggunakan mempunyai kodifikasi terstruktur buat suatu atau beberapa entitas. 

A. JENIS-JENIS DATA
Dalam sebuah penelitian, terdapat dua macam jenis data (Priyatno:2008), yaitu :

1. Data Kualitatif
Data kualitatif merupakan data yang dinyatakan dalam bentuk bukan angka, namun berbentuk kata, kalimat, gambar, atau bagan.

2. Data Kuantitatif
Data kuantitatif adalah data yang dinyatakan pada bentuk angka. Tipe-tipe data kuantitatif adalah sebagai berikut :

a. Data Nominal
Data nominal adalah ukuran yg paling sederhana, dimana angka yg diberikan pada objek memiliki arti sebagai label saja, dan nir menerangkan strata apapun (Moh. Nazir.2003). 

Ciri-ciri data nominal merupakan hanya mempunyai atribut, atau nama. Data nominal adalah data kontinum serta tidak mempunyai urutan. Bila objek dikelompokkan ke dalam set-set, dan pada seluruh anggota set diberikan angka, set-set tadi nir boleh tumpang tindih dan bersisa. Misalnya tentang jenis olah raga yakni tenis, basket dan renang. Kemudian masing-masing anggota set di atas kita berikan nomor , contohnya tenis (1), basket (2) serta renang (3). Jelas kelihatan bahwa nomor yg diberikan tidak memperlihatkan bahwa tingkat olah raga basket lebih tinggi dari tenis ataupun tingkat renang lebih tinggi menurut tenis. Angka tadi tidak memberikan arti apa-apa jika dibubuhi. Angka yg diberikan hanya berfungsi sebagai label saja. 

b. Data Ordinal
Bagian lain dati data kontimun merupakan data ordinal. Data ini selain mempunyai nama (atribut) juga mempunyai peringkat atau urutan. Angka yg diberikan mengandung strata. Ini digunakan untuk mengurutkan objek berdasarkan yg paling rendah sampai paling tinggi atau sebaliknya. Ukuran ini tidak menaruh nilai mutlak terhadap objek, tetapi hanya memberikan peringkat saja. Jika kita mempunyai sebuah set objek yg dinomori, dari 1 sampai n, contohnya peringkat 1, 2, tiga, 4, lima serta seterusnya, jika dinyatakan pada skala, maka jarak antara data yang satu menggunakan lainnya tidak sama. Ia akan memiliki urutan mulai dari yang paling tinggi sampai paling rendah. Atau paling baik hingga ke yg paling jelek. Misalnya dalam skala Likert (Moh Nazir.2003), mulai berdasarkan sangat sepakat, putusan bulat, ragu-ragu, nir sepakat sampai sangat nir putusan bulat. Atau jawaban pertanyaan tentang kesamaan rakyat buat menghadiri rapat generik pemilihan ketua wilayah, mulai dari tidak pernah absen menghadiri, menggunakan kode lima, kadang-kadang saja menghadiri, menggunakan kode 4, kurang menghadiri, menggunakan kode 3, tidak pernah menghadiri, menggunakan kode 2 hingga tidak ingin menghadiri sama sekali, dengan kode 1. Dari hasil pengukuran dengan menggunakan skala ordinal ini akan diperoleh data ordinal.

c. Data Interval
Pemberian nomor pada set berdasarkan objek yg mempunyai sifat-sifat berukuran ordinal serta ditambah satu sifat lain, yakni jeda yang sama pada pengukuran dinamakan data interval. Data ini menampakan jeda yang sama menurut karakteristik atau sifat objek yang diukur. Akan tetapi ukuran interval tidak menaruh jumlah mutlak berdasarkan objek yg diatur. Data yang diperoleh menurut output pengukuran memakai skala interval dinamakan data interval. Misalnya mengenai nilai ujian 6 orang mahasiswa, yakni A, B, C, D, E serta F diukur menggunakan ukuran interval pada skala prestasi dengan berukuran 1, dua, 3, 4, lima, dan 6, maka dapat dikatakan bahwa beda prestasi antara C dan A adalah tiga – 1 = dua. Beda prestasi antara C dan F adalah 6 – tiga = 3. Akan tetapi tidak sanggup dikatakan bahwa prestasi E merupakan lima kali prestasi A ataupun prestasi F adalah tiga kali lebih baik berdasarkan prestasi B. Dari hasil pengukuran dengan menggunakan skala interval ini akan diperoleh data interval.

d. Data Rasio
Data rasio merupakan data yg mempunyai rentang nilai 0 dan plus serta minus berdasarkan seluruh angka (Muhajir, 2007). Ukuran ratio bisa dibuat perkalian ataupun pembagian. Angka pada skala ratio bisa menerangkan nilai sebenarnya menurut objek yang diukur. Jika ada 4 orang pengemudi, A, B, C dan D mempunyai pendapatan masing-masing perhari Rp. 10.000, Rp.30.000, Rp. 40.000 dan Rp. 50.000. Bila dilihat dengan berukuran ratio maka pendapatan pengemudi C merupakan 4 kali pendapatan pengemudi A. Pendapatan D adalah lima kali pendapatan A. Pendapatan C adalah 4/3 kali pendapatan B. Dengan kata lain, ratio antara C serta A adalah 4 : 1, ratio antara D dan A merupakan lima : 1, sedangkan rasio antara C serta B adalah 4 : 3. Interval pendapatan pengemudi A dan C adalah 30.000. Dan pendapatan pengemudi C adalah 4 kali pendapatan pengemudi A. Contoh lainnya adalah berat badan bayi yg diukur dengan skala ratio. Bayi A mempunyai berat tiga Kg. Bayi B mempunyai berat 2 Kg serta bayi C memiliki berat 1 Kg. Jika diukur menggunakan skala Ratio, maka bayi A mempunyai ratio berat badan tiga kali menurut berat badan bayi C. Bayi B memiliki ratio berat badan dua kali dari berat badan bayi C, dan bayi C memiliki ratio berat badan sepertiga kali berat badan bayi A, dst. Dari output pengukuran menggunakan menggunakan skala rasio ini akan diperoleh data ratio. 

B. JENIS-JENIS METODE DAN INSTRUMEN PENGUMPULAN DATA
Dalam proses pengumpulan data tentu dibutuhkan sebuah indera atau instrument pengumpul data. Arti konsep instrument dalam penelitian adalah indera ukur, yaitu dengan instrument penelitian ini bisa dikumpulkan data menjadi alat buat menyatakan besaran atau persentase dan lebih kurangnya pada bentuk kualitatif dan kuantitatif. Sehingga menggunakan memakai instrument yg digunakan tersebut berguna sebagai alat, baik buat mengumpulkan data juga bagi pengukurannya. Sebelum tetapkan pemilihan dan penyusunan instrument perlu diperhatikan mengenai validitas dan reliabilitas instrument yang digunakan. Sebab dikhawatirkan terjadinya penggunaan instrument yg tidak valid serta tidak reliable, buat itu perlu diketahui validitas serta reliabilitas suatu instrument terlebih dahulu. Alat pengumpul data dapat dilakukan dengan memakai metode test serta metode non test.

Langkah-langkah yg perlu dilakukan dalam proses pengumpulan data merupakan menjadi berikut :
a. Peneliti harus mengetahui dimana, bagaimana data itu diperoleh. Hal ini sudah terpikirkan sewaktu peneliti melihat variable-variabel yang terdapat dalam perkara serta hipotesa penelitian.
b. Menyusun instrument sebagai alat buat mengumpulkan data tadi, serta sudah memutuskan data mana yg betul-benar diharapkan dan data mana yg perlu diabaikan. Semuanya telah disusun oleh peneliti dalam instrument yang digunakan.
c. Sudah memikirkan siapa-siapa yang jadi responden peneliti dan bagaimana cara menghubunginya dan siapa-siapa yang bisa membantu peneliti dalam mengembangkan kuosioner atau instrument tadi.
d. Orang yg membantu mengumpulkan data ini apakah telah dipersiapkan dengan pengetahuan untuk itu atau menggunakan kata lain apakan peneliti telah melatih atau memberi petunjuk dalam melakukan tugasnya. Apabila instrument peneliti adalah wawancara maka apakah pembantu peneliti ini sudah dibekali dengan cara-cara yang baik buat berwawancara menggunakan responden.
e. Apakah birokrasi yg perlu ditembus telah kita persiapkan dengan adanya surat-surat izin untuk meneliti seseorang atau instansi tertentu.
f. Apabila semuanya sudah dilakukan peneliti bertanya berapa jumlah data yang dibutuhkan. Apakah tidak mungkin terjadinya kekurangan jumlah yg peneliti inginkan karena terdapat instrument waktu pengisian tidak lengkap, nir paripurna serta yang hilang, dan sebagainya. Untuk dapatnya data sesuai menggunakan yang diinginkan maka diharapkan supaya peneliti memperkirakan kerusakan contohnya 10%. Untuk itu sebelum dijalankan sengaja kita tambahkan jumlahnya dengan 10% yang diperkirakan akan berkurang.
g. Setelah semua teknisnya dipenuhi, maka yang tidak kalah pentingnya merupakan biaya transportasi untuk mengumpulkan data tadi. Karena kadang kala seorang wajib berkali-kali menemui seseorang utnuk wawancara atau untuk mengisi instrument yang dipakai. Oleh karenanya dalam suatu proposal, peneliti umumnya sudah dapat memperkirakan berapa porto yang dibutuhkan buat biaya transportasi tadi di samping porto lainnya.

Untuk beberapa metode, kata bagi instrumentnya memang sama menggunakan metodenya, yaitu :
1) Instrumen untuk metode tes adalah tes atau soal tes.
2) Instrumen buat metode angket atau kuosioner adalah angket atau kuosioner.
3) Instrumen untuk metode observasi adalah check-list.
4) Instrumen buat metode dokumentasi merupakan panduan dokumentasi atau bisa juga check list.

Untuk lebih jelasnya, maka akan dibahas metode dan instrument pengumpulan data satu per satu.

a. Pengumpulan data dengan Metode Tes
Tes merupakan serentetan pertanyaan atau latihan serta indera lain yang digunakan buat mengukur ketrampilan, pengetahuan intelegensi, kemampuan atau bakat yang di miliki sang individu atau grup. Dalam mengungkapkan tes ini akan disampaikan sekaligus alat ukur lain yang sifatnya terstandar. Ditinjau berdasarkan target atau objek yanga kan dinilai, maka dibedakan adanya beberapa macam tes dan alat ukur lain. 

1. Tes kepribadian atau personality tes
Yaitu tes yg dipakai buat mengungkap kepribadian seorang. Yang diukur bisa self konsep, kreativitas, disiplin, kemampuan spesifik, dsb.

2. Tes bakat atau aptitude tes
Yaitu tes yg digunakan buat mengukur atau mengetahui bakat seorang. 

3. Tes intelegensi 
Yaitu tes yg dipakai buat mengadakan estimasi atau asumsi terhadap tingkat intelektual seseorang dengan cara menaruh tugas kepada orang yang akan diukur intelegensinya. 

4. Tes perilaku atau attitude tes
Yaitu indera yg dipakai buat mengadakan pengukuran terhadap banyak sekali sikap seorang. 

5. Tes minat
Yaitu alat untuk menggali minat seseorang terhadap sesuatu. 

6. Tes prestasi atau achievement tes
Yaitu tes yg dipakai buat mengukur pencapaian seseorang sehabis mengusut sesuatu. Berbeda menggunakan yg lain-lain sebelum ini, tes prestasi diberikan sehabis orang yang dimaksud mengusut hal-hal sesuai dengan apa yg akan pada teskan. 

Dalam memakai metode tes, peneliti menggunakan instrument berupa tes, atau soal-soal tes. Soal tes terdiri dari poly buah tes (item) yang masing-masing mengukur satu jenis variabel.

b. Pengumpulan data menggunakan metode non tes
Untuk melengkapi data hasil tes akan lebih akurat hasilnya apabila dipadukan dengan data-data yg dihasilkan dengan menggunakan tehnik yg tidak sinkron, berikut tersaji indera pengumpul data dalam bentuk non tes.

1. Angket atau kuesioner
Kuesioner atau angket adalah teknik pengumpulan data melalui formulir-formulir yang berisi pertanyaan-pertanyaan yang diajukan secara tertulis dalam seorang atau sekumpulan orang buat menerima jawaban atau tanggapan dan informasi yg dibutuhkan sang peneliti. Kuesioner lebih baik digunakan buat mengumpulkan data atau warta daripada teknik wawancara, karena dalam wawancara peneliti harus mengadakan hubungan pribadi. Pertemuan langsung antara responden dengan peneliti ini memerlukan saat yg poly, apalagi apabila wajib menghubungi ratusan orang. Wawancara harus dilakukan sang orang yang mahir dalam hubungan personal serta nir mampu dilakukan sang seluruh orang. Sedangkan menggunakan berita umum dapat dilakukan sang banyak orang buat mengantar serta menjemput informasi lapangan tersebut setelah diisi oleh responden dan bisa pula dilakukan sang peneliti secara masal dalam suatu kelas tehadap siswa-anak didik atau mahasiswa pada waktu yang singkat. Kuesioner mampu disusun dibelakang meja menggunakan tenang serta bisa direvisi setiap saat jika terjadi kesalahan. Kuesioner bisa pula dilakukan pngirimanya melalui kantor pos serta pengembaliannya bisa melalui tempat kerja pos tadi.

Bentuk berita umum bisa pula berstruktur dab nir berstruktur seperti pada persiapan wawancara, isinya sangat tergantung berdasarkan kebutuhan peneliti. Dalam menyusun survey supaya lebih tepat sasarannya dan lebih gampang dalam menganalisisnya perlu diperhatikan hal-hal sebagai berikut (Mardalis:1989) :
1. Kuesioner disusun sejelas mungkin, buat menghindari galat tafsir dari responden yg bervariasi.
2. Diusahakan pertanyaannya sesingkat mungkin dan jangan berbeli-belit.
3. Setelah terselesaikan disusun, sebelm diedarkan untuk kegiatan yang sebenarnya. Sebaiknya dilakukan uji coba dulu terhadap sebagaian responden lalu dianalisa serta bila ditemui kelemahan dan keuranan perlu dilakukan revisi.
4. Kalimat pada pertanyaan disusun yang bisa dimengerti serta diapahami sang setiap responden ( peneliti harus tau terlebih dahulu, bagaimana perkiraan jawaban responden).
5. Alternative jawaban yg dikendaji dibuat selengkap mungkin. Misalnya, jika dikatakan alat tulis, apakah pensil, boolpoin, dll).
6. Hindari pertanyaan yg merendah atau menyinggung perasaan responden.
7. Setelah survey dibuat peneliti mestinya sudah mengetahui bagaimana cara menghitung atau analisanya nanti. 

Dalam penyusunan instrument umumnya atau survey bertitik tolak berdasarkan variable yang dikemukakan pada hipotesa atau kasus penelitian, dari sana lalu baru dijabarkan kedalam item-item serta dimensi-dimensi pertanyaan. Jangan sampai mengajukan dan menciptakan pertanyaan yang tidak ada kaitanya dengan kasus yang sedang ditelitikarena akan merugikan dan tidak terdapat gunanya.

Kuesioner bisa dibedakan menjadi beberapa jenis, tergantung dalam sudut pandangan :

a. Dipandang menurut cara menjawab, maka terdapat :
1. Kuesioner terbuka, yang member kesempatan kepad responden untuk menjawab menggunakan kalimatnya sendiri.
2. Kuesioner tertutup, yg sudah disediakan jawabannya sebagai akibatnya responden tinggal memilih.

b. Dipandang dari jawaban yg diberikan, yaitu:
1. Kuesioner pribadi, yaitu responden menjawab tentang dirinya.
2. Kuesioner nir eksklusif, yaitu apabila responden menjawab mengenai orang lain.

c. Dipandang berdasarkan bentuknya, yaitu :
1. Kuesioner pilihan ganda, yang dimaksud merupakan sama menggunakan kuesioner tertutup.
2. Kuesioner isian, yg dimaksud merupakan kuesioner terbuka.
3. Check List, sebuah daftar dimana responden tinggal membubuhkan pertanda cek pada kolom yang sesuai.
4. Rating-Scale (Skala Bertingkat), yaitu sebuah pernyataan yg diikuti sang kolom-kolom yang memberitahuakn tingkatan-tingkatan. Misalnya mulai menurut sangat putusan bulat sampai sangat tidak setuju

Keuntungan Kuesioner :
1. Tidak memerlukan hadirnya peneliti.
2. Dapat dibagikan secara serentak kepada banyak responden.
3. Dapat dijawab oleh responden berdasarkan kecepatannya masing-masing, serta dari ketika senggang responden.
4. Dapat dibentuk anonym, sehingga responden bebas amanah dan nir malu-memalukan menjawab.
5. Dapat dibentuk terstandar sehingga bagi semua responden dapat diberi pertanyaan yang sahih-sahih sama.

Kelemahan Kuesioner :
1. Responden tak jarang tidak teliti dalam menjawab sebagai akibatnya ada pertanyaan yg terlewati nir dijawab, pdahal sukar diulangi diberikan kembali kepadanya.
2. Sering kali sukar dicari validitasnya.
3. Walaupun dibentuk anonym, kadang-kadang responden dengan sengaja memberikan jawaban yg nir betul atau tidak jujur.
4. Sering kali tidak kembali, terutama apabila dikirim lewat pos.
5. Waktu pengembaliannya tidak bersama-sama, bahkan kadang-kadang ada yang terlalu usang sebagai akibatnya terlambat.

Contoh Angket :
a. Bentuk Skala Liert
Bentuk ini dipakai apabila peneliti menginginkan data tentang pendapat responden mengenai masalah yg diteliti. Bentuk ini dapat dilakukan buat penilaian kuantitatif terhadap holistik atau setiap responden. Cara ini menggunakan memutuskan bobot jawaban terhadap tiap-tiap item atau sub item yg ditetapkan, pertanyaannya berbentuk positif atau negative. 

2. Interview (Wawancara)
Wawancara merupakan teknik pengumpulan data yg dipakai peneliti buat menerima warta-warta mulut melalui bercakap-cakap serta berhadap-hadapan mika dengan orang yang dapat menaruh berita dalam sipeneliti. Wawancara ini bisa dipakai untuk melengkapi data yg diperoleh melalui observasi. Apabila peneliti akan menggunakan teknik wawancara dalam penelitiannya perlu diketahui terlebih dulu: target, maksud, dan masalah apa yang diperlukan sipeneliti sebab dalam suatu wawancara bisa diperoleh berita yg berlainana dan terdapat kalanya tidak sesuai menggunakan maksud si peneliti. 

Secara fisik, interview bisa dibedakan atas interview terstruktur serta nir terstruktur. Seperti halnya kuesioner, interview terstruktur terdiri berdasarkan serenteten pertanyaan dimana pewawancara tinggal memberikan tanda cek (√) dalam pilihan jawaban yang sudah disiapkan. Interview terstandar kadang-kadang disembunyikan oleh pewawancara, akan tetapi tidak jua diperlihatkan kepada responden, bahkan respondenlah yg dipersilahkan menaruh pertanda.

Ditinjau dari pelaksanaannya, maka dibedakan atas :
a. Interview Bebas, inguided interview, dimana pewawancara bebas menanyakan apa saja namun pula mengingat akan data apa yang akan dikumpulkan. Dalam pelaksanaannya pewawancara tidak membawa pedoman apa yang akan ditanyakan. Kebaikan metode ini merupakan bahwa responden tidak menyadari sepenuhnya bahwa beliau sedang diinterview. Kelemahannya adalah arah pertanyaan kadang-kadang kurang terkendali.
b. Interview Terpimpin (Guided Interview), yaitu interview yg dilakukan sang pewawancara menggunakan membawa sederetan pertanyaan lengkap dan jelas seperti yang dimaksud pada interview terstruktur.
c. Interview Bebas Terpimpin, kombinasi antara interview bebas serta terpimpin. Dalam melaksanakan interview, pewawancara membawa pedoman yang hanya merupakan garis akbar tentang hal-hal yang akan ditanyakan. 

Menginterview bukanlah pekerjaan yg gampang. Dalam hal ini pewawancara harus bisa membangun suasana kalem namun serius. Artinya bahwa interview dilakukan dengan benar-benar-benar-benar, tidak main-main, namun tidak kaku. Suasana ini krusial dijaga supaya responden mau menjawab apa saja yg dikehendaki sang pewawancara secara amanah.oleh karena sulitnya pekerjaan ini, maka perlu adanya pelatihan bagi pewawancara. Sebagai instrument interview adalah interview guide atau panduan wawancara.

Waktu mempersiapkan wawancara menggunakan responden perlu diperhatikan hal-hal berikut (Mardalis:1989):
a. Responden yg akan diwawancarai sebaiknya diseleksi supaya sesuai dengan data yg dibutuhkan.
b. Waktu berwawancara sedapatnya dilakukan sinkron dengan kesediaan responden.
c. Permulaan wawancara usahakan peneliti memperkenalkan diri serta menjelaskan maksud dan tujuan wawancara yg dilakukan.
d. Ketika bewawancara, peneliti sebaiknya berlaku misalnya orang ingin memahami dan belajar menurut responden serta jangan seperti orang menggurui terhadap responden. Hal ini krusial buat kelancaran wawancara.
e. Jangan sampai ada pertanyaan-pertanyaan yg nir diinginkan oleh responden.
f. Peneliti usahakan menunjukkan perhatian penuh terhadap pembicaraan responden. Jika terjadi pengalihan pembicaraan oleh responden peneliti dengan hati-hati meluruskannya ke sasaran pokok.
g. Melakukan penutupan pembicaraan dengan ucapan terima kasih.

3. Observasi
Observasi acapkali kali diartikan menjadi suatu arti yang sempit, yakni memperhatiakn sesuatu memakai mata. Di dalam pengertian psikologig, observasi atau yg diklaim menggunakan pengamatan, meliputi aktivitas penguatan perhatian terhadap sesuatu objek dengan memakai seluruh alat indera. Jadi, mengobservasi bisa dilakukan melalui penglihatan, penciuman, telinga, raba, serta pengecap. Apa yg dikatakan ini sebenarnya adalah pengamatan pribadi. Di pada artian penelitian observasi dapat dilakukan dengan tes, informasi lapangan, rekaman gambar, rekaman suara. 

Jika diperhatikan lebih lanjut, observasi atau pengamatan ini dapat dibedakan sebagai dua observasi, yaitu :

a. Observasi Partisipasi
Dalam melakukan observasi partisipasi pengamat ikut terlibat pada kegiatan yang sedang diamatinya atau bisa dikatakan si pengamat ikut dan menjadi pemain. Pengamat mengamati sembari iktu berperan pada aktivitas tersebut. Yang perlu diperhatikan dalam observasi partisipasi ini adalah supaya si pengamat nir lupa tugas pokoknya, yaitu mengamati dan mencari data.

b. Observasi Simulasi
Diharapkan pengamat dapat mensimulasikan keinginannya dalam responden yang dituju sehingga responden dapat memenuhi keinginan pengamat yg membutuhkan liputan atau data berdasarkan responden. 

Observasi dapat dilakukan dengan 2 cara yang kemudian digunakan buat menyebut jenis observasi yaitu:
a. Observasi non sistematis, yg dilakukan sang pengamat menggunakan tidak menggunakan instrument pengamatan. 
b. Observasi sistematis, yang dilakukan sang pengamat menggunakan menggunakan pedoman menjadi instrument pengamatan. 

Pedoman observasi berisi sebuah daftar jenis kegiatan yang mungkin timbul dan akan diamati. Dalam proses observasi, pengamat hanya memberikan indikasi dalam kolom tempat peristiwa timbul itulah sebabnya maka cara bekerja seperti ini dianggap dengan sistem pertanda ( sign system).

Sign system dipakai sebagai instrumen pengamatan situasi pengajaran sebagai sebuah potret sinkron pengajaran sebagai sebuah potret selintas (snap shot). Instrument tadi berisi sederetan sub_variable contohnya: pengajar memperlihatkan, guru menulis dipapan tulis, pengajar bertanya dalam grup, guru menjawab, murid bertanya, dll. Setelah pengamatan dalam satu periode tertentu contohnya lima mnt, seluruh insiden yg timbul di cek. Kejadian yang muncul lebih dari satu kali dalam satu periode pengamatan, hanya di cek satu kali. Dengan demikian akan diperoleh gambar tentang apa peristiwa yg timbul dalam situasi pengajaran. 

Dalam hal ini pengamat nir dapat memperhatikan variable yang terlalu banyak. Dengan demikian pada akhir pengamatan bisa disimpulkan di kelas mana partisipasi murid terjadi paling akbar.

4. Skala bertingkat (Rating) atau Rating Scale 
Rating atau skala bertingkat adalah suatu ukuran subjektif yg dibuat berskala. Walaupun bertingkat ini mengahasilkan data yang kasar, tetapi cukup menaruh fakta. Instrumen ini dapat menggunakan mudah memberikan citra penampilan, terutama penampilan di pada orang menjalankan tugas, yang menerangkan frekuensi keluarnya sifat-sifat.

Rating-scale harus diinterpretasikan secara hati-hati karena disamping membuat gambaran yg kasar juga jawaban responden nir begitu saja gampang dipercaya. Sehubungan menggunakan ini Bregman serta Siegel pada Arikunto:2006 mendaftar hal-hal yang mempengaruhi ketidakjujuran jawaban responden yaitu: 
a). Persahabatan, 
b). Kecepatan mengira, 
c). Cepat menetapkan, 
d). Jawaban kesan pertama, 
e). Penampilan instrument, 
f). Prasangka.

Di dalam menyusun skala, yang perlu diperhatikan adalah bagaimana memilih variable skala. Apa yang ditanyakan harus apa yang dapat diamati responden. Misalnya seorang guru ditanya mengenai jam kehadiran dan kepulangan kepala sekolah. Dia nir akan menjawab jika beliau sendiri selalu datang siang serta pulang awal.

5. Dokumentasi
Dokumentasi, dari dari ucapnya dokumen, yang adalah barang-barang tertulis. Di pada melaksanakan metode dokumentasi, peneliti memeriksa benda-benda tertulis seperti buku-kitab , majalah, dokumen, peraturan-peraturan, notulen rapat, catatan harian, dsb.

Dengan memakai serentetan kotak-kotak seperti ini dalam waktu mengumpulkan data melalui catatan-catatan yg memperlihatkan keadaan karyawan atau pegawai yang sebagai subjek penelitian memberikan tanda centang dalam kotak yang sesuai. Untuk merekam data berdasarkan beberapa orang karyawan, peneliti dapat menderetkan nama-nama subjek dibawah kotak-kotak tadi yg pada setiap aspek dijadikan sebagai judul table.

a. Check list, yaitu daftar variabel yg akan dikimpulkan datanya. Dalam hal ini peneliti tinggal memberikan pertanda atau tally setiap pemunculan data yang dimaksud.

Dalam pengertian yang lebih luas, dokumen bukan hanya yg berwujud goresan pena saja, tetapi bisa berupa benda-benda peninggalan misalnya prasasti serta symbol-simbol. Metode dokumentasi ini dapat adalah metode primer apabila peneliti melakukan pendekatan analisis isi . Buat penelitian dengan pendekatan lain pun metode dokumentasi jua memiliki kedudukan penting. Apabila peneliti memang cermat serta mencari bukti-bukti berdasarkan landasan aturan dan peraturan atau ketentuan, maka penggunaan metode dokumentasi menjadi nir terhindarkan. 

PENGERTIAN DAN FANFAAT DATA

Pengertian Dan Fanfaat Data 
Ada poly pengertian tentang data, secara sederhana data dapat diartikan sebagai berita mengenai sesuatu (www.ketut.web.id). Menurut Vercellis,(2009:6) pada risyana.wordpress.com, data menggambarkan sebuah representasi kabar yang tersusun secara terstruktur, menggunakan kata lain bahwa “Generally, data represent a structured codification of single primary entities, as well as of transactions involving two or more primary entities .” Sedangkan dari Wawan dan Munir (2006:1) dalam risyana.wordpress.com bahwa “Data merupakan nilai yang merepresantasikan deskripsi menurut suatu objek atau insiden.”

Dalam Kamus Besar Bahasa Indonesia, data merupakan fakta yang benar dan nyata. Data pula bisa diartikan menjadi sesuatu yang digunakan atau diperlukan dalam penelitian menggunakan menggunakan parameter tertentu yang telah dipengaruhi (Priyatno:2008). Dengan demikian bisa disimpulkan bahwa data merupakan suatu objek, insiden, atau liputan yg terdokumentasikan dengan mempunyai kodifikasi terstruktur buat suatu atau beberapa entitas. 

A. JENIS-JENIS DATA
Dalam sebuah penelitian, terdapat 2 macam jenis data (Priyatno:2008), yaitu :

1. Data Kualitatif
Data kualitatif adalah data yg dinyatakan pada bentuk bukan angka, tetapi berbentuk istilah, kalimat, gambar, atau bagan.

2. Data Kuantitatif
Data kuantitatif merupakan data yg dinyatakan pada bentuk angka. Tipe-tipe data kuantitatif merupakan menjadi berikut :

a. Data Nominal
Data nominal merupakan ukuran yg paling sederhana, dimana angka yang diberikan pada objek memiliki arti sebagai label saja, dan tidak memberitahuakn tingkatan apapun (Moh. Nazir.2003). 

Ciri-ciri data nominal adalah hanya memiliki atribut, atau nama. Data nominal merupakan data kontinum serta nir mempunyai urutan. Bila objek dikelompokkan ke pada set-set, serta kepada semua anggota set diberikan angka, set-set tadi tidak boleh tumpang tindih dan bersisa. Misalnya tentang jenis olah raga yakni tenis, basket serta renang. Kemudian masing-masing anggota set pada atas kita berikan angka, misalnya tenis (1), basket (dua) serta renang (tiga). Jelas kelihatan bahwa nomor yg diberikan tidak memberitahuakn bahwa tingkat olah raga basket lebih tinggi berdasarkan tenis ataupun tingkat renang lebih tinggi berdasarkan tenis. Angka tersebut nir memberikan arti apa-apa bila dibubuhi. Angka yg diberikan hanya berfungsi sebagai label saja. 

b. Data Ordinal
Bagian lain dati data kontimun adalah data ordinal. Data ini selain memiliki nama (atribut) jua mempunyai peringkat atau urutan. Angka yg diberikan mengandung tingkatan. Ini dipakai buat mengurutkan objek menurut yg paling rendah sampai paling tinggi atau kebalikannya. Ukuran ini tidak memberikan nilai absolut terhadap objek, tetapi hanya menaruh peringkat saja. Jika kita mempunyai sebuah set objek yg dinomori, menurut 1 sampai n, contohnya peringkat 1, dua, 3, 4, lima dan seterusnya, apabila dinyatakan pada skala, maka jeda antara data yang satu dengan lainnya tidak sama. Ia akan mempunyai urutan mulai berdasarkan yg paling tinggi hingga paling rendah. Atau paling baik hingga ke yang paling jelek. Misalnya pada skala Likert (Moh Nazir.2003), mulai menurut sangat setuju, putusan bulat, ragu-ragu, tidak sepakat hingga sangat nir putusan bulat. Atau jawaban pertanyaan tentang kecenderungan warga buat menghadiri kedap generik pemilihan kepala daerah, mulai berdasarkan tidak pernah absen menghadiri, dengan kode lima, kadang-kadang saja menghadiri, menggunakan kode 4, kurang menghadiri, dengan kode 3, nir pernah menghadiri, dengan kode 2 hingga tidak ingin menghadiri sama sekali, dengan kode 1. Dari hasil pengukuran dengan memakai skala ordinal ini akan diperoleh data ordinal.

c. Data Interval
Pemberian nomor kepada set dari objek yang mempunyai sifat-sifat berukuran ordinal serta ditambah satu sifat lain, yakni jeda yg sama dalam pengukuran dinamakan data interval. Data ini memberitahuakn jeda yg sama dari karakteristik atau sifat objek yg diukur. Akan namun ukuran interval nir memberikan jumlah mutlak dari objek yg diatur. Data yang diperoleh berdasarkan output pengukuran menggunakan skala interval dinamakan data interval. Misalnya tentang nilai ujian 6 orang mahasiswa, yakni A, B, C, D, E dan F diukur menggunakan ukuran interval dalam skala prestasi menggunakan berukuran 1, 2, tiga, 4, lima, dan 6, maka bisa dikatakan bahwa beda prestasi antara C dan A adalah tiga – 1 = 2. Beda prestasi antara C serta F merupakan 6 – 3 = tiga. Akan tetapi nir sanggup dikatakan bahwa prestasi E merupakan lima kali prestasi A ataupun prestasi F merupakan 3 kali lebih baik dari prestasi B. Dari output pengukuran menggunakan menggunakan skala interval ini akan diperoleh data interval.

d. Data Rasio
Data rasio merupakan data yg memiliki rentang nilai 0 dan plus serta minus berdasarkan semua nomor (Muhajir, 2007). Ukuran ratio dapat dibentuk perkalian ataupun pembagian. Angka dalam skala ratio bisa menunjukkan nilai sebenarnya dari objek yg diukur. Apabila terdapat 4 orang pengemudi, A, B, C dan D mempunyai pendapatan masing-masing perhari Rp. 10.000, Rp.30.000, Rp. 40.000 dan Rp. 50.000. Bila dipandang dengan ukuran ratio maka pendapatan pengemudi C adalah 4 kali pendapatan pengemudi A. Pendapatan D adalah lima kali pendapatan A. Pendapatan C merupakan 4/3 kali pendapatan B. Dengan istilah lain, ratio antara C dan A adalah 4 : 1, ratio antara D dan A adalah lima : 1, sedangkan rasio antara C dan B merupakan 4 : 3. Interval pendapatan pengemudi A serta C merupakan 30.000. Dan pendapatan pengemudi C adalah 4 kali pendapatan pengemudi A. Contoh lainnya merupakan berat badan bayi yg diukur dengan skala ratio. Bayi A mempunyai berat 3 Kg. Bayi B memiliki berat 2 Kg dan bayi C memiliki berat 1 Kg. Jika diukur menggunakan skala Ratio, maka bayi A mempunyai ratio berat badan 3 kali dari berat badan bayi C. Bayi B mempunyai ratio berat badan dua kali menurut berat badan bayi C, dan bayi C mempunyai ratio berat badan 1/3 kali berat badan bayi A, dst. Dari output pengukuran menggunakan menggunakan skala rasio ini akan diperoleh data ratio. 

B. JENIS-JENIS METODE DAN INSTRUMEN PENGUMPULAN DATA
Dalam proses pengumpulan data tentu diharapkan sebuah indera atau instrument pengumpul data. Arti konsep instrument dalam penelitian adalah indera ukur, yaitu menggunakan instrument penelitian ini dapat dikumpulkan data sebagai indera buat menyatakan besaran atau persentase serta lebih kurangnya dalam bentuk kualitatif serta kuantitatif. Sehingga menggunakan memakai instrument yg dipakai tersebut berguna sebagai alat, baik buat mengumpulkan data juga bagi pengukurannya. Sebelum tetapkan pemilihan serta penyusunan instrument perlu diperhatikan mengenai validitas serta reliabilitas instrument yg digunakan. Sebab dikhawatirkan terjadinya penggunaan instrument yang tidak valid dan nir reliable, buat itu perlu diketahui validitas serta reliabilitas suatu instrument terlebih dahulu. Alat pengumpul data dapat dilakukan dengan menggunakan metode test serta metode non test.

Langkah-langkah yang perlu dilakukan pada proses pengumpulan data adalah menjadi berikut :
a. Peneliti wajib mengetahui dimana, bagaimana data itu diperoleh. Hal ini telah terpikirkan sewaktu peneliti melihat variable-variabel yg terdapat pada kasus serta hipotesa penelitian.
b. Menyusun instrument sebagai indera buat mengumpulkan data tersebut, dan telah memutuskan data mana yg benar -benar dibutuhkan serta data mana yang perlu diabaikan. Semuanya sudah disusun oleh peneliti dalam instrument yg digunakan.
c. Sudah memikirkan siapa-siapa yang jadi responden peneliti dan bagaimana cara menghubunginya serta siapa-siapa yang dapat membantu peneliti pada membuatkan kuosioner atau instrument tersebut.
d. Orang yang membantu mengumpulkan data ini apakah sudah dipersiapkan dengan pengetahuan buat itu atau dengan kata lain apakan peneliti telah melatih atau memberi petunjuk dalam melakukan tugasnya. Apabila instrument peneliti merupakan wawancara maka apakah pembantu peneliti ini sudah dibekali dengan cara-cara yg baik buat berwawancara menggunakan responden.
e. Apakah birokrasi yg perlu ditembus telah kita persiapkan menggunakan adanya surat-surat biar buat meneliti seseorang atau instansi tertentu.
f. Jika semuanya telah dilakukan peneliti bertanya berapa jumlah data yang dibutuhkan. Apakah tidak mungkin terjadinya kekurangan jumlah yang peneliti inginkan lantaran ada instrument saat pengisian tidak lengkap, tidak sempurna serta yang hilang, dan sebagainya. Untuk dapatnya data sesuai menggunakan yg diinginkan maka dibutuhkan supaya peneliti memperkirakan kerusakan misalnya 10%. Untuk itu sebelum dijalankan sengaja kita tambahkan jumlahnya dengan 10% yg diperkirakan akan berkurang.
g. Setelah seluruh teknisnya dipenuhi, maka yg tidak kalah pentingnya merupakan biaya transportasi buat mengumpulkan data tersebut. Karena kadang kala seorang harus berkali-kali menemui seorang utnuk wawancara atau buat mengisi instrument yang digunakan. Oleh karenanya dalam suatu proposal, peneliti umumnya sudah bisa memperkirakan berapa porto yang dibutuhkan buat biaya transportasi tadi pada samping porto lainnya.

Untuk beberapa metode, kata bagi instrumentnya memang sama menggunakan metodenya, yaitu :
1) Instrumen buat metode tes merupakan tes atau soal tes.
2) Instrumen buat metode angket atau kuosioner merupakan angket atau kuosioner.
3) Instrumen buat metode observasi merupakan check-list.
4) Instrumen buat metode dokumentasi adalah panduan dokumentasi atau bisa juga check list.

Untuk detail, maka akan dibahas metode serta instrument pengumpulan data satu per satu.

a. Pengumpulan data dengan Metode Tes
Tes adalah serentetan pertanyaan atau latihan dan indera lain yg digunakan buat mengukur ketrampilan, pengetahuan intelegensi, kemampuan atau bakat yang pada miliki oleh individu atau grup. Dalam menyampaikan tes ini akan disampaikan sekaligus indera ukur lain yg sifatnya terstandar. Ditinjau berdasarkan target atau objek yanga kan dievaluasi, maka dibedakan adanya beberapa macam tes dan alat ukur lain. 

1. Tes kepribadian atau personality tes
Yaitu tes yang dipakai buat mengungkap kepribadian seorang. Yang diukur bisa self konsep, kreativitas, disiplin, kemampuan khusus, dsb.

2. Tes bakat atau aptitude tes
Yaitu tes yg dipakai buat mengukur atau mengetahui bakat seseorang. 

3. Tes intelegensi 
Yaitu tes yg dipakai buat mengadakan perkiraan atau perkiraan terhadap tingkat intelektual seseorang menggunakan cara memberikan tugas pada orang yang akan diukur intelegensinya. 

4. Tes perilaku atau attitude tes
Yaitu indera yg digunakan buat mengadakan pengukuran terhadap aneka macam perilaku seorang. 

5. Tes minat
Yaitu indera buat menggali minat seorang terhadap sesuatu. 

6. Tes prestasi atau achievement tes
Yaitu tes yg dipakai buat mengukur pencapaian seorang sehabis mempelajari sesuatu. Berbeda dengan yg lain-lain sebelum ini, tes prestasi diberikan sehabis orang yg dimaksud mengusut hal-hal sinkron menggunakan apa yang akan di teskan. 

Dalam memakai metode tes, peneliti menggunakan instrument berupa tes, atau soal-soal tes. Soal tes terdiri dari banyak butir tes (item) yg masing-masing mengukur satu jenis variabel.

b. Pengumpulan data dengan metode non tes
Untuk melengkapi data hasil tes akan lebih akurat hasilnya apabila dipadukan menggunakan data-data yg dihasilkan dengan menggunakan tehnik yang berbeda, berikut disajikan alat pengumpul data dalam bentuk non tes.

1. Angket atau kuesioner
Kuesioner atau angket adalah teknik pengumpulan data melalui formulir-formulir yg berisi pertanyaan-pertanyaan yang diajukan secara tertulis dalam seseorang atau sekumpulan orang untuk menerima jawaban atau tanggapan dan informasi yg diharapkan sang peneliti. Kuesioner lebih baik dipakai buat mengumpulkan data atau berita daripada teknik wawancara, karena dalam wawancara peneliti harus mengadakan hubungan pribadi. Pertemuan pribadi antara responden menggunakan peneliti ini memerlukan waktu yg banyak, apalagi jika harus menghubungi ratusan orang. Wawancara wajib dilakukan sang orang yg mahir dalam hubungan personal dan nir bisa dilakukan oleh semua orang. Sedangkan memakai informasi lapangan bisa dilakukan oleh poly orang untuk mengantar dan menjemput informasi lapangan tersebut selesainya diisi oleh responden dan dapat pula dilakukan oleh peneliti secara masal pada suatu kelas tehadap anak didik-murid atau mahasiswa dalam saat yang singkat. Kuesioner mampu disusun dibelakang meja menggunakan hening serta dapat direvisi setiap ketika jika terjadi kesalahan. Kuesioner dapat jua dilakukan pngirimanya melalui tempat kerja pos dan pengembaliannya dapat melalui tempat kerja pos tersebut.

Bentuk informasi lapangan bisa jua berstruktur dab nir berstruktur seperti dalam persiapan wawancara, isinya sangat tergantung berdasarkan kebutuhan peneliti. Dalam menyusun berita umum agar lebih tepat sasarannya serta lebih mudah dalam menganalisisnya perlu diperhatikan hal-hal sebagai berikut (Mardalis:1989) :
1. Kuesioner disusun sejelas mungkin, buat menghindari keliru tafsir berdasarkan responden yang bervariasi.
2. Diusahakan pertanyaannya sesingkat mungkin dan jangan berbeli-belit.
3. Setelah terselesaikan disusun, sebelm diedarkan buat kegiatan yang sebenarnya. Sebaiknya dilakukan uji coba dulu terhadap sebagaian responden lalu dianalisa serta apabila ditemui kelemahan serta keuranan perlu dilakukan revisi.
4. Kalimat pada pertanyaan disusun yg dapat dimengerti serta diapahami sang setiap responden ( peneliti wajib tau terlebih dahulu, bagaimana asumsi jawaban responden).
5. Alternative jawaban yg dikendaji dibentuk selengkap mungkin. Misalnya, jika dikatakan alat tulis, apakah pensil, boolpoin, dll).
6. Hindari pertanyaan yg merendah atau menyinggung perasaan responden.
7. Setelah berita umum dibuat peneliti mestinya telah mengetahui bagaimana cara menghitung atau analisanya nanti. 

Dalam penyusunan instrument umumnya atau survey bertitik tolak menurut variable yang dikemukakan pada hipotesa atau masalah penelitian, menurut sana lalu baru dijabarkan kedalam item-item serta dimensi-dimensi pertanyaan. Jangan hingga mengajukan serta membuat pertanyaan yang nir ada kaitanya dengan kasus yg sedang ditelitikarena akan merugikan serta tidak ada gunanya.

Kuesioner dapat dibedakan sebagai beberapa jenis, tergantung pada sudut pandangan :

a. Dipandang dari cara menjawab, maka terdapat :
1. Kuesioner terbuka, yang member kesempatan kepad responden buat menjawab menggunakan kalimatnya sendiri.
2. Kuesioner tertutup, yg telah disediakan jawabannya sebagai akibatnya responden tinggal memilih.

b. Dipandang menurut jawaban yg diberikan, yaitu:
1. Kuesioner pribadi, yaitu responden menjawab mengenai dirinya.
2. Kuesioner tidak langsung, yaitu bila responden menjawab tentang orang lain.

c. Dipandang menurut bentuknya, yaitu :
1. Kuesioner pilihan ganda, yg dimaksud merupakan sama menggunakan survey tertutup.
2. Kuesioner isian, yang dimaksud adalah informasi lapangan terbuka.
3. Check List, sebuah daftar dimana responden tinggal membubuhkan tanda cek pada kolom yang sinkron.
4. Rating-Scale (Skala Bertingkat), yaitu sebuah pernyataan yang diikuti sang kolom-kolom yg memperlihatkan tingkatan-strata. Misalnya mulai berdasarkan sangat setuju sampai sangat nir setuju

Keuntungan Kuesioner :
1. Tidak memerlukan hadirnya peneliti.
2. Dapat dibagikan secara serentak kepada poly responden.
3. Dapat dijawab sang responden dari kecepatannya masing-masing, serta menurut saat senggang responden.
4. Dapat dibuat anonym, sebagai akibatnya responden bebas jujur dan tidak memalukan-memalukan menjawab.
5. Dapat dibuat terstandar sehingga bagi semua responden bisa diberi pertanyaan yg benar-benar sama.

Kelemahan Kuesioner :
1. Responden acapkali tidak teliti dalam menjawab sehingga ada pertanyaan yg terlewati tidak dijawab, pdahal sukar diulangi diberikan kembali kepadanya.
2. Sering kali sukar dicari validitasnya.
3. Walaupun dibentuk anonym, kadang-kadang responden menggunakan sengaja menaruh jawaban yg tidak betul atau nir jujur.
4. Sering kali nir balik , terutama bila dikirim lewat pos.
5. Waktu pengembaliannya tidak bersama-sama, bahkan kadang-kadang ada yg terlalu usang sehingga terlambat.

Contoh Angket :
a. Bentuk Skala Liert
Bentuk ini dipakai apabila peneliti menginginkan data mengenai pendapat responden mengenai masalah yg diteliti. Bentuk ini bisa dilakukan untuk evaluasi kuantitatif terhadap keseluruhan atau setiap responden. Cara ini menggunakan tetapkan bobot jawaban terhadap tiap-tiap item atau sub item yang ditetapkan, pertanyaannya berbentuk positif atau negative. 

2. Interview (Wawancara)
Wawancara adalah teknik pengumpulan data yg digunakan peneliti buat menerima keterangan-kabar lisan melalui bercakap-cakap serta berhadap-hadapan mika dengan orang yg dapat memberikan informasi pada sipeneliti. Wawancara ini bisa dipakai buat melengkapi data yang diperoleh melalui observasi. Apabila peneliti akan memakai teknik wawancara pada penelitiannya perlu diketahui terlebih dulu: target, maksud, serta masalah apa yg dibutuhkan sipeneliti karena dalam suatu wawancara dapat diperoleh warta yang berlainana serta terdapat kalanya tidak sinkron menggunakan maksud si peneliti. 

Secara fisik, interview bisa dibedakan atas interview terstruktur serta nir terstruktur. Seperti halnya kuesioner, interview terstruktur terdiri dari serenteten pertanyaan dimana pewawancara tinggal memberikan indikasi cek (√) dalam pilihan jawaban yang sudah disiapkan. Interview terstandar kadang-kadang disembunyikan oleh pewawancara, akan tetapi tidak juga diperlihatkan kepada responden, bahkan respondenlah yg dipersilahkan memberikan tanda.

Ditinjau berdasarkan pelaksanaannya, maka dibedakan atas :
a. Interview Bebas, inguided interview, dimana pewawancara bebas menanyakan apa saja tetapi juga mengingat akan data apa yang akan dikumpulkan. Dalam pelaksanaannya pewawancara tidak membawa pedoman apa yang akan ditanyakan. Kebaikan metode ini merupakan bahwa responden nir menyadari sepenuhnya bahwa ia sedang diinterview. Kelemahannya merupakan arah pertanyaan kadang-kadang kurang terkendali.
b. Interview Terpimpin (Guided Interview), yaitu interview yg dilakukan sang pewawancara menggunakan membawa sederetan pertanyaan lengkap dan terang misalnya yang dimaksud pada interview terstruktur.
c. Interview Bebas Terpimpin, kombinasi antara interview bebas serta terpimpin. Dalam melaksanakan interview, pewawancara membawa panduan yang hanya adalah garis akbar mengenai hal-hal yg akan ditanyakan. 

Menginterview bukanlah pekerjaan yang mudah. Dalam hal ini pewawancara harus bisa membentuk suasana santai namun berfokus. Artinya bahwa interview dilakukan dengan sungguh-sungguh, nir main-main, namun nir kaku. Suasana ini penting dijaga supaya responden mau menjawab apa saja yang dikehendaki oleh pewawancara secara jujur.sang karena sulitnya pekerjaan ini, maka perlu adanya pembinaan bagi pewawancara. Sebagai instrument interview adalah interview guide atau pedoman wawancara.

Waktu mempersiapkan wawancara menggunakan responden perlu diperhatikan hal-hal berikut (Mardalis:1989):
a. Responden yang akan diwawancarai usahakan diseleksi agar sinkron dengan data yg dibutuhkan.
b. Waktu berwawancara sedapatnya dilakukan sinkron menggunakan kesediaan responden.
c. Permulaan wawancara usahakan peneliti memperkenalkan diri dan menyebutkan maksud serta tujuan wawancara yang dilakukan.
d. Ketika bewawancara, peneliti sebaiknya berlaku seperti orang ingin memahami dan belajar berdasarkan responden serta jangan seperti orang menggurui terhadap responden. Hal ini penting buat kelancaran wawancara.
e. Jangan sampai ada pertanyaan-pertanyaan yang tidak diinginkan sang responden.
f. Peneliti sebaiknya menunjukkan perhatian penuh terhadap pembicaraan responden. Jika terjadi pengalihan pembicaraan oleh responden peneliti menggunakan hati-hati meluruskannya ke target utama.
g. Melakukan penutupan pembicaraan dengan ucapan terima kasih.

3. Observasi
Observasi sering kali diartikan sebagai suatu arti yg sempit, yakni memperhatiakn sesuatu memakai mata. Di pada pengertian psikologig, observasi atau yang disebut dengan pengamatan, meliputi kegiatan penguatan perhatian terhadap sesuatu objek menggunakan memakai seluruh alat indera. Jadi, mengobservasi dapat dilakukan melalui penglihatan, penciuman, indera pendengaran, raba, serta pengecap. Apa yang dikatakan ini sebenarnya adalah pengamatan pribadi. Di dalam artian penelitian observasi bisa dilakukan dengan tes, berita umum, rekaman gambar, rekaman suara. 

Jika diperhatikan lebih lanjut, observasi atau pengamatan ini dapat dibedakan sebagai 2 observasi, yaitu :

a. Observasi Partisipasi
Dalam melakukan observasi partisipasi pengamat ikut terlibat dalam aktivitas yang sedang diamatinya atau bisa dikatakan si pengamat ikut serta menjadi pemain. Pengamat mengamati sambil iktu berperan pada aktivitas tadi. Yg perlu diperhatikan pada observasi partisipasi ini adalah agar si pengamat tidak lupa tugas pokoknya, yaitu mengamati serta mencari data.

b. Observasi Simulasi
Diharapkan pengamat bisa mensimulasikan keinginannya pada responden yang dituju sehingga responden dapat memenuhi cita-cita pengamat yang membutuhkan kabar atau data berdasarkan responden. 

Observasi dapat dilakukan menggunakan 2 cara yang kemudian dipakai buat menyebut jenis observasi yaitu:
a. Observasi non sistematis, yang dilakukan oleh pengamat dengan tidak menggunakan instrument pengamatan. 
b. Observasi sistematis, yang dilakukan sang pengamat dengan memakai panduan sebagai instrument pengamatan. 

Pedoman observasi berisi sebuah daftar jenis kegiatan yang mungkin ada dan akan diamati. Dalam proses observasi, pengamat hanya menaruh tanda dalam kolom loka insiden muncul itulah sebabnya maka cara bekerja seperti ini diklaim menggunakan sistem pertanda ( sign system).

Sign system dipakai sebagai instrumen pengamatan situasi pengajaran menjadi sebuah potret sesuai pedagogi menjadi sebuah potret selintas (snap shot). Instrument tadi berisi sederetan sub_variable misalnya: guru memberitahuakn, pengajar menulis dipapan tulis, pengajar bertanya dalam gerombolan , pengajar menjawab, anak didik bertanya, dll. Setelah pengamatan pada satu periode eksklusif contohnya 5 mnt, semua insiden yang timbul di cek. Kejadian yang muncul lebih dari satu kali pada satu periode pengamatan, hanya di cek satu kali. Dengan demikian akan diperoleh gambar mengenai apa kejadian yg timbul pada situasi pengajaran. 

Dalam hal ini pengamat nir bisa memperhatikan variable yg terlalu poly. Dengan demikian pada akhir pengamatan bisa disimpulkan di kelas mana partisipasi anak didik terjadi paling besar .

4. Skala bertingkat (Rating) atau Rating Scale 
Rating atau skala bertingkat adalah suatu ukuran subjektif yg dibuat berskala. Walaupun bertingkat ini mengahasilkan data yang kasar, tetapi relatif menaruh kabar. Instrumen ini bisa menggunakan gampang memberikan citra penampilan, terutama penampilan pada pada orang menjalankan tugas, yang memperlihatkan frekuensi munculnya sifat-sifat.

Rating-scale harus diinterpretasikan secara hati-hati lantaran disamping membentuk gambaran yang kasar jua jawaban responden tidak begitu saja mudah dipercaya. Sehubungan dengan ini Bregman serta Siegel dalam Arikunto:2006 mendaftar hal-hal yang menghipnotis ketidakjujuran jawaban responden yaitu: 
a). Persahabatan, 
b). Kecepatan mengira, 
c). Cepat menetapkan, 
d). Jawaban kesan pertama, 
e). Penampilan instrument, 
f). Prasangka.

Di pada menyusun skala, yang perlu diperhatikan adalah bagaimana memilih variable skala. Apa yang ditanyakan harus apa yg dapat diamati responden. Misalnya seorang pengajar ditanya mengenai jam kehadiran dan kepulangan kepala sekolah. Dia nir akan menjawab apabila beliau sendiri selalu tiba siang dan pulang awal.

5. Dokumentasi
Dokumentasi, berdasarkan asal pungkasnya dokumen, yg artinya barang-barang tertulis. Di pada melaksanakan metode dokumentasi, peneliti mempelajari benda-benda tertulis misalnya buku-kitab , majalah, dokumen, peraturan-peraturan, notulen kedap, catatan harian, dsb.

Dengan memakai serentetan kotak-kotak seperti ini dalam ketika mengumpulkan data melalui catatan-catatan yg menerangkan keadaan karyawan atau pegawai yang sebagai subjek penelitian menaruh indikasi centang pada kotak yg sinkron. Untuk merekam data berdasarkan beberapa orang karyawan, peneliti dapat menderetkan nama-nama subjek dibawah kotak-kotak tadi yg dalam setiap aspek dijadikan menjadi judul table.

a. Check list, yaitu daftar variabel yang akan dikimpulkan datanya. Dalam hal ini peneliti tinggal menaruh indikasi atau tally setiap pemunculan data yg dimaksud.

Dalam pengertian yg lebih luas, dokumen bukan hanya yang berwujud tulisan saja, namun bisa berupa benda-benda peninggalan seperti prasasti serta symbol-simbol. Metode dokumentasi ini dapat merupakan metode primer apabila peneliti melakukan pendekatan analisis isi . Buat penelitian menggunakan pendekatan lain pun metode dokumentasi pula memiliki kedudukan penting. Apabila peneliti memang cermat dan mencari bukti-bukti dari landasan aturan dan peraturan atau ketentuan, maka penggunaan metode dokumentasi menjadi tidak terhindarkan. 

PENGERTIAN DAN MANFAAT DATA MINING EMAIL

Pengertian Dan Manfaat Data Mining Email
Database ketika ini boleh jadi berkembang menjadi sangat besar secara cepat ke pada berukuran terabyte. Di pada tumpukan data tadi mungkin masih ada kabar-informasi tersembunyi yang sangat krusial atau sebagai penting pada saat diharapkan. Akan tetapi bagaimana caranya kita menemukan sebuah jarum pada tumpukan jerami? Dalam hal ini dapat kita katakan bahwa seluruh data belum berarti warta.

Kita sudah mengetahui bahwa data mentah (raw data) tidak terlalu berguna karena ukurannya yang begitu besar sehingga nir mungkin dianalisa. Kita perlu mengekstrak pola menurut data mentah tadi. Jawabannya merupakan dengan data mining. Banyak organisasi di dunia telah memakai data mining buat mencari dan menarik kesimpulan menurut data yang mereka miliki. Berikut beberapa model pelaksanaan data mining:
  • Perusahaan pemasaran memakai data sejarah respon pembelian terhadap suatu tawaran produk buat membentuk contoh buat memperkirakan pelanggan potensial yg akan di raih menggunakan metode penawaran tertentu.
  • Agen pemerintah menyaring data transaksi keuangan untuk mendeteksi money laundering serta penyelundupan obat terlarang.
  • Dalam tahapan diagnosis, para fisikawan menciptakan expert system menurut banyak percobaan yg sudah dilakukan.
Secara definisi data mining merupakan ekstraksi fakta potensial yang sebelumnya tidak diketahui atau implisit, suatu kelas dari aplikasi database yang mencari pola tersembunyi pada suatu grup data. Atau, data mining bisa pula didefinisikan menjadi suatu proses yang menggunakan berbagai perangkat analisis data untuk menemukan pola serta rekanan data supaya bisa digunakan buat menciptakan prediksi menggunakan sempurna.

Dari tinjauan keamanan sistem berita, data mining memang bagai pisau bermata ganda. Di satu sisi sanggup bermanfaat bagi pihak pemilik data buat hal-hal yang sudah disebutkan pada atas, tetapi bisa jadi illegal bila data-data tadi disalahgunakan untuk hal-hal yang bersifat melanggar privasi orang lain atau bahkan bila pengumpulan data tadi dilakukan secara tidak etis dan tanpa sepengetahuan pihak yg memiliki informasi.

Makalah ini hanya akan membahas apa itu data mining, kemungkinan aplikasinya pada mencari pola dalam email, serta sedikit demonstrasi sederhana dengan memakai aplikasi jadi misalnya outlook serta Access buat parsing email ke database, dan software open source Weka (Waikato Environment for Knowledge Analysis) yang dikembangkan pada Universitas Waikato. Software ini sudah memiliki beberapa library dasar buat melakukan data mining.

Aplikasi data mining sendiri bukanlah suatu aplikasi sederhana. Ia melibatkan algorithma machine learning yang membutuhkan algoritma kecerdasan protesis yang cukup kompleks dan berada pada luar cakupan makalah ini.

1. Data Mining
Data mining merupakan proses yang menggunakan berbagai perangkat analisis data untuk menemukan pola serta interaksi pada data yg mungkin bisa dipakai untuk membuat prediksi yg valid.

Langkah pertama serta paling sederhana pada data mining yaitu menggambarkan data – menyimpulkan atribut statistik (seperti rata-homogen dan baku deviasi), mereview secara visual menggunakan diagram serta grafik, dan mencari rekanan berarti yang potensial antar variabel (misalnya nilai yg acapkali timbul bersamaan). Mengumpulkan, mengeksplor, dan memilih data yang sempurna merupakan sangat penting.

Pada dasarnya terdapat empat langkah utama dalam melakukan data mining:
1. Mendeskripsikan data, yakni menyimpulkan atribut statistik (seperti homogen-homogen serta standard deviasi), mereview secara visual memakai grafik serta diagram, dan mencari interaksi-hubungan potensial antar variabel (seperti contohnya, nilai-nilai yg tak jarang keluar bersamaan). 

2. Membangun model asumsi (predictive contoh) menurut dalam pola-pola yg ditemukan pada langkah sebelumnya. 

3. Menguji contoh pada luar sampel orisinil. Sebuah contoh yg baik tidak wajib sama persis menggunakan kenyataan sebenarnya (seperti peta bukanlah representasi sempurna dari jalan yg sebenarnya), akan tetapi bisa sebagai pedoman yang berguna buat mengerti bisnis kita. 

4. Memverifikasi/menguji model. Misalnya, berdasarkan suatu database pelanggan yg telah merespon tawaran yg pernah diiklankan pada mereka, kita menciptakan sebuah model asumsi yg memiliki prospek akan mendapat respon yang sama menurut pelanggan menggunakan tipikal tadi tersebut. Tapi bisakah kita sahih-sahih bergantung dalam asumsi kita tersebut? Kita perlu menerangkan model asumsi kita tersebut ke sample pelanggan yang lain dan melihat output yang kita dapatkan.

Untuk melakukan hal tadi diatas maka setidaknya diperlukan suatu program yang dapat menampilkan (bila tidak mendeteksi) pola serta keteraturan pada data sebagai akibatnya pola-pola yg kuat atau sangat kentara terlihat dapat digunakan buat melakukan prediksi. 

Keterbatasan Data Mining
Data mining hanyalah sebuah alat, bukan tongkat ajaib. Data mining tidak secara otomatis mengamati apa yg terjadi pada database lalu mengirimkan laporan ketika masih ada pola-pola menarik. Penggunaan data mining permanen saja mengharuskan kita buat mengerti data kita serta mengerti metode-metode analisis data. Data mining membantu analis buat menemukan pola dan rekanan data akan namun nir secara langsung mengungkapkan nilai berdasarkan pola tersebut. Lebih jauh lagi, pola-pola yg nir diketemukan melalui data mining harus diverifikasi pulang pada global nyata.

Perlu diingat bahwa hubungan prediktif yang ditemukan melalui data mining nir selalu adalah sebab dari suatu prilaku atau tindakan. Misalnya, datamining sanggup jadi menemukan bahwa pria menggunakan pendapatan Rp. Lima – 10 juta per bulan adalah pelanggan berdasarkan majalah-majalah eksklusif dan kemungkinan akbar adalah pembeli berdasarkan suatu produk. Suatu perusahaan mampu saja mengambil keuntungan dari pola ini menggunakan menargetkan pemasaran kepada orang-orang yg memenuhi pola tadi. Tapi permanen saja perusahaan tersebut tidak boleh mengasumsikan bahwa hanya faktor inilah yang mengakibatkan mereka membeli produk perusahaan tadi.

Model serta Algoritma Data Mining
Dalam bagian ini akan dibahas suatu model serta algoritma yg tak jarang digunakan pada melakukan data mining. Yang wajib diperhatikan adalah bahwa contoh atau algoritma ini bukan adalah satu-satunya yg terdapat dan nir wajib dipakai secara tertentu. Pemilihan contoh tentu saja sangat bergantung pada tujuan yang ingin dicapai dalam melakukan data mining dan data yg akan dihadapi.

Neural Network
Neural Network biasa dipakai pada perkara pembagian terstruktur mengenai (pada mana outputnya adalah variabel kategoris) atau regresi (outputnya kontinyu). Neural network dimulai dengan layer input, dimana tiap simpul berkorespondensi menggunakan variabel prediktor. Simpul-simpul input ini terhubung ke beberapa simpul dalam hidden layer. Tiap simpul input terhubung menggunakan tiap simpul pada hidden layer. Simpul pada hidden layer sanggup jadi terhubung ke simpul lain pada hidden layer, atau ke output layer. Output layer terdiri berdasarkan satu atau beberapa variabel respon.

Gambar Neural network dengan satu hidden layer

Setelah layer input, tiap simpul mengambil satu himpunan input, mengalikan input-input tersebut menggunakan bobot Wxy (contohnya, bobot dari simpul 1 ke tiga adalah W13 – lihat gambar), menambahkan kedua bobot, menerapkan fungsi (biasa dipanggil fungsi aktivasi atau squashing), serta melewatkan outputnya ke simpul pada layer berikutnya. Misalnya, nilai yang dilewatkan berdasarkan node 4 ke node 6 merupakan:

Activation function applied to ([W14 * value of node 1] + [W24 * value of node 2])

Gambar Wxy merupakan bobot berdasarkan simpul x ke simpul y

Tiap simpul sanggup dicermati menjadi variabel prediktor (dalam hal ini simpul 1 dan 2) atau sebagai kombinasi menurut variabel prediktor (simpul 3 hingga 6). Simpul 6 adalah kombiasi non linear menurut nilai simpul 1 dan 2, karena fungsi aktivasi terhadap nilai penjumlahan pada simpul-simpul tersembunyi. Jika masih ada fungsi aktivasi tanpa hidden layer, jaringan saraf akan ekivalen menggunakan regresi linear; dan dengan fungsi aktivasi non-linear eksklusif, jaringan saraf akan ekivalen menggunakan regresi logistik. 

Bobot koneksi (W) adalah parameter nir diketahui yg diestimasi dengan metode training. Awalnya, metode pembinaan yang umum merupakan backpropagation; metode-metode yang baru kemudian bermunculan misalnya gradien konjugasi, quasi-Newton, Levenberg-Marquardt, dan algoritma genetic. Tiap metode training memiliki satu himpunan parameter yg mengatur berbagai aspek dari training seperti contohnya menghindari local optima atau mengatur kecepatan konversi. 

Arsitektur (atau topologi) menurut jaringan saraf merupakan jumlah dari simpul dan layer-layer tersembunyi, dan bagaimana mereka saling bekerjasama. Dalam merancang jaringan saraf, baik user maupun perangkat lunak wajib memilih jumlah simpul serta layer tersembunyi, fungsi aktivasi, dan batasan-batasan bobot. Meskipun terdapat anggaran umum, kita umumnya tetap harus bereksperimen dengan parameter-parameter tersebut.

Tipe yg paling generik berdasarkan jaringan saraf merupakan jaringan feed forward backpropagation. Untuk kesederhanaan bahasan, kita akan membahas jaringan menggunakan satu hidden layer.

Training Backpropagation hanyalah salah satu versi berdasarkan gradien descent, suatu jenis algoritma yg mencoba buat mengurangi nilai sasaran (error, pada perkara jaringan saraf) dalam tiap langkah. Algoritma ini bekerja seperti berikut:

Feed forward: Nilai menurut simpul output dihitung menurut nilai simpul input dan bobot-bobot awal. Nilai-nilai berdasarkan simpul input ini dikombinasikan pada hidden layers, serta nilai dari simpul-simpul pada hidden layer digabungkan buat menghitung nilai output.

Backpropagation: Error pada output dihitung menggunakan mencari beda antara hasil terhitung serta hasil yg diinginkan. Kemudian, error berdasarkan output dimasukkan kembali ke hidden layer secara proporsional, sinkron menggunakan bobotnya. Hal ini akan membuat error dihitung buat tiap simpul output dan simpul tersembunyi dalam jaringan. Akhirnya, error pada tiap simpul tersembunyi dan simpul output dipakai sang algoritma buat mengatur bobot yg masuk ke simpul buat mengurangi error.

Proses ini berulang buat tiap baris pada himpunan traininng. Tiap lewatan terhadap tiap baris pada himpunan traininng diklaim epoch. Himpunan pelatihan ini akan dipakai berulang kali, sampai error yg didapatkan nir lagi berkurang. Pada titik tersebut jaringan saraf dianggap teah terlatih buat menemukan pola dalam himpunan test. Karena poly sekali parameter yang mungkin ada dalam jaringan tersembunyi, suatu jaringan saraf dengan simpul-simpul tersembunyi yang cukup akan selalu menyelesaikan training set jika dibiarkan berjalan relatif usang. Tapi seberapa baikkah jaringan saraf tersebut untuk data yang lain? Untuk menghiondari jaringan saraf yang overfitted yang akan hanya bekerja dengan baik dalam data training, kita harus memahami kapan wajib berhenti melakukan pelatihan. Beberapa implementasi akan mengevaluasi jaringan saraf pada data penguji secara periodik selama latihan. Selama error rate pada hipunan penguji terus menurun, training akan terus dilakukan. Apabila error rate bertambah, meskipun error rate dalam data traininng terus menurun, maka jaringan saraf mungkin mengalami overfitting. Grafik pada gambar mengilustrasikan bagaimana himpunan data penguji bisa menolong kita menghindari overfitting. Kita dapat melihat bahwa error rate terus menurun pada tiap lewatan jariingan saraf terhadap data (garis titik-titik), akan tetapi error rate buat data penguji mengalami kenaikan. Karena tujuan menurut data mining adalah buat membuat prediksi pada data yg bukan himpunan traininng, maka kita tentu saja harus menggunakan jaringan saraf yg akan meminimalisasi error dalam data penguji, bukan data pelatihan.

Gambar Error rate sebagai fungsi jumlah epoch dalam jaringan saraf

Jaringan saraf berbeda secara filosofis dari banyak metode statistik dalam beberapa hal. Pertama, jaringan saraf umumnya mempunyai lebih poly parameter. Misalnya, terdapat tiga belas parameter (9 bobot serta 4 bias) dalam jaringan saraf pada gambar 4. Lantaran banyaknya parameter, serta kombinasi berdasarkan parameter menghasilkan prediksi yg similar, parameter sebagai uninterpretable dan jaringan bertindak sebagai prediktor “black box”. Pada kenyataannya, suatu output bisa diasosiasikan menggunakan beberapa himpunan bobot yg tidak selaras. Oleh karenanya, bobot network secara generik tidak membantu dalam usaha buat mengerti proses yang membentuk prediksi. Akan tetapi hal ini bisa diterima pada banyak pelaksanaan. Suatu bank hanya ingin mengenali secara otomatis suatu pertanda tangan, akan tetapi nir peduli bentuk rekanan fungsional antara pixel dan karakter yang diwakilinya. Beberapa pelaksanaan yang memiliki ratusan variabel menjadi input ke dalam model dengan ribuan parameter (bobot simpul) meliputi pabrik kimia, robot dan pasar keuangan, serta perkara-kasus sosialisasi pola seperti bunyi, vision dan karakter.

Satu keuntungan menurut contoh jaringan saraf merupakan jaringan saraf gampang untuk diimplementasikan buat dijalankan dalam paralel personal komputer dengan tiap node menjalankan kalkulasinya sendiri-sendiri secara simultan.

Pengguna wajib sadar terhadap beberapa informasi mengenai jaringan saraf: pertama, jaringan saraf tidak mudah buat ditafsirkan. Tidak ada penjelasan rasional yang eksplisit tentang bagaimana suatu jaringan saraf melakukan keputusan atau prediksi. Kedua, jaringan saraf cenderung mengalami overfit data training kecuali pengukuran yang sangat ketat, untuk acakan bobot atau validasi silang dilakukan secara hati-hati.ketiga, jaringan saraf membutuhkan waktu lama buat melakukan pelatihan kecuali masalahnyas sangat kecil. Setelah ditrain, jaringan saraf bisa melakukan prediksi menggunakan cukup cepat. Keempat, jaringan saraf membutuhkan persiapan data yang poly. Implementasi yang sukses dari jaringan saraf membutuhkan pemililihan dan preprocessing data yang baik. Misalnya, jaringan saraf mensyaratkan semua variabel harus numerik. Oleh karenanya, data kategoris seperti “propinsi” umumnya dipecah menjadi variabel dikotomis (contohnya “jawa barat”, “jawa timur”), masing-masing dengan nilai “1” (yes) atau “0” (no). Akhirnya, jaringan saraf akan bekerja menggunakan baik jika set data yg dipakai cukup akbar serta rasio frekuwensi terhadap noise relatif tingggi.

Decision trees
Decision tree adalah cara merepresentasikan perpaduan anggaran yang mengacu ke suatu nilai atau kelas. Misalnya kita bisa mengklasifikasikan suatu proposal pinjaman uang memiliki resiko baik atau tidak baik. Gambar ? Menunjukkan decision tree sederhana: decision node, branches and leaves.

Gambar Classification tree sederhana

Komponen pertama adalah simpul top decision, atau simpul root, yg menentukan test yang akan dijalankan. Simpul root dalam contoh ini merupakan “income > $40.000”. Hasil dari tes ini menyebabkan tree terpecah menjadi 2 cabang, menggunakan tiap cabang meepresentasikan satu berdasarkan jawaban yg mungkin. Dalam perkara ini, jawabannya adalah “ya” dan “nir”, sebagai akibatnya kita mendapatkan dua cabang.

Bergantung dalam algoritma yang digunakan. Tiap simpul sanggup mempunyai 2 atau lebih cabang. Misalnya, CART akan menggenerate hanya 2 cabang pada tiap simpul. Tree misalnya ini diklaim binary tree. Ketika lebih menurut 2 cabang diperbolehkan maka diklaim menjadi multiway tree.

Tiap cabang akan mempunyai simpul node yg lain atau dasar tree, yang dianggap leaf. Dengan mengikuti decision tree kita bisa menaruh nilai dalam suatu masalah menggunakan menetapkan cabang mana yg akan diambil, dimulai berdasarkan simpul root serta bergerak ke bawah sampai leaf. Dengan memakai metode ini, seorang petugas yg bertanggung jawab buat memutuskan pemberian pinjaman terhadap nasabah mampu menentukan apakah seseorang nasabah memiliki resiko kredit yg baik atau tidak baik.

Model decision tree umum dipakai dalam data mining buat menelaah data serta menginduksi tree serta anggaran yang akan dipakai untuk menciptakan prediksi. Sejumlah algoritma yang tidak sama bisa dipakai buat menciptakan tree pada antara nya adalah CHAID (Chi squared Automatic Interactin Detection), CART (Classification and Regression Trees), Quest dan C5.0.

Decision tree berkembang melalui pemecahan iteratif menurut data ke pada kelompok-kelompok diskrit, yang tujuannya adalah buat memaksimalkan “jeda” antara gerombolan pada tiap pemecahan. 

Contoh yg kita gunakan hingga ketika ini sangatlah sederhana. Tree ini sangat gampang buat dimengerti serta diinterpretasikan. Akan namun, tree sanggup menjadi sangat kompleks. Bisa dibayangkan kompleksitas suatu tree yg diturunkan dari database dengan ratusan atribut dan variabel respon dengan lusinan kelas input. Tree sperti ini akan sangat sulit buat dimengerti, meskipuntiap path dari tree umumnya bisa dimengerti. Dalam hal ini decision tree sanggup menjelaskan prediksinya, yang adalah keuntungan penting.

Akan tetapi, kejelasan ini bisa jadi menyesatkan. Misalnya, percabangan berdasarkan suatu decision tree mengimplikasikan suatu presisi yg jarang ditemui dalam global konkret. (Kenapa seorang yang gajinya $40.001 akan sebagai nasabah dengan resiko kredit yang baik sedangkan seorang menggunakan honor $40.000 tidak?)

Selain dua butir algoritma yg dibahas pada atas, masih banyak lagi prosedur pemecahan lain seperti Multivariate Adaptive Regression Splines (MARS), Rule induction, K-nearest neighbor and memory-based reasoning (MBR), Logistic regression, Discriminant analysis, Generalized Additive Models (GAM), Boosting, dan Genetic algorithms.

2. Implementasi Data Mining Email
Mengenali suatu pendekatan yg sistematis merupakan hal yg sangat krusial supaya kita dapat melakukan data mining dengan sukses. Banyak vendor serta organisasi konsultan telah menentukan urutan langkah yg akan membentuk output yg memuaskan. 

Langkah-langkah dasar pada data mining adalah menjadi berikut: 
1. Define business problem
2. Build data mining database
3. Explore data
4. Prepare data for modeling
5. Build model
6. Evaluate model
7. Deploy contoh and results

Mengikuti langkah-langkah di atas, maka pertama kali kita harus memilih dulu perkara yang hendak dipecahkan. Dalam hal ini tujuan kita melakukan data mining email wajib terlebih dahulu didefinisikan. Dalam perkara email, data mining umumnya dilakukan buat mengetahui prilaku pelanggan dari order yg masuk via email, atau mampu pula mengetahui prilaku konsumsi seseorang. Suatu model konkret, Google melakukan data mining email buat mengetahui iklan yg relevan buat ditampilkan ke web interface layanan email mereka. 

Tujuan yang berbeda membutuhkan pemodelan database dan data yg berbeda jua.
Pada makalah ini akan didemonstrasikan bagaimana suatu data bisa diambil menurut pelaksanaan email client misalnya outlook buat kemudian diparse ke database. Setelah data terkumpul pada database kemudian dilakukan data analisis menggunakan menggunakan aplikasi open source Weka (Weikato Environment for Knowledge Analysis).

Karena kesulitan pada mengumpulkan data yg baik (dalam hal ini email yang representatif) maka digunakan data fiktif yg kiranya akan menarik untuk dianalisis. Walaupun begitu, permanen akan didemonstrasikan bagaimana email penulis diparse ke dalam database Access.

Aplikasi Pendukung
Pada bagian ini akan dibahas aplikasi-aplikasi atau bahasa pendukung yang dipakai buat membangun aplikasi data mining email dalam makalah ini, yaitu Outlook Express, Visual Basic for Application, serta Microsoft Access.

Outlook Express
Outlook Express merupakan galat satu pelaksanaan email client yang bekerja pada platform Windows selain Eudora, Mozilla ThunderBird, Pegasus Mail, serta masih banyak lagi yg lainnya.

Alasan penggunaan Outlook dalam makalah ini merupakan karena interoperabilitasnya yang sangat baik dengan sistem aplikasi Ms Office lainnya (dalam hal ini kita akan menggunakan relational database Ms Access) dan umumnya telah terpaket pada Windows yang kita gunakan. Akan namun selain itu, Outlook pula memiliki kemampuan pengorganisasian email yang relatif baik (impian folders, versatile searching) dan penyaringan spam yg relatif solid. 

Berikut merupakan beberapa fitur dasar dari Outlook Email Client:
  • Kemampuan mengelola banyak account email serta newsgroup
  • Kemudahan pada mengeksplorasi pesan/email masuk
  • Memiliki addressbook untuk menyimpan serta melihat alamat-alamat email
  • Kemampuan mendownload email/newsgroup buat dibaca secara offline
  • Mengirim serta menerima pesan secara kondusif menggunakan enkripsi
Microsoft Access
Pada dasarnya Access adalah suatu Database Management System (DBMS). Seperti halnya produk lain pada kategori ini, Access meyimpan dan memanggil liputan/data, mempresentasikan data yg diminta, serta mengotomasi repetitive tasks. Dengan akses kita sanggup membuat form masukan yang mudah digunakan misalnya diperlihatkan dalam gambar ?

Gambar Screenshot form dalam Access

Akses pula adalah pelaksanaan database windows yang cukup powerful. Lantaran baik Windows juga Access merupakan produk Microsoft, ke 2 produk tadi berafiliasi dengan sangat baik. Access berjalan di seluruh versi windows.

Dengan memakai OLE (Object Linking Embedding) pada Windows dan produk Ms Office (Excel, Word, Power Point serta Outlook) kita mampu membuatkan kemampuan Access. OLE memungkinkan produk yg satu menggunakan lainnya saling bertukar keterangan dengan mudah.

Berikut beberapa fitur yg ditawarkan Access:
  • Database management system yang benar-sahih relasional
  • Wizard yang mudah digunakan
  • Importing, exporting, dan linking tabel
  • Form dan laporan menggunakan fitur WYSIWYG
  • Multiple table queries and relationships
  • Business graph and chart
  • Kemampuan DDE dan OLE
  • True Client/server
  • Dukungan modul VBA
Gambar ? Mengilustrasikan kemampuan Access dalam banyak level

Gambar Kemampuan Access dalam banyak level

VBA Pada Access
Access mempunyai poly tool yg relatif baik yang memungkinkan kita bekerja dengan database serta tabel, queries, form, dan report yg dimilikinya tanpa menulis satu baris kode pun. Akan namun, pada kasus-perkara tertentu, kita mungkin membutuhkan pengembangan pelaksanaan yang lebih rumit misalnya misalnya validasi input yg lebih ekstensif atau error handling yang lebih baik.

Untuk situasi-situasi seperti ini, kita membutuhkan suatu bahasa taraf tinggi. Access menyediakan bahasa pemrograman yg dianggap Visual Basic for Application (VBA) yang sanggup menaikkan kemampuan berdasarkan Access dan melebihi kemampuan yg ditawarkan oleh Macro.

Visual Basic sudah menjadi bahasa generik untuk semua aplikasi Microsoft. Visual Basic terdapat pada seluruh pelaksanaan Ms Office XP, termasuk Excel, Word, Power Point, dan outlook. Visual Basic adalah bahasa pemrograman terstruktur yang memperlihatkan bnyak struktur pemrograman yang sudah biasa digunakan sang programmer misalnya If .. Then … Else, Select Case, dan seterusnya. Visual Basic memungkinkan seseorang programmer bekerja dengan fungsi dan subrutin di pada bahasa yang hampir misalnya layaknya bahasa Inggris. Bahasa ini jua sangat ekstensibel (mampu memanggil rutin Windows API) serta mampu berinteraksi melalui ADO (Active Data Objects) atau DAO (Data Access Objects) menggunakan semua tipe data Access atau Visual Basic. 

Weka
Weka merupakan koleksi algoritma data mining buat tugas-tugas data mining. Algoritma ini bisa diterapkan secara eksklusif ke dalam dataset atau sanggup pula dipanggil berdasarkan kode java kita sendiri. Weka mempunyai tools buat data pre-processing, classification, regression, clustering, association rules, serta visualization. Weka pula cocok buat dipakai dalam pengembangan skema baru learning machine. Weka adalah software open source yang diterbitkan dibawah lisensi GNU General Public License.

Perancangan dan Implementasi
Tujuan dari aplikasi ini adalah buat men data-mine email yg berada pada mailbox Outlook. Kita akan mengekstrak warta email serta memasukkan fakta tersebut ke pada relational database sebagai akibatnya kemudian kita mampu menganalisanya dengan beberapa prosedur pemecahan data mining. 

Jadi langkah perancangan pertama kali adalah menggunakan merancang acara pengekstrak data email Outlook buat kemudian di ekspor ke Access. Selanjutnya membentuk contoh data mining menurut data mentah yg telah kita masukkan ke database tadi. 

Secara garis besar model dari pelaksanaan data mining ini dapat diilustrasikan menjadi berikut:

Gambar Alur proses data mining

Program Pengekstrak serta Pengimpor Data Email
Sebenarnya kita bisa menghubungkan Outlook menggunakan Access tanpa melakukan pemrograman sedikitpun. Yakni dengan menggunakan driver yang sudah terpasang secara built-in pada Office 2000. Sayangnya metode ini memiliki kekurangan dalam hal kesulitan dalam kustomisasi database. Untuk pertimbangan kemudahan kita hanya akan memakai import wizard berdasarkan Access yang akan mengimport seluruh data email yang terdapat dalam inbox outlook. Untuk membuat database yg lebih baik, mungkin kita bisa mendesign sendiri struktur database yg baik dan kemudian menulis script sederhana menggunakan visual basic editor di outlook supaya setiap email yg diterima akan pribadi dimasukkan ke database. Berikut acara sederhana berbentuk modul pada Microsoft Access buat mengimport email dari outlook menggunakan memakai bahasa Visual Basic for Application.

Option Compare Database 
  • Dim ol As New Outlook.application 
  • Dim PublicFolder As MAPIFolder 
  • Dim OldTaskItems As Items 
  • Dim itm As Outlook.taskItem 
  • Dim AppPath As String 
Sub ImportItems() 
Set PublicFolder = ol.getnamespace("MAPI").folders("Public Folders").folders("All Public Folders").folders("PT").folders("Help Desk Application").folders("Tarefas Antigas") 

Set OldTaskItems = PublicFolder.items.restrict("[Subject] > ''") 

Dim nmritens As Integer 
nmritens = OldTaskItems.count ' 
' If nmritens = 0 Then 
' MsgBox "Tidak ada item baru" 
' Else 
' MsgBox " Terdapat" & nmritens & " buat diimport" 
' End If 

For Each itm In OldTaskItems 
If nmritens > 1 Then 
Set appAccess = CreateObject("Access.application") 
strAccessPath = appAccess.syscmd(9) 
strDBName = "c:/documents and Settings/doni/my Documents/mdb/" & "importoutlook.mdb" 'strAccessPath & "email.mdb" 
Set dbe = CreateObject("DAO.dbengine.36") 
Set wks = dbe.workspaces(0) 
Set dbs = wks.openDatabase(strDBName) 
Set rst = dbs.openRecordset("tblHdrs") 
rst.addnew 
rst.remetente = itm.userProperties("Behalf") 
rst.assunto = itm.userProperties("Subject") 
rst.recebido = itm.userProperties("Received Date") 
rst.fechado = itm.userProperties("Close Date") 
rst.update 
rst.close 
dbs.close 
End If 
Next 
End Sub 

Hal yg sama mampu kita lakukan bila kita lebih memilih memakai server misalnya MSSQL, MySQL, atau PostGreSQL. 

Berikut merupakan data yang mungkin didapatkan:

Gambar Tabel import menurut outlook

Bisa dilihat data diatas nir terlalu menarik untuk dianalisis, karena sifatnya yang terlalu luas dan nir khusus. Beberapa hal yang mampu dianalisis mungkin buat menemukan kata terbanyak yg muncul sehingga bisa digunakan buat memilih ketertarikan oleh empunya email, atau siapa pengirim email terbanyak. Dalam bagian berikutnya kita akan mensimulasikan data yang lebih menarik buat disimulasikan namun tidak terlalu besar .

Analisis Data
Misalkan suatu pasangan orang tua yg sibuk memiliki account email yg digunakan buat menerima email berisi laporan cuaca tiap hari dan kegiatan bermain anak menurut oleh baby sitter. Template email telah diatur sedemikian rupa sehingga membentuk data sebagai berikut: 

Gambar Data cuaca dan aktivitas bermain anak

Data tadi akan disimulasikan dengan memakai Weka. Dalam manualnya aplikasi Weka hanya mendapat format arsip ARFF. Walaupun kita mampu saja eksklusif menggunakan format file Access menggunakan mengganti kode atau menciptakan kode kita sendiri dengan memanfaatkan library yg sudah ada pada Weka.

Berikut merupakan isi arsip weather.arff yg adalah hasil konversi berdasarkan tabel email dalam database Access.
@relation weather
@attribute outlook sunny, overcast, rainy
@attribute temperature real
@attribute humidity real
@attribute windy TRUE, FALSE
@attribute play yes, no
@data
sunny,85,85,FALSE,no
sunny,80,90,TRUE,no
overcast,83,86,FALSE,yes
rainy,70,96,FALSE,yes
rainy,68,80,FALSE,yes
rainy,65,70,TRUE,no
overcast,64,65,TRUE,yes
sunny,72,95,FALSE,no
sunny,69,70,FALSE,yes
rainy,75,80,FALSE,yes
sunny,75,70,TRUE,yes
overcast,72,90,TRUE,yes
overcast,81,75,FALSE,yes
rainy,71,91,TRUE,no

Sekarang kita sanggup memulai menganalisa data tadi menggunakan memakai prosedur pemecahan yang telah disediakan. Untuk menampakan apa yang dapat dilakukan decision tree learner pada data tersebut, kita dapat memakai prosedur pemecahan j4.8, yang adalah implementasi Weka buat decision tree learner. Kita bisa mengetik:

java weka.classifiers.J48.J48 -t weather.arff
Pada command line. Atau menggunakan Graphical User Interface yg tersedia.

Berikut hasil yang kita dapatkan:
J48 pruned tree
outlook = sunny
humidity <= 75: yes (2.0)
humidity > 75: no (3.0)
outlook = overcast: yes (4.0)
outlook = rainy
windy = TRUE: no (dua.0)
windy = FALSE: yes (3.0)
Number of Leaves : 5
Size of the tree : 8

=== Error on training data ===
Correctly Classified Instances 14 100 %
Incorrectly Classified Instances 0 0 %
Mean absolute error 0
Root mean squared error 0
Total Number of Instances 14

=== Confusion Matrix ===
a b <-- as="" classified="" o:p="">-->
9 0 a = yes
0 5 b = no

=== Stratified cross-validation ===
Correctly Classified Instances 9 64.2857 %
Incorrectly Classified Instances 5 35.7143 %
Mean absolute error 0.3036
Root mean squared error 0.4813
Total Number of Instances 14

=== Confusion Matrix ===
a b <-- as="" classified="" o:p="">-->
7 dua a = yes
3 dua b = no

Bagian pertama merupakan decision tree dalam bentuk teks. Seperti dapat kita lihat, percabangan pertama adalah dalam atribut outlook, serta lalu pada level selanjutnya, percabangan terjadi masing-masing pada humidity serta windy. Dalam struktur pohon, titik 2 merepresentasikan label kelas yang telah diberikan ke leaf tertentu, diikuti dengan angka yg merepresentasikan jumlah instans yang memenuhi persyaratan tadi. 

Dibawah struktur pohon, jumlah leaf dicetak, kemudian total jumlah simpul pada pohon (size of the tree).
Bagian ke 2 hasil memberitahuakn kesalahan yang terjadi dalam data trining. Dalam masalah ini, semua 14 data sudah diklasifikasi dengan sahih, dan tak satupun yg dibiarkan tidak terklasifikasi. Suatu instans mampu tidak diklasifikasi apabila skema pembelajaran menahan pemberian suatu kelas label ke instans tersebut.

Kesimpulan berdasarkan data pembinaan dapat dilihat pada confusion
matrix, yg menampakan berapa poly instans dari tiap kelas sudah diassign ke tiap kelas. Dalam kasus ini, hanya elemen diagonal menurut matriks yg non-zero lantaran seluruh instans sudah diklasifikasikan secara benar. 

Bagian terakhir menurut hasil memperlihatkan hasil yg didapat dari stratified ten-fold cross-validation. Modul penilaian secara otomatis melakukan ten-fold cross-validation jika tidak diberikan file test. Seperti dapat kita lihat, lebih berdasarkan 30% instans (5 menurut 14) telah diklasifikasikan secara keliru pada validasi silang. Hal ini menandakan bahwa output yg didapatakan dari training data dangat optimistik dibandingkan menggunakan apa yg mungkin didapat dari himpunan tes yg independen berdasarkan source yg sama. Dari confusion matrix kita bisa melihat bahwa 2 instans kelas yes telah dikelompokkan ke kelas no, dan 3 kelas no diassign ke kelas yes.