DATA MINING DALAM PROSES KDD KNOWLEDGE DATA DISCOVERY

Data Mining Dalam Proses KDD (Knowledge Data Discovery)
Data Selection
Pada proses ini, semua data yg ada si data base dihimpun dan dipilih sebagai target data. Seleksi data ini dilakukan sebelum tahap ekskavasi informasi yg lebih dalam. Data disimpan pada berkas terpisah.

Pre-processing/ Cleaning
Proses pembersihan dari noise yg mengganggu data yg relevan. Proses cleaning meliputi pembuangan data yg dupliat, mempelajari data yg inkonsisten, memeperbaiki kesalahan data misalnya kesalahan cetak (tipografi). Dilakukan jua proses enrichmnent yaitu menambah data ekternal yang mungkin bisa memperkaya informasi yang berkaitan.

Transformation
Seluruh data yang tealh pada perkaya serta dipilih mengalami perubahan (transformasi) sinkron kebutuhan pada proses data mining. Intinya, data diadaptasi agar sanggup diolah pada data mining.

Data mining
Pemilihan data yang berkaitan dengan kebutuhan. Pemilihan tadi terdiri dari penjabaran, regresi, clustering, dan lainnya. Proses pencarian data yang menarik menggunakan metode eksklusif yg sinkron dengan tujuan dan proses KDD secara holistik.

Interpretation/ Evaluation
Pola yang didapatkan sang data mining diterjemahkan sehingga lebih dimengerti. Tahap ini akan memeriksa apakah terdapat data yang bertentangan atau berbeda menggunakan hipotesa yg sudah dibuat sebelumnya. 

Arsitektur Data Mining
1. Data cleaning: membuang data yg nir perlu atau noise
2. Data integration : menggabungkan data berdasarkan banyak sumber
3. Data Mining Engine : Mentranformasikan data agar mampu diolah sang data mining
4. Pattern evaluation : buat menemukan data yg bernilai lewat knowledge base.
5. Graphical User Interface (GUI) : buat end user.

Kelebihan dan Kekurangan Data Mining
Kelebihan: 
  • Tidak perlu lagi jasa dalam menganalisa data perusahaan menggunakan cara manual lantaran sudah ada piranti lunak data mining yg sanggup memprediksi sasaran ke depan.
  • Meminimalkan biaya riset.
  • Meminimalkan kemungkinan kerugian ke depannya.
  • Khususnya bagi pemasaran interaktif, para pelaku usaha yangv baru ingin membuat web, data mining membantu buat penyusunan konten. Hal ini bisa menciptakan web perusahaan menjadi lebih efektif.
Kelemahan: 
Data perusahaan yang nir lengkap menciptakan sistem data mining kurang akurat, terlebih bila data tadi penting dan relevan, grup data yg nir konsisten mampu menciptakan data sulit teranalisa. Misalnya: data customer tidak di update, sehingga customer yang tidak loyal masih masuk dalam customer tetap. 

Penggunaan Data Mining
  • Perusahaan kartu kredit bisa memanfaatkan data transaksi pelanggan-pelanggannya untuk merancang produk kredit baru yg akan menarik minat para customer tadi.
  • Perusahaan produk kuliner atau kebutuhan keseharian bisa menggunakan data mining untuk menaikkan penjualan produk ke retailer. Dengan melihat data customer, pengiriman, competitor, kita sanggup menganalisis sebab mengapa customer berpindah ke produk lainnya dan bisa menyususn strategi pemasaran baru yg lebih efektif.
  • Perusahaan farmasi sanggup melihat aktivitas penjualan terkininya serta menargetkan produk apa yang kedepannya sanggup lebih berkembang atau laris dipasaran.
AKAMAI
  • Merupakan penyedia jasa akselerasi konten serta aktivitas bisnis online terkemuka.
  • Dipercaya oleh lebih menurut 2.000 organisasi buat menjadikan Internet sebagai tempat yang kondusif serta dapat diandalkan bagi mereka untuk berbisnis.
  • Memiliki platform global dengan ribuan server yang dilengkapi khusus buat membantu Internet supaya bertahan dari permintaan konten interaktif, transaksi, serta aplikasi harian yg berlebihan.
  • Menyediakan jasa pada konsumen tanpa perlu membentuk atau memasang infrastruktur.
Sebagai profesional yg ingin menaikkan performa dan reliabilitas Website, konten, serta aplikasi Anda, maka Akamai adalah rekan kerja yang tepat. Akamai mendeteksi dan menghindari masalah dan kelemahan Internet yg sering timbul buat memastikan Website tampil secara optimal, pengunduhan media dan piranti lunak tanpa gangguan, and aplikasi tampil kontinu.

Cakupan Pasar
• Jasa Keuangan
Melindungi serta melakukan transaksi untuk Charles Schwab, E*TRADE, Morgan Stanley dan institusi terkemuka lainnya. 

• Permainan
Melakukan penyampaian konten permainan buat konsol misalnya Nintendo, dan membantu poly perusahaan lain buat bertemu gamer. 

• Hotel serta Usaha Perjalanan
Menangani penyewaan online buat hotel serta travel terbesar di dunia misalnya Expedia, Marriott, serta Travelocity. 

• Manufaktur dan Otomotif
Dipercaya oleh semua pengusaha otomotif teratas – Toyota, GM, Audi, BMW, serta lainnya. 

• Media dan Hiburan
Menyediakan konten buat lima dari enam situs musik online, 29 menurut 30 perusahaan media atau hiburan.

• Sektor Publik
Melakukan operasi online untuk sepuluh berdasarkan pemerintahan pada seluruh dunia, seluruh cabang milliter AS, dan poly organisasi lainnya.

• Retail dan Barang Konsumsi
Memungkinkan $100 juta pendapatan tahunan e-commerce, dipakai sang lebih dari 85% retailer online terkemuka. 

• Piranti Lunak dan Teknologi
Digunakan sang 5 besar perusahaan anti-virus buat menyalurkan piranti lunak secara online.

Infrastruktur Akamai


Cara Kerja
Secara singkat, server Akamai akan mengambil serta menyalin konten dari klien buat kemudian disampaikan pada pengguna akhir. Klien Akamai tidak perlu menciptakan infrastruktur lantaran Akamai telah membangun sejumlah server di region dunia. Dengan memakai server Akamai, penyaluran konten kepada pengguna akhir akan lebih cepat serta akurat.

Teknologi Akamai
EdgePlatform merupakan galat satu platform komputerisasi distribusi terbesar di dunia. Jaringan EdgePlatform mempunyai lebih dari 48,000 server yang aman yang dilengkapi oleh piranti lunak yg sempurna dan dipasang di 70 negara, berdasar dalam matematika terapan serta algoritma, untuk memecahkan perkara kelebihan muatan serta kelemahan Internet.

Pendekatan EdgePlatform
Memotong Jalur Panjang
Server-server EdgePlatform ini ditempatkan pada lebih kurang 1,000 jaringan global yg memantau Internet setiap waktu. Akamai menyalin lalu menyampaikan konten serta pelaksanaan menurut server terdekat ke pengguna akhir pada semua dunia.

Optimalisasi Jalur
Akamai memetakan holistik jalur Internet buat menghindari titik masalah, kompresi konten, dan menyalin paket data supaya penyampaian pelaksanaan lebih cepat, lebih kontinu, serta lebih kondusif. 

Server Akamai
  • Tokyo: Vectant dan NTT Communications
  • Beijing: ChinaNetCenter Co Ltd
  • New York: Cable & Wireless
  • Boston: Akamai Technologies Assets
  • Hong Kong: iAdvantage
  • Singapore: EyeBlaster Ltd
  • Paris: France Telecom Long Distance
  • Malaysia: Telekom Malaysia Berhad
  • Amsterdam: Global Switch
  • Sydney: Telstra BigPond Australia serta Equinix
GOOGLE ANALYTICS
Google Analytic adalah sebuah layanan gratis dari google.com yang menyajikan warta mengenai pengunjung menurut sebuah website. Google Analytics adalah solusi analisis web tingkat perusahaan yg menaruh liputan secara rinci mengenai kunjungan situs web dan keefektifan pemasaran. Kini, fitur yang bertenaga, luwes, dan gampang dipakai menciptakan Anda dapat melihat dan menganalisis data kunjungan dengan cara baru. Dengan Google Analytics, Anda dapat membuat iklan bertarget yg lebih baik, memperkuat prakarsa pemasaran serta menciptakan situs web konversi yang lebih tinggi. Google Analytic adalah keliru satu aplikasi yang menyajikan warta output web usage mining yg menggunakan teknik laman tags.

Semua liputan tersebut tersaji dalam laporan visual yg gampang dibaca, lengkap, dan intuitif. Google Analytics tidak akan mengganggu performa atau tampilan situs Web serta tidak ada arsip tambahan yg wajib di-host pada situs Web. Dengan keterangan dari Google Analytics, pengguna bisa mengarahkan lalu lintas ke situs secara lebih efisien dan mengkonversikan kemudian lintas tersebut secara lebih efektif.

Dengan menggunakan google analytic, para pemilik website dapat menerima informasi detail tentang pengunjung, selain itu juga dapat mengetahui jumlah pengunjung perbulan, perhari dan jam-jam tertentu, dan jumlah pengunjung berdasarkan masing-masing negara atau kota, dan juga kita dapat mengetahui statistik jumlah pengunjung tiap page yg terdapat. Nah, menggunakan memakai Google Analytics ini, jumlah kunjungan ke blog atau website kita akan ditampilkan, lengkap dengan rincian-rincian lainnya, misalnya jumlah page yg dibuka visitor, judul yang paling diminati visitor, dari negara visitor, dan lain-lain.

Google Analytics menginformasikan tentang cara pengunjung menemukan serta berinteraksi menggunakan situs. Pengguna bisa membandingkan konduite serta laba pengunjung yg diarahkan berdasarkan setiap iklan, kata kunci, mesin pencari, serta email, serta menerima pemahaman yang berharga mengenai cara menyempurnakan konten serta desain situs. Apapun berukuran situs dan bagaimanapun pengguna mengarahkan lalu lintas ke situs tadi - dengan pencarian perdeo, situs kawan, AdWords, atau program biaya per klik lainnya - Google Analytics akan melacaknya, dari klik sampai konversi.

Semua berita tersebut disajikan dalam laporan visual yg mudah dibaca, lengkap, serta intuitif. Google Analytics tidak akan mengganggu performa atau tampilan situs Web serta tidak ada arsip tambahan yg harus pada-host pada situs Web.

Dengan fakta menurut Google Analytics, pengguna dapat mengarahkan lalu lintas ke situs secara lebih efisien serta mengkonversikan kemudian lintas tadi secara lebih efektif.

Cara Kerja
Cara kerja dan penggunaan Google Analytics sangatlah gampang. Cukup dengan menyisipkan kode Javascript yg telah disediakan sesudah anda menjadi anggota pengguna Google Analytics maka semua statistik page web yg telah disisipkan kode tersebut akan diproses oleh Google. Layanan ini memberi kemudahan serta keringanan kerja bagi webmaster atau pemilik situs.

Google Analytics memakai cookie dan kode JavaScript buat mengumpulkan fakta tentang pangunjung dan melacak data. Google Analytics secara anonim melacak hubungan pengunjung menggunakan situs Web, termasuk dari mereka, kegiatan mereka pada situs, dan apakah mereka merampungkan tujuan konversi situs. Analytics jua melacak data e-commerce serta menggabungkannya dengan fakta dan konversi buat memberikan pemahaman mengenai performa iklan.

Caranya:
1. Login ke Google, mampu juga pake account email @gmail.com
2. Lalu ke: www.google.com/analytics
3. Daftar disana, serta ikuti semua langkah-langkah yg terdapat, nanti dikasih kode.

Contoh Kodenya:
Catatan: Kode yg diberikan sbg model diatas JANGAN di copy paste.
Gunakan HANYA kode yang diberikan oleh Google Analytics. Nantinya kode yang diberikan akan berbeda pada yang saya kasih bold dikode.
4. Copy paste holistik kode tersebut ke Blogspot.
5. Lokasi ngopi-nya: Dashboard -> Layout -> Edit HTML
6. Pada bagian "Edit Template", scroll sampai paling bawah kolom kode-kode tsb.

Cari:
7. Tambahkan (copy paste) kode berdasarkan Google Analytics tadi persis diatas/diantara:
8. Lalu "Save Template".
9. Di akun google analyticsnya di save juga pas habis selesai pasang kode. Tunggu 24 jam setelah kode terpasang, baru akan dihitung pengunjungnya.

Catatan: Jika membarui Theme, seluruh widget yang terpasang akan hilang. Jadi wajib dipasang kembali. Caranya:
1. Masuk ke google analytics,
2. Klik “edit” dalam alamat website.
3. Klik “check status” dibagian atas.
4. Copy kembali semua kodenya, serta ditaruh ditempat yang sama seperti langkah2 diatas.

Phishing, Apa dan Bagaimana Cara Kerjanya?
Dalam ruang lingkup computer security, phishing adalah galat bentuk kejahatan elektronik pada bentuk penipuan. Dimana proses phishing ini bermaksud untuk menangkap keterangan yang sangat sensitif misalnya username, password serta detil kartu kredit pada bentuk menyaru sebagai sebuah entitas yg dapat dipercaya/ legitimate organization dan umumnya berkomunikasi secara elektronika.

Komunikasi yang digunakan ini mulai pada bentuk web site social yang sangat popular di mata masyarakat, site-site auction/ lelang, pengolah transaksi online payment atau dalam bentuk lain yang umumnya user menggunakan site tadi buat kepentingan administrasi, misalnya email site, site jejaring public, serta lainnya. Bentuk phishing yang lain adalah mengirimkan email official dan instant messaging kepada user yang umumnya menggunakan site-site legitimate serta site-site nama akbar perusahaan yg dikenal masyarakat dilengkapi menggunakan logo perusahaan, header email official sampai dengan cap serta tanda tangan keliru satu pimpinan perusahaan tersebut. 

Cukup fantastis untuk mensugesti user, tujuan menurut phishing ini beragam:
  • Pertama, hanya buat menangkap user account serta password, bertujuan untuk pendayagunaan data user serta administrator. 
  • Kedua, memberikan tawaran investasi palsu, bertujuan buat menipu.
  • Tiga, sanggup saja memberikan kabar sesat pada user, yang bertujuan buat melakukan justifikasi buruk pada perusahaan lain (black campaign). Teknik yg terakhir ini bisa dikatakan social engineering, sebuah teknik yg jarang dilakukan oleh hacker tetapi sangat ampuh buat menciptakan opini jelek pada perusahaan pesaingnya.
Teknik phishing pertama kali disampaikan dalam seminar TI pada sebuah lembaga internasional pada US oleh International HP class Interex dalam tahun 1987. Istilah phisTeknik phishing pertama kali disampaikan pada seminar TI di sebuah forum internasional pada US sang International HP group Interex dalam tahun 1987. Istilah phishing pertama kali dibukukan dan dicatat pada dua Januari tahun 1996 oleh AOL Usenet newsgroup. Istilah lain berdasarkan phishing adalah phreaking, kata ini digunakan buat menangkap kabar-informasi yang berjenis financial, namun nir begitu popular dikalangan hacker.

Berbagai Teknik Phishing
1. Social Engineering, masyarakat mempunyai sebuah reaksi terhadap insiden-kejadian penting, teknik ini sangat digdaya digunakan sang hacker buat menangkap berita-liputan penting tanpa usaha yang rumit, seperti mengirimkan header email "Bantulah Rakyat Aceh yang tertimpa Tsunami, kirimkan fakta anda sebagai volunteer", header email lain yang menyentuh "Bantulah Korban Bencana Alam Situ Gintung, kirimkan secuil harta anda kepada mereka", serta lainnya.
2. Manipulasi Link, teknik ini merupakan menyesatkan user menggunakan mengklik keliru satu URL yg ada pada email legimate yg dikirimkan sang hacker, semua email isinya orisinil menurut perusahaan yg mengirimkannya, tetapi terdapat salah satu link yg dibelokkan sang hacker yg akan menuju ke server lain yang bukan server sebenarnya (unlegitimate server). Nah, liputan user akan tertangkap oleh server palsu tadi.
3. Filter Evasion, seseorang ahli phisher/hacker akan memakai teknik ini buat menghindari jeratan/filter phishing, umumnya akan menempelkan image buat phishing, sehingga filter phishing yg dibuat sang developer tidak bisa mengetahui adanya phishing atau tidak.
4. Website Forgery, seseorang user menjadi korban yang mengunjungi website phishing tidak bisa mengetahui secara niscaya, apakah website tadi orisinil atau palsu, lantaran website akan dibuat sedemikian rupa sama dengan aslinya. Mungkin Anda masih jangan lupa masalah website palsu clickbca.com atau kilkbca.com yg dipakai buat menangkap username dan password user yang salah ketik ke situs tadi. 

Sekarang telah lebih kondusif lantaran dilengkapi token buat filtering transaksi e-banking. Teknik ini sangat digdaya dan telah lama dipakai sang hacker buat mengelabui user. Teknik ini terkenal dengan sebutan Man-in-the middle.

5. Phone Phishing, tidak seluruh serangan phishing menggunakan website palsu. Seringkali hacker menggunakan media lain yang dipakai buat phishing. Model phone phishing dipakai para hacker buat mengelabui para user, umumnya mengirimkan email yang berlogo asli bank yang dipakai sang user. 

Dengan memakai beberapa kalimat official, hacker berdalih melakukan maintenance atau menaikkan keamanan account bank user, si user dipersilahkan memasukkan pulang username serta password internet banking atau account banking, kemudian dibubuhi angka telpon administrator atau customer service sebagai heldesk problem ini. Tetapi semua fasilitasi ini merupakan palsu, dengan asa user tidak sadar tertipu dan seluruh kabar misteri bahkan mentransfer sejumlah dana pada para phone phishing tersebut.

6. Teknik phone phishing yang lain adalah menempelkan script mini ke situs-situs banking yg legitimate. Bila user nir teliti maka user akan terkena jebakan yg akan menggiring user tersebut ke sebuah situs palsu namun official. Situs ini mampu dikatakan aspal, karena user tidak menyadari sedang mengakses situs palsu di dalam situs asli.

*) Penulis merupakan IGN Mantra, Analis Senior Keamanan Jaringan serta Pemantau Trafik Internet ID-SIRTII sekaligus Dosen Keamanan Jaringan dan Cybercrime, bisa dihubungi pada email: mantra@idsirtii.or.id.

Cara Mengatasi Phishing
Phishing filter dapat diinstal pada personal komputer pengguna untuk membantu mencegah agresi phishing terjadi. Filter tadi bekerja dengan cara mengenali mana yg merupakan email absah dan yg mana yang tidak. 

Semua filter ini bekerja dengan menyediakan real-time proteksi terhadap segala jenis penipuan phishing lantaran mereka mampu mengenali situs-situs palsu saat seorang menggunakan Internet. Beberapa perusahaan seperti Microsoft sudah memiliki penyaring yang diinstal ke pada browser Internet. Anda mungkin perlu mengunduh versi terbaru dari browser buat memperolehnya.

Filter yang diinstal ke browser Internet sekali dihidupkan akan langsung memindai setiap website yg dilihat. Kemudian mereka akan melihat lebih dekat karakteristik eksklusif setiap situs serta mereka akan bisa melakukan identifikasi situs-situs yg benar dan mana yang penipuan. Begitu mereka mengidentifikasi orang-orang yang phising, kemudian mereka akan mem-blok aksesnya.

Pada masalah Citibank, buat mengatasi phishing Citibank bisa membeli domain web site palsu ketika masa berlakunya telah habis buat kemudian dialihkan ke web site resmi Citibank.

Comments