PENGERTIAN IP ADDRESS DAN FUNGSINYA LENGKAP

Pengertian IP Address dan Fungsinya - Ulasan artikel kali ini masih ada hubungannya dengan jaringan komputer yakni mengenai IP address. IP address atau alamat IP ini berkaitan menggunakan penggunaannya untuk jaringan internet yang biasa dipakai. Pada umumnya IP address ini dipakai menjadi identitas dari sebuah perangkat yang kita pakai, umumnya peng-inisialannya memakai perpaduan angka.
Fungsi IP address (internet protocol address) ini pula berkaitan dengan penggunaan DHCP (baca: fungsi dhcp) ataupun DNS server (baca: fungsi DNS server). Pada DHCP server, client umumnya akan menerima pengalamatan IP address secara otomatis, sedangkan untuk DNS server IP address digunakan buat mensetting dalam IPv4. Selain berguna buat penggunaan tools tadi, IP jua memiliki fungsi lainnya.
IP address ini juga mempunyai kelas kelasnya yang telah dikelompokkan. Tetapi, sebelum lebih jauh tahu tentang IP address, kita wajib memahami apa itu IP address? Untuk lebih jelasnya mari kita simak penjelasan mengenai definisi ip address, fungsi dan pembagian kelasnya dibawah ini.

Pengertian IP Address, Fungsi serta Kelas IP Address Lengkap

Pengertian IP Address pada Jaringan Internet

Apa yg dimaksud IP address? IP Address adalah sebuah gugusan angkat biner mulai berdasarkan 32 bit - 128 bit yang digunakan buat pengidentifikasian tiap perangkat hostname (personal komputer /laptop) dalam jaringan internet. Jenis ip address IPv4 atau dikenal menggunakan internet protocol version 4 menggunakan gugusan nomor 32 bit, sedangkan jenis ip adress IPv6 atau internet protocol version 6 menggunakan deret nomor 128 bit.
Alamat IP address tiap hostname ini berbentuk unik, serta tiap perangkat mempunyai ip address yang bhineka. Jadi, apabila anda mempunyai 2 buah laptop, maka ke 2 butir laptop itu mempunyai ip address sendiri-sendiri. Bisa dibilang punya nama sendiri-sendiri.

Fungsi IP Address dalam Jaringan

Apa fungsi IP Address? Nah, sesudah mengetahui definisi ip adress, selanjutnya mari kita simak penjelasan di bawah ini mengenai kegunaan IP address. IP Address ini memiliki 2 fungsi yakni sebagai bukti diri dan sebagai alamat lokasi hostname.

1. IP Address menjadi Identitas

Fungsi IP address sebagai bukti diri erat kaitannya pada penamaan sebuah perangkat (hostname). Ibaratnya manusia mempunyai nama yang digunakan menjadi bukti diri. Cuman pada komputer atau host penamaan ini berupa nomor biner antara 32 bit-128 bit.

2. IP Address menjadi Alamat atau Lokasi sebuah Host

Fungsi IP address lainnya yakni menjadi alamat atau lokasi sebuah host berada. Fungsi inilah yg paling poly digunakan umumnya untuk mentransfer data atau sebuah file baik itu melalui penggunaan DHCP server, penggunaan DNS serta sebagainya.
Anda mau mengetahui berapa IP address anda? Coba cek disini : //whatismyipaddress.com/

Pembagian Kelas IP Address

Berdasarkan tabel di atas, pembagian kelas ip address dapat kita lihat dengan seksama yakni :

Kelas A

Kelas IP address tipe A ini terdiri berdasarkan 8 bit dipakai buat network ID serta 24 bit buat host ID. Oktet pertama mulai berdasarkan nomor 1-126, bit pertama 0 (nol), serta jumlah network 126 serta jumlah ip address 16juta lebih.

Kelas B

Kelas IP address tipe B ini terdiri menurut 16 bit buat network ID dan 16 bit buat host ID. Oktet pertama mulai menurut nomor 128-191, dua bit pertama 10, jumlah network 16ribuan lebih serta jumlah ip address 65ribuan lebih.

Kelas C

Kelas IP address tipe C terdiri menurut 24 bit buat network ID dan 8 bit buat host ID. Untuk tiga bit pertama merupakan 110, oktet pertama 192-223, jumlah network 2jutaan lebih serta jumlah ip address 254.

Kelas D

Kelas IP address tipe D ini tidak mengenal network ID atau host ID lantaran mempunyai sistem multicasting. Untuk bit pertama adalah 1110, oktet pertama 224-239, bit cadangan 18 bit sedangkan bit-bit lainnya mampu diatur sesuai keperluan multicast pada grupnya.

Kelas E

Kelas IP address tipe D ini tidak mengenal network ID atau host ID karena mempunyai sistem multicasting. Untuk bit pertama adalah 11110, oktet pertama 240-255, pada kelas E ini umumnya dipakai menjadi ruang alamat cadangan buat percobaan/eksperimental.
Demikian ulasan jaringan personal komputer tentang pengertian ip address, fungsi serta kelas kelasnya lengkap. Dengan ini semoga pemahaman anda sanggup lebih mendalam tentang jaringan komputer. Masih terdapat banyak sekali gosip tentang pandan komputer laptop yg akan kami share disini. Tunggu update terkini artikel-artikel berdasarkan kami. Terima kasih

PENGERTIAN DAN FUNGSI CLUSTER DATABASE

Pengertian Dan Fungsi Cluster Database
Clustering adalah proses mengelompokkan objek berdasarkan warta yang diperoleh menurut data yg mengungkapkan interaksi antar objek menggunakan prinsip buat memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kecenderungan antar kelas/cluster. Tujuannya menemukan cluster yang berkualitas pada waktu yg layak. Clustering dalam data mining berguna buat menemukan pola distribusi di dalam sebuah data set yg bermanfaat buat proses analisa data. Kesamaan objek umumnya diperoleh dari kedekatan nilai-nilai atribut yang menjelaskan objek-objek data, sedangkan objek-objek data biasanya direpresentasikan sebagai sebuah titik pada ruang multidimensi. 

Clustering adalah suatu indera buat analisa data, yang memecahkan permasalahan penggolongan.
Obyek nya adalah buat perkara pendistribusian (orang-orang, objek, insiden dll.) ke dalam kelompok, sedemikian sebagai akibatnya derajat tingkat keterhubungan antar anggota cluster yg sama merupakan bertenaga dan lemah antar anggota dari cluster yang tidak sama. Dengan Cara ini masing-masing cluster menguraikan, pada kaitan dengan perpaduan/koleksi data, class dimana milik anggota-anggotanya. 
Cluster : Data item dikelompokkan berdasarkan pilihan konsumen atau hubungan logis. Sebagai model, data bisa dimaknakan buat mengidentifikasi segmen pasar atau ketertarikan konsumen. 
Hasil berdasarkan analisis cluster mungkin berperan buat definisi berdasarkan suatu rencana penggolongan yang formal, seperti suatu taksonomi untuk binatang yg terkait, serangga atau tanaman ; atau menyarankan contoh statistik yg menguraikan populasi; atau menandai anggaran buat menugaskan kasus yg baru ke group buat identifikasi serta tujuan yang diagnostik; atau menyediakan berukuran dari definisi, berukuran serta perubahan dalam konsep sebelumnya yg nir hanya luas. Bisnis apapun yg sedang anda lakukan, cepat atau lambat anda akan berhadapan dengan suatu masalah penggolongan. 

Dengan menggunakan clustering, bisa diidentifikasi wilayah yg padat, pola-pola distribusi secara keseluruhan dan keterkaitan yang menarik antara atribut-atribut data. Dalam data mining usaha difokuskan dalam metode-metode inovasi buat cluster dalam basisdata berukuran besar secara efektif dan efisien. Banyaknya pendekatan clustering menyulitkan dalam menentukan ukuran kualitas yang universal. Tetapi, beberapa hal yang perlu diperhatikan merupakan input parameter yang tidak menyulitkan user, cluster output yg dapat dianalisa, dan skalabilitas terhadap penambahan berukuran dimensi dan record dataset. Secara garis akbar terdapat beberapa kategori prosedur pemecahan clustering yg dikenal yaitu:
  • Metode Partisi, dimana pemakai harus menentukan jumlah k partisi yg diinginkan kemudian setiap data dites buat dimasukkan pada salah satu partisi sebagai akibatnya tidak terdapat data yg overlap serta satu data hanya memiliki satu cluster. Contohnya: prosedur pemecahan K-Means. 
  • Metode Hierarki, yg menghasilkan cluster yg bersarang merupakan suatu data bisa memiliki cluster lebih menurut satu. Metode ini terbagi sebagai 2 yaitu buttom-up yg menggabungkan cluster kecil menjadi cluster lebih besar dan top-down yg memecah cluster akbar menjadi cluster yang lebih kecil. Kelemahan metode ini merupakan apabila keliru satu penggabungan/pemecahan dilakukan pada tempat yang keliru, nir akan didapatkan cluster yg optimal. Contohnya: Agglomerative (FINDIT, PROCLUS), Divisive Hierarchical Clustering (CLIQUE, MAFIA, ENCLUE). 
Subspace Clustering
Subspace clustering merupakan suatu teknik clustering yang mencoba menemukan cluster pada dataset multidimensi menggunakan pemilihan dimensi yg paling relevan buat setiap cluster, lantaran dalam data multidimensi kemungkinan masih ada dimensi-dimensi yang nir relevan yg dapat membingungkan prosedur pemecahan clustering sehingga mampu mengaburkan cluster sebenarnya yg seharusnya bisa ditemukan.

Masalah lainnya, cluster dapat saja berada dalam subspace yang tidak selaras, dimana setiap subspace dibentuk menurut kombinasi dimensi yang bhineka. Akibatnya, semakin banyak dimensi yang dipakai, cluster akan sulit ditemukan. Subspace clustering secara otomatis akan menemukan unit-unit yg padat pada tiap subspace. Pada Gambar diatas, mengilustrasikan bagaimana peningkatan jumlah dimensi menyebabkan terpecahnya titik dalam dataset. 

Cara yg telah dikenal buat mengatasi peningkatan jumlah dimensi merupakan menggunakan teknik reduksi dimensi atau feature selection. Dengan cara ini, dimensionalitas dataset dikurangi dengan menghilangkan beberapa dimensi, pendekatan ini membuahkan dalam hilangnya beberapa liputan dan sekaligus mengurangi efektifitas inovasi cluster yang mungkin melibatkan dimensi yg dihilangkan tersebut. Jika konsep ini diterapkan dalam masalah di Gambar di bawah, membuahkan hilangnya satu atau dua cluster yg seharusnya ada, lantaran masingmasing dimensi sebagai bagian dari satu buah cluster. 

Misalnya ada suatu dataset tiga-dimensi yg memiliki dua cluster, satu cluster berada pada bidang (x, y) dan (x, z). Untuk dataset misalnya ini, metode reduksi dimensi dan feature selection nir mampu memperoleh pulang semua struktur cluster, lantaran setiap dimensi adalah keliru satu subspace cluster yg terbentuk. Dengan memakai metode subspace clustering, dua cluster yang terbentuk pada Gambar dua-tiga dibutuhkan dapat diperoleh lantaran teknik clustering ini dapat menemukan cluster menggunakan subspace yang berbeda dalam dataset. Berdasarkan taktik pencariannya algoritma susbsapce clustering dapat dikatagorikan ke pada dua kategori yaitu metode top down search iterative serta metode bottom up search grid based. Algoritma MAFIA termasuk prosedur pemecahan yg menggunakan taktik metode bottom up search grid based.
Lemma 1 (monotonicity): 

Jika formasi titik S merupakan cluster pada ruang dimensi–k maka S juga adalah bagian suatu cluster pada ruang proyeksi dimensi-(k-1) Penjelasan:

Suatu cluster C yang berdimensi-k memasukkan titik yang jatuh di dalam campuran dense unit berdimensi-k yg masing-masing memiliki selectivity minimal. Proyeksi setiap unit u dalam C wajib mempunyai selectivity minimal agar bersifat padat. Karena semua unit dalam cluster terhubung, maka proyeksinya juga terhubung. Artinya, proyeksi titik pada cluster C yang berdimensi-k juga berada pada cluster yg sama pada proyeksi dimensi (k-1). Algoritma diproses level demi level. Pertama-tama, menentukan calon dense unit berdimensi 1 menggunakan melakukan pass over data. Setelah menentukan dense unit berdimensi-k-1, calon dense unit berdimensi-k ditentukan dengan menggunakan prosedur candidate generation. Algoritma berhenti jika nir ada dense unit yg dibangkitkan. Prosedur candidat generation menyatakan Dk-1 menjadi formasi dense unit berdimensi (k-1). Prosedur ini mengembalikan superset gugusan calon dense unit berdimensi-k yang akan pada bandingkan menggunakan density treshold apakah layak atau tidak dipakai menjadi penentu cluster.

Berbeda menggunakan association rule mining dan classification dimana kelas data sudah ditentukan sebelumnya, clustering melakukan penge-lompokan data tanpa dari kelas data eksklusif. Bahkan clustering bisa dipakai buat menaruh label pada kelas data yang belum diketahui itu. Karena itu clustering seringkali digolongkan menjadi metode unsupervised learning. Prinsip berdasarkan clustering adalah memaksimalkan kecenderungan antar anggota satu kelas serta meminimumkan kesamaan antar kelas/cluster. 

Clustering bisa dilakukan dalam data yan mempunyai beberapa atribut yang dipetakan sebagai ruang multidimensi. Banyak algoritma clustering memerlukan fungsi jeda buat mengukur kemiripan antar data, diperlukan juga metode untuk normalisasi bermacam atribut yang dimiliki data. Beberapa kategori prosedur pemecahan clustering yg banyak dikenal merupakan metode partisi dimana pemakai harus memilih jumlah k partisi yg diinginkan lalu setiap data dites buat dimasukkan dalam keliru satu partisi, metode lain yg sudah usang dikenal adalah metode hierarki yang terbagi dua lagi : bottom-up yg menggabungkan cluster mini sebagai cluster lebih akbar serta top-down yang memecah cluster akbar menjadi cluster yang lebih mini .

Kelemahan 3 metode ini merupakan apabila apabila salah satu penggabungan/pemecahan dilakukan dalam loka yg keliru, nir dapat didapatkan cluster yg optimal. Pendekatan yg poly diambil adalah menggabungkan metode hierarki dengan metode clustering lainnya seperti yg dilakukan sang Chameleon. Akhir-akhir ini dikembangkan juga metode berdasar kepadatan data, yaitu jumlah data yg ada pada sekitar suatu data yang sudah teridentifikasi pada suatu cluster. Jika jumlah data pada jangkauan tertentu lebih besar berdasarkan nilai ambang batas, data-data tsb dimasukkan pada cluster. Kelebihan metode ini merupakan bentuk cluster yg lebih fleksibel. Algoritma yang populer adalah DBSCAN.

Cluster digunakan buat menerima high availability dan scalability.
Pada high available cluster, bisa digunakan failover database cluster, dimana hanya terdapat satu node yang aktif melayani user, sedangkan node lainnya standby. Storage yg digunakan mempunyai koneksi ke setiap node dalam cluster, sehingga jika primary node meninggal, database engine, listener process, serta logical host ip address akan dijalankan dalam secondary node tanpa perlu menunggu operating system boot, sehingga downtime bisa diminimalisasi. High availability mempunyai standard uptime 99.999 persen, atau hanya boleh meninggal selama lima mnt dalam setahun. Beberapa contoh aplikasi yg dapat digunakan buat membuat HA cluster merupakan Sun Cluster dan Veritas Cluster.

Pada scalable cluster, digunakan produk Oracle RAC, dimana setiap node aktif melayani user, sehingga diperoleh performa yg semakin baik menggunakan menggunakan lebih banyak node. Sun cluster bisa dipakai hingga 16 node, sedangkan Veritas Storage Foundation for Oracle RAC sanggup sampai 32 node. Apabila terdapat node yg meninggal, tentu akan menurunkan performa, tetapi nir terjadi down time. Pada scalable cluster, semua node bisa terhubung secara pribadi ke shared storage, namun bisa juga tidak memiliki koneksi fisik ke storage, melainkan melalui private cluster transport.

Teknologi Cluster
Kebutuhan akan komunikasi data dewasa ini sangat krusial seiring menggunakan kemajuan dan perkembangan teknologi komunikasi data yang semakin sophisticated. Hal yang sangat penting bagi Teknologi komunikasi data merupakan database menjadi penyedia data. Aplikasi-aplikasi database dituntut buat sanggup melayani banyak akses data. Hal ini bisa dimaklumi karena database server sudah di rancang buat dapat melayani beragam jenis akses data. Saat ini aplikasi databse semakin berkembang, baik dalam hal kegunaan, berukuran, juga kompleksitas. Hal ini secara pribadi akan berdampak dalam server database menjadi penyedia layanan terhadap akses databse, konsekuensi menurut semua itu merupakan beban databse server akan semakin bertambah berat serta menyebabkan kurang optimalnya kinerja dari server tadi. Oleh sebab itu, diperlukan perancangan yang sempurna dan handal pada membangun databse server. Solusi mudah serta tepat yang dapat diterapkan untuk mengatasi perseteruan diatas antara lain dengan penerapan Teknologi Cluster. 

Banyak sekali manfaat yang diperoleh dari teknologi cluster diantaranya menaikkan ketersediaan dan performansi system. Pada server database yg besar pada pelayanannya nir menggunakan server databse tunggal, tetapi dilayani sang sekelompok server database, beberapa buah server databse dihubungkan menjadi satu dalam lingkungan yg sangat kompleks. Arsitektur yang dipakai harus mengklaim bahwa sistem bekerja dengan baik, setiap server mengerjakan beban semestinya, serta nir terdapat bottleneck. Berbagai jenis server diikat menjadi satu untuk berakibat suatu pelayanan tunggal (one stop shopping). Database tercluster tadi bisa dianggap personal desktop atau database tunggal bagi penggunanya. 

Database dalam masa kini ini dituntut supaya bisa berjalan dengan cepat dan memiliki kehandalan yg tinggi, Dengan clustering ini database yang disimpan dapat terbagi ke beberapa mesin dan dalam waktu aplikasi berjalan, semua mesin yang menyimpan data tersebut dianggap sebagai satu kesatuan. Metode clustering misalnya ini sangat baik buat load balancing serta penanganan system failure lantaran kemampuan tiap mesin akan digunakan serta jika terdapat keliru satu mesin yang mengalami failure maka sistem tidak akan eksklusif terganggu lantaran mesin lain akan tetap berfungsi. Kemampuan clustering memungkinkan sebuah database permanen hayati dalam waktu yang usang. MySQL berani menjanjikan nomor 99.999 % ketersediaan databasenya. Sederhananya, pada satu tahun kira-kira hanya lima mnt ketika database itu tidak hidup.

MySQL Cluster
MySQL Cluster memakai mesin penyimpanan cluster NDB baru yg bisa menjalankan beberapa MySQL Server di pada sebuah cluster. Mesin penyimpanan cluster NDB tersedia pada dalam BitKepper menurut MySQL release 4.1.dua serta pada dalam binary releases berdasarkan MySQL-Max 4.1.3. System operasi yang didukung adalah Linux, Mac OS X, serta Solaris, pihak MySQL sedang menciptakan/menyebarkan supaya cluster NDBdapat berjalan pada semua system operasi yg didukung sang MySQL termasuk Windows.

Overview
MySQL Cluster adalah sebuah teknologi baru buat memungkinkan clustering di dalam memory database pada sebuah sistem share-nothing. Arsitektur share-nothing mengijinkan sistem bisa bekerja dengan hardware/perangkat keras yang sangat murah, dan nir membutuhkan perangkat keras dan lunak dengan spesifikasi spesifik. Arsitektur tadi jua handal karena masing-masing komponen mempunyai memory serta disk tersendiri. MySQL Cluster menggabungkan MySQL Server biasa menggunakan sebuah mesin penyimpanan in-memory tercluster yg dinamakan NDB. NDB berarti bagian berdasarkan suatu rangkaian yang dikhususkan sebagai mesin penyimpanan, sedangkan MySQL Cluster diartikan sebagai kombinasi atau campuran berdasarkan MySQL dan mesin penyimpanan yg baru tadi.

Sebuah MySQL Cluster terdiri dari sekumpulan personal komputer , masing-masing menjalankan sejumlah proses meliputi beberapa MySQL server, node-node penyimpanan buat cluster NDB, server-server manajemen dan program-acara pengakses data yg spesifik. Semua acara-acara tadi bekerja bersama-sama buat menciptakan MySQL Cluster. Ketika data disimpan pada pada mesin penyimpan media NDB cluster, tabel-tabel disimpan didalam node-node penyimpanan pada NDB Cluster. Tabel-tabel seperti itu bisa diakses secara eksklusif menurut seluruh MySQL server yg lain di dalam cluster tersebut. Dengan cara demikian, sebuah pelaksanaan daftargaji menyimpan data pada pada sebuah cluster, apabila sebuah pelaksanaan mengupdate/memperbaharui gaji seseorang karyawan, semua MySQL server yg lain yg meminta data ini dapat melihat perubahannya dengan seketika.

Data yang disimpan pada dalam node-node penyimpanan pada MySQL Cluster bisa di mirror (dicerminkan), cluster tadi bisa menangani kegagalan berdasarkan node-node penyimpanan individual menggunakan nir terdapat efek lain berdasarkan sejumlah transaksi dilarang lantaran kegagalan proses transaksi. Sejak pelaksanaan buat proses-proses transaksi diharapkan mampu menangani kegagalan transaksi, ini seluruh tidak seharusnya menjadi sumber konflik. Dengan memperkenalkan MySQL Cluster dalam dunia open source, MySQL menciptakan manajemen data cluster menggunakan ketersediaan yg tinggi, perfomance yg tinggi serta skalabilitas ketersediaan buat siapa saja yang memerlukannya.

Dasar konsep-konsep MySQL Cluster
NDB adalah sebuah mesin penyimpanan memory yg memperlihatkan ketersediaan yang tinngi dan fitur-fitur persistensi data. Mesin penyimpanan NDB dapat diatur dengan sebuah bidang failover serta pilihan-pilhan load-balancing, namun untuk memulai paling mudah dengan mesin penyimpanan pada level cluster. Mesin penyimpanan NDB dalam MySQL Cluster berisi sebuah deretan lengkap dari data, bergantung hanya dalam data lainnya di dalam cluster itu sendiri. Sekarang akan diuraikan bagaimana mengatur sebuah MySQL Cluster yang terdiri dari sebuah mesin penyimpanan NDB serta beberapa MySQL server. Sebagian berdasarkan MySQL Cluster dikonfigurasi nir tergantung/bebas dari server-server MySQL yang lain. Di dalam MySQL Cluster, masing-masing bagian dari cluster dianggap menjadi sebuah node.

Analisis Cluster (Lanjutan)
Clustering serta segmentasi sebenarnya mempartisi database, karena itu setiap partisi atau class adalah sama menurut kriteria atau metrik eksklusif. Jika pengukuran kesamaan tersedia, maka terdapat sejumlah teknik buat menciptakan cluster. Kebanyakan aplikasi2 data mining memakai clusteing menurut similarity (kecenderungan), misalnya segmentasi basis klien. Clustering dari optimasi menurut sekumpulan fungsi-fungsi digunakan dalam analisis data, contohnya waktu mensetting tarif iuran pertanggungan klien bisa disegmentasi menurut sejumlah parameter. Contoh aplikasi :
  • Perangkat ‘stand-alone’ : explore data distribution
  • Langkah preprocessing buat prosedur pemecahan lain
  • Pengenalan pola, analisis data spasial, sosialisasi citra, market research, WWW, …
  • clustering dokumen
  • clustering data log web buat mendapatkan group dengan pola akses yg sama
Penggelompokkan data ke cluster
  • Data yang sama satu sama lain berada pada cluster yg sama
  • Yang tidak sama berada pada cluster lain
  • ‘Unsupervised learning’: klas yang belum ditentukan
Clustering Yang Baik
Intraclass similarity (Kesamaan pada pada klas) yg tinggi serta interclass similarity (kesamaan antar klas) yang rendah bergantung pada pengukuran kesamaan 
Kemampuan buat menerima beberapa atau seluruh pola yg tersembunyi 

Kebutuhan Clustering
Scalability : Kemampuan mengerjakan atribut2 berdasarkan aneka macam tipe 
Penemuan clusters dengan bentuk yang tidak tentu 
Kebutuhan minimal buat pengetahuan domain buat menentukan parameter input 
Dapat menerima noise dan outlier 
Tidak mengindahkan susunan record dari input 
Dimensi yang tinggi 
Menyatu dengan batasan yang dispesifikasikan oleh user 
Interpretability and usability 

Tipe-tipe Data dalam Clustering
Variabel berskala interval 
Variabel biner 
Variabel nominal, ordinal dan rasio 
Variable berdasarkan banyak sekali tipe variable 

Kategori Pendekatan Clustering
Algoritma Partisi 
Mempartisi objek2 ke dalam k cluster 
Realokasi objek2 secara iteratif buat memperbaiki clustering 

Algoritma Hirarkis
  • Agglomerative: setiap objek adalah cluster, adonan dari cluster-cluster membangun cluster yg besar
  • Divisive: seluruh objek berada pada suatu cluster, pembagian cluster tersebut membangun cluster2 yang kecil
Metode berbasis densitas
  • Berbasis koneksitas dan fungsi densitas
  • Noise disaring, lalu temukan cluster pada bentuk sembarang
  • Metode berbasis grid
  • Kuantisasi ruang objek ke dalam struktur grid

Berbasis Model
  • Gunakan model buat menemukan keadaan data yang baik.

PENGERTIAN DAN FUNGSI CLUSTER DATABASE

Pengertian Dan Fungsi Cluster Database
Clustering adalah proses mengelompokkan objek menurut warta yang diperoleh dari data yang menyebutkan hubungan antar objek menggunakan prinsip buat memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas/cluster. Tujuannya menemukan cluster yang berkualitas pada saat yg layak. Clustering dalam data mining bermanfaat buat menemukan pola distribusi di pada sebuah data set yg bermanfaat buat proses analisa data. Kesamaan objek biasanya diperoleh menurut kedekatan nilai-nilai atribut yg menjelaskan objek-objek data, sedangkan objek-objek data umumnya direpresentasikan menjadi sebuah titik dalam ruang multidimensi. 

Clustering merupakan suatu indera buat analisa data, yang memecahkan perseteruan penggolongan.
Obyek nya adalah buat kasus pendistribusian (orang-orang, objek, insiden dll.) ke dalam grup, sedemikian sebagai akibatnya derajat taraf keterhubungan antar anggota cluster yang sama adalah bertenaga dan lemah antar anggota berdasarkan cluster yg tidak sinkron. Dengan Cara ini masing-masing cluster menguraikan, dalam kaitan dengan formasi/koleksi data, class dimana milik anggota-anggotanya. 
Cluster : Data item dikelompokkan dari pilihan konsumen atau interaksi logis. Sebagai model, data dapat dimaknakan untuk mengidentifikasi segmen pasar atau ketertarikan konsumen. 
Hasil menurut analisis cluster mungkin berperan buat definisi menurut suatu rencana penggolongan yg formal, seperti suatu taksonomi buat hewan yang terkait, serangga atau tanaman ; atau menyarankan model statistik yg menguraikan populasi; atau menandai anggaran buat menugaskan perkara yang baru ke group buat identifikasi dan tujuan yg diagnostik; atau menyediakan berukuran dari definisi, berukuran serta perubahan pada konsep sebelumnya yang nir hanya luas. Bisnis apapun yg sedang anda lakukan, cepat atau lambat anda akan berhadapan menggunakan suatu perkara penggolongan. 

Dengan menggunakan clustering, bisa diidentifikasi wilayah yang padat, pola-pola distribusi secara keseluruhan serta keterkaitan yang menarik antara atribut-atribut data. Dalam data mining usaha difokuskan dalam metode-metode penemuan buat cluster dalam basisdata ukuran besar secara efektif serta efisien. Banyaknya pendekatan clustering menyulitkan pada memilih ukuran kualitas yang universal. Tetapi, beberapa hal yg perlu diperhatikan adalah input parameter yang tidak menyulitkan user, cluster hasil yang dapat dianalisa, dan skalabilitas terhadap penambahan berukuran dimensi serta record dataset. Secara garis akbar ada beberapa kategori prosedur pemecahan clustering yang dikenal yaitu:
  • Metode Partisi, dimana pemakai harus memilih jumlah k partisi yg diinginkan lalu setiap data dites buat dimasukkan pada salah satu partisi sebagai akibatnya tidak ada data yang overlap dan satu data hanya memiliki satu cluster. Contohnya: algoritma K-Means. 
  • Metode Hierarki, yang menghasilkan cluster yg bersarang adalah suatu data dapat mempunyai cluster lebih dari satu. Metode ini terbagi menjadi dua yaitu buttom-up yg menggabungkan cluster kecil sebagai cluster lebih akbar dan top-down yang memecah cluster besar sebagai cluster yang lebih mini . Kelemahan metode ini adalah bila keliru satu penggabungan/pemecahan dilakukan dalam tempat yg galat, nir akan dihasilkan cluster yang optimal. Contohnya: Agglomerative (FINDIT, PROCLUS), Divisive Hierarchical Clustering (CLIQUE, MAFIA, ENCLUE). 
Subspace Clustering
Subspace clustering merupakan suatu teknik clustering yang mencoba menemukan cluster dalam dataset multidimensi menggunakan pemilihan dimensi yang paling relevan buat setiap cluster, karena dalam data multidimensi kemungkinan terdapat dimensi-dimensi yang tidak relevan yang dapat membingungkan algoritma clustering sebagai akibatnya mampu mengaburkan cluster sebenarnya yang seharusnya dapat ditemukan.

Masalah lainnya, cluster bisa saja berada dalam subspace yang tidak selaras, dimana setiap subspace dibuat menurut kombinasi dimensi yang bhineka. Akibatnya, semakin poly dimensi yg digunakan, cluster akan sulit ditemukan. Subspace clustering secara otomatis akan menemukan unit-unit yang padat dalam tiap subspace. Pada Gambar diatas, mengilustrasikan bagaimana peningkatan jumlah dimensi menyebabkan terpecahnya titik dalam dataset. 

Cara yang sudah dikenal buat mengatasi peningkatan jumlah dimensi merupakan menggunakan teknik reduksi dimensi atau feature selection. Dengan cara ini, dimensionalitas dataset dikurangi menggunakan menghilangkan beberapa dimensi, pendekatan ini menjadikan dalam hilangnya beberapa liputan serta sekaligus mengurangi efektifitas penemuan cluster yg mungkin melibatkan dimensi yang dihilangkan tersebut. Apabila konsep ini diterapkan dalam masalah di Gambar di bawah, membuahkan hilangnya satu atau dua cluster yang seharusnya ada, lantaran masingmasing dimensi menjadi bagian berdasarkan satu butir cluster. 

Misalnya terdapat suatu dataset tiga-dimensi yg memiliki 2 cluster, satu cluster berada di bidang (x, y) serta (x, z). Untuk dataset seperti ini, metode reduksi dimensi serta feature selection tidak mampu memperoleh balik seluruh struktur cluster, karena setiap dimensi adalah salah satu subspace cluster yang terbentuk. Dengan memakai metode subspace clustering, 2 cluster yg terbentuk pada Gambar dua-3 dibutuhkan bisa diperoleh lantaran teknik clustering ini bisa menemukan cluster dengan subspace yg tidak sama dalam dataset. Berdasarkan taktik pencariannya prosedur pemecahan susbsapce clustering dapat dikatagorikan ke dalam 2 kategori yaitu metode top down search iterative dan metode bottom up search grid based. Algoritma MAFIA termasuk prosedur pemecahan yg memakai taktik metode bottom up search grid based.
Lemma 1 (monotonicity): 

Jika gugusan titik S merupakan cluster pada ruang dimensi–k maka S pula merupakan bagian suatu cluster pada ruang proyeksi dimensi-(k-1) Penjelasan:

Suatu cluster C yang berdimensi-k memasukkan titik yang jatuh pada pada adonan dense unit berdimensi-k yang masing-masing memiliki selectivity minimal. Proyeksi setiap unit u dalam C wajib memiliki selectivity minimal agar bersifat padat. Lantaran seluruh unit pada cluster terhubung, maka proyeksinya pula terhubung. Artinya, proyeksi titik pada cluster C yang berdimensi-k juga berada pada cluster yang sama dalam proyeksi dimensi (k-1). Algoritma diproses level demi level. Pertama-tama, memilih calon dense unit berdimensi 1 dengan melakukan pass over data. Setelah menentukan dense unit berdimensi-k-1, calon dense unit berdimensi-k ditentukan dengan memakai mekanisme candidate generation. Algoritma berhenti jika tidak terdapat dense unit yang dibangkitkan. Prosedur candidat generation menyatakan Dk-1 menjadi kumpulan dense unit berdimensi (k-1). Prosedur ini mengembalikan superset gugusan calon dense unit berdimensi-k yg akan pada bandingkan menggunakan density treshold apakah layak atau nir digunakan sebagai penentu cluster.

Berbeda dengan association rule mining dan classification dimana kelas data sudah ditentukan sebelumnya, clustering melakukan penge-lompokan data tanpa menurut kelas data eksklusif. Bahkan clustering bisa digunakan buat memberikan label pada kelas data yang belum diketahui itu. Lantaran itu clustering tak jarang digolongkan sebagai metode unsupervised learning. Prinsip berdasarkan clustering adalah memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas/cluster. 

Clustering dapat dilakukan pada data yan memiliki beberapa atribut yang dipetakan sebagai ruang multidimensi. Banyak prosedur pemecahan clustering memerlukan fungsi jeda buat mengukur kemiripan antar data, dibutuhkan pula metode buat normalisasi bermacam atribut yang dimiliki data. Beberapa kategori algoritma clustering yang banyak dikenal merupakan metode partisi dimana pemakai harus memilih jumlah k partisi yg diinginkan lalu setiap data dites buat dimasukkan dalam keliru satu partisi, metode lain yg telah usang dikenal merupakan metode hierarki yg terbagi dua lagi : bottom-up yang menggabungkan cluster kecil sebagai cluster lebih akbar dan top-down yang memecah cluster akbar sebagai cluster yg lebih mini .

Kelemahan tiga metode ini merupakan jika jika salah satu penggabungan/pemecahan dilakukan pada tempat yg keliru, tidak bisa didapatkan cluster yg optimal. Pendekatan yg banyak diambil merupakan menggabungkan metode hierarki dengan metode clustering lainnya seperti yang dilakukan oleh Chameleon. Akhir-akhir ini dikembangkan pula metode berdasar kepadatan data, yaitu jumlah data yang ada di sekitar suatu data yang sudah teridentifikasi pada suatu cluster. Jika jumlah data pada jangkauan tertentu lebih besar berdasarkan nilai ambang batas, data-data tsb dimasukkan dalam cluster. Kelebihan metode ini merupakan bentuk cluster yg lebih fleksibel. Algoritma yang terkenal merupakan DBSCAN.

Cluster dipakai buat mendapatkan high availability dan scalability.
Pada high available cluster, bisa dipakai failover database cluster, dimana hanya ada satu node yang aktif melayani user, sedangkan node lainnya standby. Storage yang dipakai mempunyai koneksi ke setiap node dalam cluster, sehingga jika primary node mangkat , database engine, listener process, serta logical host ip address akan dijalankan dalam secondary node tanpa perlu menunggu operating system boot, sehingga downtime dapat diminimalisasi. High availability mempunyai standard uptime 99.999 persen, atau hanya boleh mati selama lima menit dalam setahun. Beberapa model aplikasi yg bisa dipakai buat menciptakan HA cluster adalah Sun Cluster dan Veritas Cluster.

Pada scalable cluster, digunakan produk Oracle RAC, dimana setiap node aktif melayani user, sebagai akibatnya diperoleh performa yg semakin baik dengan memakai lebih poly node. Sun cluster dapat dipakai hingga 16 node, sedangkan Veritas Storage Foundation for Oracle RAC mampu sampai 32 node. Apabila ada node yg mangkat , tentu akan menurunkan performa, tetapi nir terjadi down time. Pada scalable cluster, seluruh node dapat terhubung secara pribadi ke shared storage, namun dapat pula nir mempunyai koneksi fisik ke storage, melainkan melalui private cluster transport.

Teknologi Cluster
Kebutuhan akan komunikasi data dewasa ini sangat krusial seiring menggunakan kemajuan dan perkembangan teknologi komunikasi data yang semakin canggih. Hal yang sangat krusial bagi Teknologi komunikasi data adalah database sebagai penyedia data. Aplikasi-aplikasi database dituntut buat mampu melayani poly akses data. Hal ini dapat dimaklumi lantaran database server sudah di rancang buat bisa melayani beragam jenis akses data. Saat ini aplikasi databse semakin berkembang, baik pada hal kegunaan, berukuran, maupun kompleksitas. Hal ini secara eksklusif akan berdampak dalam server database sebagai penyedia layanan terhadap akses databse, konsekuensi dari semua itu adalah beban databse server akan semakin bertambah berat serta menyebabkan kurang optimalnya kinerja dari server tadi. Oleh karena itu, dibutuhkan perancangan yang tepat serta handal dalam menciptakan databse server. Solusi mudah serta tepat yg dapat diterapkan buat mengatasi pertarungan diatas antara lain dengan penerapan Teknologi Cluster. 

Banyak sekali manfaat yang diperoleh menurut teknologi cluster antara lain menaikkan ketersediaan dan performansi system. Pada server database yang besar dalam pelayanannya tidak memakai server databse tunggal, tetapi dilayani oleh sekelompok server database, beberapa butir server databse dihubungkan sebagai satu pada lingkungan yang sangat kompleks. Arsitektur yg digunakan harus menjamin bahwa sistem bekerja menggunakan baik, setiap server mengerjakan beban semestinya, dan nir ada bottleneck. Berbagai jenis server diikat sebagai satu buat berakibat suatu pelayanan tunggal (one stop shopping). Database tercluster tersebut dapat dipercaya personal desktop atau database tunggal bagi penggunanya. 

Database dalam masa kini ini dituntut agar bisa berjalan dengan cepat dan memiliki kehandalan yg tinggi, Dengan clustering ini database yg disimpan bisa terbagi ke beberapa mesin serta dalam ketika aplikasi berjalan, semua mesin yang menyimpan data tersebut dianggap sebagai satu kesatuan. Metode clustering seperti ini sangat baik buat load balancing serta penanganan system failure lantaran kemampuan tiap mesin akan dipakai dan apabila terdapat galat satu mesin yang mengalami failure maka sistem tidak akan langsung terganggu lantaran mesin lain akan permanen berfungsi. Kemampuan clustering memungkinkan sebuah database permanen hidup dalam waktu yg usang. MySQL berani menjanjikan angka 99.999 persen ketersediaan databasenya. Sederhananya, pada satu tahun kira-kira hanya lima mnt ketika database itu nir hayati.

MySQL Cluster
MySQL Cluster menggunakan mesin penyimpanan cluster NDB baru yg sanggup menjalankan beberapa MySQL Server pada dalam sebuah cluster. Mesin penyimpanan cluster NDB tersedia pada pada BitKepper menurut MySQL release 4.1.2 serta pada pada binary releases berdasarkan MySQL-Max 4.1.3. System operasi yang didukung adalah Linux, Mac OS X, serta Solaris, pihak MySQL sedang menciptakan/menyebarkan agar cluster NDBdapat berjalan dalam seluruh system operasi yang didukung sang MySQL termasuk Windows.

Overview
MySQL Cluster adalah sebuah teknologi baru buat memungkinkan clustering pada pada memory database pada sebuah sistem share-nothing. Arsitektur share-nothing mengijinkan sistem dapat bekerja menggunakan hardware/perangkat keras yang sangat murah, dan tidak membutuhkan perangkat keras dan lunak dengan spesifikasi spesifik. Arsitektur tadi jua handal lantaran masing-masing komponen memiliki memory serta disk tersendiri. MySQL Cluster menggabungkan MySQL Server biasa menggunakan sebuah mesin penyimpanan in-memory tercluster yang dinamakan NDB. NDB berarti bagian berdasarkan suatu rangkaian yg dikhususkan sebagai mesin penyimpanan, sedangkan MySQL Cluster diartikan sebagai kombinasi atau gabungan dari MySQL dan mesin penyimpanan yg baru tersebut.

Sebuah MySQL Cluster terdiri menurut sekumpulan komputer, masing-masing menjalankan sejumlah proses mencakup beberapa MySQL server, node-node penyimpanan buat cluster NDB, server-server manajemen serta program-program pengakses data yang spesifik. Semua acara-program tersebut bekerja beserta-sama buat membangun MySQL Cluster. Ketika data disimpan di dalam mesin penyimpan media NDB cluster, tabel-tabel disimpan didalam node-node penyimpanan dalam NDB Cluster. Tabel-tabel seperti itu dapat diakses secara eksklusif menurut semua MySQL server yang lain pada dalam cluster tadi. Dengan cara demikian, sebuah pelaksanaan daftargaji menyimpan data di pada sebuah cluster, jika sebuah aplikasi mengupdate/memperbaharui gaji seorang karyawan, semua MySQL server yg lain yang meminta data ini bisa melihat perubahannya dengan seketika.

Data yang disimpan di dalam node-node penyimpanan pada MySQL Cluster dapat pada mirror (dicerminkan), cluster tadi dapat menangani kegagalan dari node-node penyimpanan individual dengan nir terdapat dampak lain berdasarkan sejumlah transaksi tidak boleh lantaran kegagalan proses transaksi. Sejak aplikasi buat proses-proses transaksi diharapkan bisa menangani kegagalan transaksi, ini seluruh tidak seharusnya sebagai asal konflik. Dengan memperkenalkan MySQL Cluster pada dunia open source, MySQL membuat manajemen data cluster dengan ketersediaan yg tinggi, perfomance yang tinggi serta skalabilitas ketersediaan buat siapa saja yang memerlukannya.

Dasar konsep-konsep MySQL Cluster
NDB merupakan sebuah mesin penyimpanan memory yg memberikan ketersediaan yang tinngi dan fitur-fitur persistensi data. Mesin penyimpanan NDB bisa diatur dengan sebuah bidang failover dan pilihan-pilhan load-balancing, tetapi buat memulai paling mudah menggunakan mesin penyimpanan dalam level cluster. Mesin penyimpanan NDB dalam MySQL Cluster berisi sebuah gugusan lengkap menurut data, bergantung hanya dalam data lainnya pada dalam cluster itu sendiri. Sekarang akan diuraikan bagaimana mengatur sebuah MySQL Cluster yang terdiri berdasarkan sebuah mesin penyimpanan NDB dan beberapa MySQL server. Sebagian menurut MySQL Cluster dikonfigurasi tidak tergantung/bebas menurut server-server MySQL yang lain. Di dalam MySQL Cluster, masing-masing bagian dari cluster dipercaya menjadi sebuah node.

Analisis Cluster (Lanjutan)
Clustering dan segmentasi sebenarnya mempartisi database, karenanya setiap partisi atau group adalah sama berdasarkan kriteria atau metrik eksklusif. Apabila pengukuran kecenderungan tersedia, maka masih ada sejumlah teknik buat membangun cluster. Kebanyakan aplikasi2 data mining menggunakan clusteing dari similarity (kecenderungan), contohnya segmentasi basis klien. Clustering dari optimasi berdasarkan sekumpulan fungsi-fungsi digunakan pada analisis data, misalnya saat mensetting tarif iuran pertanggungan klien bisa disegmentasi dari sejumlah parameter. Contoh pelaksanaan :
  • Perangkat ‘stand-alone’ : explore data distribution
  • Langkah preprocessing buat prosedur pemecahan lain
  • Pengenalan pola, analisis data spasial, pengenalan gambaran, market research, WWW, …
  • clustering dokumen
  • clustering data log web buat menerima group menggunakan pola akses yg sama
Penggelompokkan data ke cluster
  • Data yg sama satu sama lain berada pada cluster yang sama
  • Yang nir sama berada dalam cluster lain
  • ‘Unsupervised learning’: klas yg belum ditentukan
Clustering Yang Baik
Intraclass similarity (Kesamaan pada dalam klas) yg tinggi dan interclass similarity (kesamaan antar klas) yg rendah bergantung dalam pengukuran kesamaan 
Kemampuan buat mendapatkan beberapa atau semua pola yg tersembunyi 

Kebutuhan Clustering
Scalability : Kemampuan mengerjakan atribut2 berdasarkan banyak sekali tipe 
Penemuan clusters dengan bentuk yg tidak tentu 
Kebutuhan minimal buat pengetahuan domain buat memilih parameter input 
Dapat mendapat noise dan outlier 
Tidak mengindahkan susunan record menurut input 
Dimensi yg tinggi 
Menyatu dengan batasan yang dispesifikasikan sang user 
Interpretability and usability 

Tipe-tipe Data dalam Clustering
Variabel berskala interval 
Variabel biner 
Variabel nominal, ordinal serta rasio 
Variable berdasarkan aneka macam tipe variable 

Kategori Pendekatan Clustering
Algoritma Partisi 
Mempartisi objek2 ke dalam k cluster 
Realokasi objek2 secara iteratif buat memperbaiki clustering 

Algoritma Hirarkis
  • Agglomerative: setiap objek merupakan cluster, adonan berdasarkan cluster-cluster membangun cluster yg besar
  • Divisive: semua objek berada pada suatu cluster, pembagian cluster tersebut membentuk cluster2 yg kecil
Metode berbasis densitas
  • Berbasis koneksitas serta fungsi densitas
  • Noise disaring, kemudian temukan cluster pada bentuk sembarang
  • Metode berbasis grid
  • Kuantisasi ruang objek ke dalam struktur grid

Berbasis Model
  • Gunakan model buat menemukan keadaan data yg baik.