MENGIDENTIFIKASI TUJUAN TEKS PROSEDUR DALAM BUKU TEKS BAHASA INDONESIA KELAS 7 SMP/MTS

Teks prosedur merupakan jenis teks yg berisi prosedur atau cara atau tahapan yg bisa dilakukan sang pembaca. Teks mekanisme terdapat untuk membantu pembaca dalam melaksanakan, menciptakan, atau melakukan suatu hal.
Ada tiga teks mekanisme yg dibahasa dalam goresan pena ini, yaitu teks mekanisme yg berjudul: Cara Memainkan Angklung; Cara Membuat Obat Radisional Insomnia; dan Cara Melakukan Gerakan Tari Tor-Tor.
Jadi, masing-masing teks mekanisme mempunyai tujuan sendiri. Berikut ini adalah pembahasan mengenai tujuan sebuah teks mekanisme di atas.
Kita lihat tujuan teks prosedur pada atas bisa dipandang berdasarkan judulnya. Bandingkan ketiga judul tadi. Pasti diawali dengan kata 'cara'. Jadi terdapat kemiripannya, semuanya merupakan cara untuk. Tinggal diubahsuaikan dengan judul teksnya.
Judul teks mekanisme yang pertama adalah Cara Memainkan Angklung berarti teks tadi mempunyai tujuan untuk memandu orang lain buat memainkan indera musik angklung menggunakan urutan yg tepat.
Judul teks mekanisme yg kedua merupakan Cara Membuat Obat Tradisional Insomnia berarti teks mekanisme tadi bertujuan buat membantu pembaca supaya sanggup menciptakan obat sulit tidur secara tradisional  menggunakan langkah-langkah yg sempurna.
Judul teks mekanisme yg ketiga adalah Cara Melakukan Gerakan Tari Tor-tor. Teks mekanisme tersebut memiliki tujuan agar pembaca bisa mengikuti gerakan tari Tor Tor.
Selain mempunyai judul yg mirip, yaitu sama-sama cara, teks prosedur tadi jua memiliki kemiripan lain yaitu berisi point-point yg wajib dilakukan. Ada yang menggunakan simbol bulat, ada pula yg memakai angka buat menunjukkan tahapan pembuatannya.
Berdasarkan persamaan teks mekanisme tadi, ada persamaan lain yg ada dalam teks mekanisme di atas, yaitu masing-masing tahapan serta langkah-langkah yang harus dilakukan nir sanggup diubah urutannya. Jika urutannya diubah maka prosedur yang dilakukan nir akan sukses. Misalnya pada teks mekanisme yg berjudul Cara Membuat Obat Radisional Insomnia langkah nomro 2 serta angka 1 nir bisa ditukar tempatnya. Bayangkan saja apabila sebuah akar kelapa ditumbuk dulu, baru dipoton, masing-masing 4 cm, maka hal tersebut tidak mungkin dilakukan.
Karena sama-sama mempunyai tujuan, maka akan terdapat hasil yang didapat dari ketiga teks prosedur pada atas.
Demikian penjelasan mengenai tujuan sebuah teks prosedur. Semoga bermanfaat.

CIRICIRI KALIMAT SARAN DALAM TEKS PROSEDUR

Salah satu karakteristik bahasa dalam sebuah teks prosedur merupakan adanya kalimat perintah, kalimat saran, serta kalimat larangan. Ketiga kalimat ini sebenarnya ada pada satu kelompok jenis kalimat yaitu kalimat imperatif.

Ketiga kalimat di atas, sebenarnya merupakan kalimat. Tetapi, memiliki kadar disparitas antara kalimat perintah, kalimat embargo, dan kalimat saran. Kalimat perintah adalah kalimat yg 'menyuruh' untuk melakukan sesuatu; Kalimat larangan adalah kalimat yg melarang pembacanya buat berbuat sesuatu, berarti pada dasarnya jua memerintahkan suatu hal kebalikannya; ad interim itu kalimat saran merupakan kalimat yg memberikan penawara sesuatu yang dipercaya lebih baik.

Dalam artikel ini, akan lebih poly dijelaskan mengenai ciri-karakteristik kalimat saran. Salah satu jenis kalimat yang terdapat pada teks mekanisme. Dalam penjelasan artikel ini akan dijabarkan tentang karakteristik sintaksis kalimat saran, karakteristik isi kalimat saran, dan alasan mengapa dibutuhkan kalimat saran dalam sebuah teks prosedur.

Ciri kalimat prosedur dicermati dari segi bentuk serta penggunaannya adalah diawali menggunakan kata yg berupa saran.

Kata yang menunjukkan saran diantaranya adalah:

sebaiknya....
seharusnya....
lebih baik apabila...
pastikan....
perlu diingat...
usahakan....

dan seterusnya, istilah serta frasa yang mirip menggunakan bentuk saran pada atas.

Jika kata serta frasa di atas disusun menjadi kalimat saran yang biasa digunakan pada teks prosedur maka mampu diterapkan dalam model kalimat dalam teks mekanisme untuk membuat nasi goreng berikut ini:

sebaiknya haluskan bumbu hingga benar-benar halus.

seharusnya masakan telah matang pada 5 mnt pertama.

lebih baik bila yang dipakai merupakan garam beryodium.

pastikan bumbu telah tercampur rata dengan nasi.

perlu diingat bahwa nasi yang baik adalah nasi yang tidak terlalu lembut.

Usahakan gunakan sayur bebas pestisida sebagai hiasan dan lalapan pelengkapnya.


Nah, dari karakteristik bahasa dan contoh kalimat saran di atas, dapat diketahui ciri isi kalimat saran. Berdasarkan model-model kalimat tadi dapat diketahui bahwa kalimat saran memberikan cara lain yang lebih baik. Ini merupakan ciri isinya, sebuah kalimat saran pasti menawarkan alternatif.

Kita amati dari kalimat contoh yg pertama: sebaiknya haluskan bumbu sampai sahih-benar halus. Pada dasarnya ini adalah saran yg bisa diterapkan, sanggup jua tidak. Apabila hiluskan sampai sahih-benar halus maka cita rasa bumbu nasi goreng sanggup sahih-sahih merata. Seandainya nir mampu sahih-benar halus sebenarnya mampu jua digunakan menjadi bumbu nasi goreng.

Begitu jua dengan model-model yg kalimat yg lain di atas. Apabila dijelaskan pada bahasa yg gamblang model kalimat yang terakhir begini penjelasannya: usahakan pakai sayur bebas pestisida menjadi hiasan serta lalapan pelengkapnya. Nah, seandainya tidak bisa mengklaim sebuah sayuran ditanam secara organik bebas pestisida, maka sayur misalnya umumnya juga tidak mengurangi nilai rasa kelezatan sebuah masakan.

Penjelasan yang terakhir merupakan jawaban berdasarkan pertanyaan mengapa dalam teks mekanisme ada kalimat saran. Berikut ini penjelasannya:

Teks mekanisme adalah sebuah jenis teks yang berisi langkah-langkah atau pedoman yang sanggup dipakai oleh sesorang buat melakukan suatu hal. Baik membuat sesuatu, menggunakan sesuatau, atau melakukan suatu gerakan atau suatu tindakan.
Baca Juga:
- Mengidentifikasi Penggunaan Bahasa dalam Teks Prosedur
- Kalimat Perintah, Kalimat Saran, Kalimat Larangan Perbedaan dan Persamaannya

Nah, pada proses melakukan aktivitas tadi diperlukan tindakah yg efektif serta efisien buat membuat sesuatu yang maksimal . Misalnya yang dipakai contoh adalah membuat nasi goreng, maka dibutuhkan output yg didapat merupakan cara membuat nasi goreng yg sangat gampang, sekaligus membentuk produk kuliner nasi goreng yang sangat lezat . Untuk mendapatkan hasil yg aporisma tadi maka diharapkan saran-saran yang penting selain juga kalimat perintah pada termin atau langkah-langkah membuat nasi goreng.

Semoga penjelasan singkat dan sederhana mengenai karakteristik-ciri kalimat saran dalam sebuah teks prosedur ini sanggup memperdalam dan memperluas pengetahuan mengenai kalimat saran.

PENGERTIAN DATA MINING APA ITU DATA MINING

Pengertian Data Mining, Apa Itu Data Mining?
Secara sederhana data mining adalah penambangan atau inovasi liputan baru menggunakan mencari pola atau aturan tertentu berdasarkan sejumlah data yg sangat besar (Davies, 2004). Data mining juga diklaim sebagai serangkaian proses buat menggali nilai tambah berupa pengetahuan yg selama ini nir diketahui secara manual menurut suatu deretan data (Pramudiono, 2007). Data mining, tak jarang jua dianggap menjadi knowledge discovery in database (KDD). KDD adalah aktivitas yg mencakup pengumpulan, pemakaian data, historis buat menemukan keteraturan, pola atau hubungan pada set data berukuran akbar (Santoso, 2007). 

Data mining merupakan aktivitas menemukan pola yg menarik menurut data dalam jumlah akbar, data dapat disimpan pada database, data warehouse, atau penyimpanan keterangan lainnya. Data mining berkaitan dengan bidang ilmu – ilmu lain, misalnya database system, data warehousing, statistik, machine learning, information retrieval, dan komputasi tingkat tinggi. Selain itu, data mining didukung oleh ilmu lain misalnya neural network, sosialisasi pola, spatial data analysis, image database, signal processing (Han, 2006). Data mining didefinisikan menjadi proses menemukan pola-pola pada data. Proses ini otomatis atau seringnya semiotomatis. Pola yg ditemukan wajib penuh arti serta pola tadi memberikan keuntungan, biasanya keuntungan secara ekonomi. Data yg diharapkan dalam jumlah besar (Witten, 2005).

Karakteristik data mining menjadi berikut
Data mining herbi inovasi sesuatu yg tersembunyi dan pola data eksklusif yang nir diketahui sebelumnya. 
Data mining biasa memakai data yg sangat besar . Biasanya data yang besar dipakai buat menciptakan output lebih dipercaya. 

Data mining bermanfaat buat menciptakan keputusan yg kritis, terutama pada taktik (Davies, 2004).
Berdasarkan beberapa pengertian tersebut bisa ditarik konklusi bahwa data mining merupakan suatu teknik menggali informasi berharga yg terpendam atau tersembunyi pada suatu koleksi data (database) yang sangat akbar sebagai akibatnya ditemukan suatu pola yg menarik yg sebelumnya tidak diketahui. Kata mining sendiri berarti usaha buat mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Lantaran itu data mining sebenarnya memiliki akar yg panjang menurut bidang ilmu misalnya kecerdasan buatan (artificial intelligent), machine learning, statistik serta database. Beberapa metode yang sering diklaim-sebut pada literatur data mining diantaranya clustering, lassification, association rules mining, neural network, genetic algorithm serta lain-lain (Pramudiono, 2007).

Pengenalan Pola, Data Mining, dan Machine Learning
Pengenalan pola merupakan suatu disiplin ilmu yg menyelidiki cara-cara mengklasifikasikan obyek ke beberapa kelas atau kategori dan mengenali kecenderungan data. Tergantung dalam aplikasinya, obyek-obyek ini sanggup berupa pasien, mahasiswa, pemohon kredit, image atau signal atau pengukuran lain yang perlu diklasifikasikan atau dicari fungsi regresinya (Santoso, 2007).data mining, acapkali juga diklaim knowledge discovery in database (KDD), merupakan kegiatan yg meliputi pengumpulan, pemakaian data historis buat menemukan keteraturan, pola atau interaksi dalam set data berukuran besar . Keluaran dari data mining ini sanggup digunakan buat memperbaiki pengambilan keputusan di masa depan. Sehingga kata pattern recognition sporadis dipakai karena termasuk bagian dari data mining (Santoso, 2007).

Machine Learning merupakan suatu area dalam artificial intelligence atau kecerdasan protesis yang herbi pengembangan teknik-teknik yg sanggup diprogramkan serta belajar menurut data masa kemudian. Pengenalan pola, data mining dan machine learning acapkali digunakan buat menyebut sesuatu yg sama. Bidang ini bersinggungan menggunakan ilmu probabilitas serta statistik kadang jua optimasi. Machine learning menjadi alat analisis dalam data mining. Bagaimana bidang-bidang ini berafiliasi sanggup ditinjau pada gambar (Santoso, 2007).

Tahap-Tahap Data mining
Sebagai suatu rangkaian proses, data mining bisa dibagi menjadi beberapa termin yang diilustrasikan di Gambar  Tahap-tahap tadi bersifat interaktif, pemakai terlibat langsung atau menggunakan perantaraan knowledge base

Tahap-termin data mining ada 6 yaitu :

1. Pembersihan data (data cleaning)
Pembersihan data adalah proses menghilangkan noise serta data yg nir konsisten atau data nir relevan. Pada biasanya data yang diperoleh, baik menurut database suatu perusahaan juga hasil eksperimen, memiliki isian-isian yang nir sempurna seperti data yang hilang, data yang tidak valid atau pula hanya sekedar keliru ketik. Selain itu, ada jua atribut-atribut data yang tidak relevan menggunakan hipotesa data mining yg dimiliki. Data-data yg tidak relevan itu juga lebih baik dibuang. Pembersihan data juga akan mempengaruhi performasi berdasarkan teknik data mining karena data yg ditangani akan berkurang jumlah serta kompleksitasnya.

2. Integrasi data (data integration)
Integrasi data adalah penggabungan data menurut banyak sekali database ke dalam satu database baru. Tidak jarang data yang dibutuhkan buat data mining tidak hanya berasal berdasarkan satu database tetapi juga berasal dari beberapa database atau arsip teks. Integrasi data dilakukan dalam atribut-aribut yang mengidentifikasikan entitas-entitas yg unik seperti atribut nama, jenis produk, nomor pelanggan serta lainnya. Integrasi data perlu dilakukan secara cermat karena kesalahan dalam integrasi data sanggup membentuk output yang menyimpang dan bahkan menyesatkan pengambilan aksi nantinya. Sebagai contoh apabila integrasi data dari jenis produk ternyata menggabungkan produk dari kategori yang berbeda maka akan dihasilkan korelasi antar produk yang sebenarnya tidak ada. 

3. Seleksi Data (Data Selection)
Data yg ada dalam database tak jarang kali tidak semuanya digunakan, sang karenanya hanya data yg sinkron buat dianalisis yg akan diambil dari database. Sebagai contoh, sebuah perkara yg meneliti faktor kecenderungan orang membeli dalam kasus market basket analysis, nir perlu merogoh nama pelanggan, cukup dengan id pelanggan saja.

4. Transformasi data (Data Transformation)
Data diubah atau digabung ke pada format yg sesuai buat diproses dalam data mining. Beberapa metode data mining membutuhkan format data yg khusus sebelum sanggup diaplikasikan. Sebagai contoh beberapa metode baku seperti analisis asosiasi serta clustering hanya mampu mendapat input data kategorikal. Karenanya data berupa angka numerik yang berlanjut perlu dibagi-bagi sebagai beberapa interval. Proses ini seringkali dianggap transformasi data. 

5. Proses mining, 
Merupakan suatu proses primer saat metode diterapkan untuk menemukan pengetahuan berharga serta tersembunyi berdasarkan data. 

6. Evaluasi pola (pattern evaluation), 
Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yg ditemukan. Dalam termin ini output berdasarkan teknik data mining berupa pola-pola yang spesial maupun contoh prediksi dinilai untuk menilai apakah hipotesa yang terdapat memang tercapai. Jika ternyata hasil yg diperoleh nir sinkron hipotesa ada beberapa cara lain yang bisa diambil seperti menjadikannya umpan pulang buat memperbaiki proses data mining, mencoba metode data mining lain yang lebih sesuai, atau menerima output ini menjadi suatu hasil yg di luar dugaan yang mungkin berguna.

7. Presentasi pengetahuan (knowledge presentation), 
Merupakan visualisasi serta penyajian pengetahuan mengenai metode yg digunakan buat memperoleh pengetahuan yg diperoleh pengguna. Tahap terakhir dari proses data mining merupakan bagaimana memformulasikan keputusan atau aksi dari hasil analisis yg didapat. Ada kalanya hal ini harus melibatkan orang-orang yang tidak memahami data mining. Karenanya presentasi output data mining pada bentuk pengetahuan yang bisa dipahami seluruh orang adalah satu tahapan yg diharapkan pada proses data mining. Dalam presentasi ini, visualisasi juga sanggup membantu mengkomunikasikan output data mining (Han, 2006)

Metode Data mining
Dengan definisi data mining yang luas, terdapat poly jenis metode analisis yang bisa digolongkan dalam data mining. 

Association rules
Association rules (aturan asosiasi) atau affinity analysis (analisis afinitas) berkenaan menggunakan studi tentang “apa beserta apa”. Sebagai model bisa berupa berupa studi transaksi di pasar swalayan, contohnya seorang yg membeli susu bayi juga membeli sabun mandi. Pada perkara ini berarti susu bayi bersama dengan sabun mandi. Lantaran awalnya berasal berdasarkan studi tentang database transaksi pelanggan untuk menentukan norma suatu produk dibeli beserta produk apa, maka aturan asosiasi pula seringkali dinamakan market basket analysis. Aturan asosiasi ingin menaruh fakta tersebut dalam bentuk interaksi “if-then” atau “jika-maka”. Aturan ini dihitung dari data yang sifatnya probabilistik (Santoso, 2007). Analisis asosiasi dikenal pula sebagai salah satu metode data mining yg menjadi dasar berdasarkan banyak sekali metode data mining lainnya. Khususnya salah satu termin menurut analisis asosiasi yang diklaim analisis pola frekuensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti buat membentuk prosedur pemecahan yg efisien. Penting tidaknya suatu aturan assosiatif bisa diketahui dengan 2 parameter, support (nilai penunjang) yaitu prosentase kombinasi item tersebut. Pada database serta confidence (nilai kepastian) yaitu kuatnya hubungan antar item pada aturan assosiatif. Analisis asosiasi didefinisikan suatu proses buat menemukan seluruh aturan assosiatif yg memenuhi kondisi minimum buat support (minimum support) dan syarat minimum buat confidence (minimum confidence) (Pramudiono, 2007).

Ada beberapa prosedur pemecahan yang sudah dikembangkan tentang aturan asosiasi, namun terdapat satu prosedur pemecahan klasik yang sering dipakai yaitu algoritma apriori. Ide dasar berdasarkan prosedur pemecahan ini merupakan dengan mengembangkan frequent itemset. Dengan menggunakan satu item serta secara rekursif membuatkan frequent itemset dengan 2 item, 3 item dan seterusnya sampai frequent itemset menggunakan semua ukuran. Untuk menyebarkan frequent set menggunakan 2 item, bisa menggunakan frequent set item. Alasannya merupakan apabila set satu item nir melebihi support minimum, maka sembarang ukuran itemset yg lebih besar nir akan melebihi support minimum tersebut. Secara umum, berbagi set menggunakan fc-item memakai frequent set menggunakan k – 1 item yg dikembangkan dalam langkah sebelumnya. Setiap langkah memerlukan sekali inspeksi ke semua isi database. 

Dalam asosiasi masih ada istilah antecedent serta consequent, antecedent buat mewakili bagian “apabila” dan consequent buat mewakili bagian “maka”. Dalam analisis ini, antecedent serta consequent adalah sekelompok item yg nir punya hubungan secara bersama (Santoso, 2007). Dari jumlah akbar aturan yg mungkin dikembangkan, perlu memiliki anggaran-aturan yang cukup bertenaga tingkat ketergantungan antar item pada antecedent dan consequent. Untuk mengukur kekuatan anggaran asosiasi ini, digunakan berukuran support dan confidence. Support adalah rasio antara jumlah transaksi yang memuat antecedent dan consequent menggunakan jumlah transaksi. Confidence adalah rasio antara jumlah transaksi yg meliputi seluruh item pada antecedent dan consequent menggunakan jumlah transaksi yg mencakup semua item pada antecedent.

Langkah pertama prosedur pemecahan apriori adalah, support berdasarkan setiap item dihitung dengan men-scan database. Setelah support menurut setiap item didapat, item yg mempunyai support lebih besar menurut minimum support dipilih menjadi pola frekuensi tinggi menggunakan panjang 1 atau seringkali disingkat 1-itemset. Singkatan k-itemset berarti satu set yg terdiri dari k item. Iterasi ke 2 membuat 2-itemset yang tiap set-nya memiliki 2 item. Pertama dibentuk kandidat dua-itemset menurut kombinasi semua 1-itemset. Lalu buat tiap 

kandidat dua-itemset ini dihitung support-nya dengan men-scan database. Support artinya jumlah transaksi dalam database yang mengandung ke 2 item pada kandidat dua-itemset. Setelah support dari semua kandidat 2-itemset didapatkan, kandidat 2-itemset yg memenuhi kondisi minimum support dapat ditetapkan sebagai dua-itemset yang pula merupakan pola frekuensi tinggi dengan panjang 2.(Pramudiono, 2007)

Untuk selanjutnya perulangan iterasi ke-k bisa dibagi lagi sebagai beberapa bagian :

1. Pembentukan kandidat itemset
Kandidat k-itemset dibuat berdasarkan kombinasi (k-1)-itemset yg didapat menurut iterasi sebelumnya. Satu ciri menurut prosedur pemecahan apriori adalah adanya pemangkasan kandidat k-itemset yg subset-nya yg berisi k-1 item nir termasuk pada pola frekuensi tinggi menggunakan panjang k-1.

2. Penghitungan support dari tiap kandidat k-itemset
Support dari tiap kandidat k-itemset didapat menggunakan men-scan database untuk menghitung jumlah transaksi yg memuat seluruh item di dalam kandidat k-itemset tersebut. Ini adalah jua ciri menurut prosedur pemecahan apriori yaitu dibutuhkan penghitungan dengan scan seluruh database sebesar k-itemset terpanjang.

3. Tetapkan pola frekuensi tinggi
Pola frekuensi tinggi yg memuat k item atau k-itemset ditetapkan berdasarkan kandidat k-itemset yang support-nya lebih akbar berdasarkan minimum support. Kemudian dihitung confidence masing-masing kombinasi item. Iterasi berhenti ketika semua item telah dihitung hingga nir terdapat kombinasi item lagi. (Pramudiono, 2007)

Secara ringkas algoritma apriori sebagai berikut :
Create L1 = set of supported itemsets of cardinality one 
Set k to 2
while (Lk−1 _= ∅)  
Create Ck from Lk−1
Prune all the itemsets in Ck that are not
supported, to create Lk
Increase k by 1
}
The set of all supported itemsets is L1 ∪ L2 ∪ · · · ∪ Lk 

Selain prosedur pemecahan apriori, terdapat pula prosedur pemecahan lain seperti FP-Grwoth. 
Perbedaan prosedur pemecahan apriori menggunakan FP-Growth dalam banyaknya scan database. Algoritma apriori melakukan scan database setiap kali perulangan sedangkan prosedur pemecahan FP-Growth hanya melakukan sekali pada awal (Bramer, 2007).

Decision Tree
Dalam decision tree tidak memakai vector jeda buat mengklasifikasikan obyek. Seringkali data observasi memiliki atribut-atribut yg bernilai nominal. Seperti yg diilustrasikan dalam gambar 2.6, misalkan obyeknya adalah sekumpulan buah-buahan yg mampu dibedakan menurut atribut bentuk, warna, berukuran dan rasa. Bentuk, warna, ukuran dan rasa adalah besaran nominal, yaitu bersifat kategoris dan tiap nilai tidak sanggup dijumlahkan atau dikurangkan. Dalam atribut rona ada beberapa nilai yang mungkin yaitu hijau, kuning, merah. Dalam atribut ukuran ada nilai akbar, sedang serta mini . Dengan nilai-nilai atribut ini, lalu dibentuk decision tree buat memilih suatu obyek termasuk jenis buah apa apabila nilai tiap-tiap atribut diberikan (Santoso, 2007).

Ada beberapa macam algoritma decision tree diantaranya CART dan C4.5. Beberapa gosip primer pada decision tree yg sebagai perhatian yaitu seberapa lebih jelasnya pada menyebarkan decision tree, bagaimana mengatasi atribut yang bernilai continues, menentukan ukuran yg cocok buat penentuan atribut, menangani data training yg memiliki data yang atributnya tidak memiliki nilai, memperbaiki efisiensi perhitungan (Santoso, 2007).decision tree sesuai dipakai buat perkara-perkara yang keluarannya bernilai diskrit. Walaupun poly variasi model decision tree menggunakan tingkat kemampuan serta syarat yg tidak sinkron, dalam umumnya beberapa ciri yang cocok buat diterapkannya decision tree merupakan sebagai berikut :
1. Data dinyatakan dengan pasangan atribut dan nilainya
2. Label/keluaran data umumnya bernilai diskrit
3. Data memiliki missing value (nilai dari suatu atribut tidak diketahui)

Dengan cara ini akan gampang mengelompokkan obyek ke dalam beberapa grup. Untuk membuat decision tree perlu memperhatikan hal-hal berikut ini :
1. Atribut mana yang akan dipilih untuk pemisahan obyek
2. Urutan atribut mana yg akan dipilih terlebih dahulu
3. Struktur tree
4. Kriteria pemberhentian
5. Pruning 
(Santoso, 2007)

Clustering
Clustering termasuk metode yang sudah relatif dikenal dan poly dipakai dalam data mining. Sampai kini para ilmuwan pada bidang data miningmasih melakukan banyak sekali bisnis untuk melakukan pemugaran contoh clustering karena metode yg dikembangkan sekarang masih bersifat heuristic. Usaha-usaha buat menghitung jumlah cluster yang optimal dan pengklasteran yang paling baik masih terus dilakukan. Dengan demikian memakai metode yang sekarang, nir sanggup menjamin hasil pengklasteran telah adalah output yang optimal. Namun, hasil yang dicapai umumnya telah cukup indah berdasarkan segi mudah.

Tujuan primer dari metode clustering merupakan pengelompokan sejumlah data/obyek ke alam cluster (class) sehingga dalam setiap cluster akan berisi data yg semirip mungkin misalnya diilustrasikan pada gambar 2.7. Dalam clustering metode ini berusaha buat menempatkan obyek yang seperti (jaraknya dekat) dalam satu klaster serta membuat jeda antar klaster sejauh mungkin. Ini berarti obyek dalam satu cluster sangat seperti satu sama lain dan berbeda menggunakan obyek dalam cluster-cluster yg lain. Dalam metode ini tidak diketahui sebelumnya berapa jumlah cluster serta bagaimana pengelompokannya (Santoso, 2007).

Software Aplikasi
Software aplikasi terdiri atas program yang berdiri sendiri yg bisa mengatasi kebutuhan bisnis eksklusif. Aplikasi memfasilitasi operasi bisnis atau pengambilan keputusan manajemen juga teknik sebagai tambahan dalam pelaksanaan pemrosesan data konvensional. Sofware pelaksanaan dipakai buat mengatur fungsi bisnis secara real time (Pressman, 2005).

Desain Model Aplikasi
Desain model berdasarkan aplikasi terdiri menurut physical model dan logical model. Physical contoh dapat digambarkan dengan bagan alir sistem. Logical model dalam sistem liputan lebih menjelaskan pada pengguna bagaimana nantinya fungsi-fungsi pada sistem fakta secara nalar akan bekerja. Logical model bisa digambarkan menggunakan DFD (Data Flow Diagram) serta kamus data (Data Dictionary). Adapun penerangan dari alat bantu pada desain contoh adalah menjadi berikut :

1. Diagram Konteks (Context Diagram)
Diagram konteks adalah sebuah diagram sederhana yg mendeskripsikan hubungan antara proses dan entitas luarnya. Adapun simbol-simbol dalam diagram konteks seperti dijelaskan dalam tabel 2.2.


DFD (Data Flow Diagram)
DFD merupakan suatu contoh akal yg menggambarkan dari data dan tujuan data yg keluar berdasarkan sistem, serta mendeskripsikan penyimpanan data serta proses yg mentranformasikan data. DFD memperlihatkan interaksi antara data pada sistem dan proses dalam sistem. Beberapa simbol yang dipakai pada DFD diterangkan dalam tabel


Perancangan Perangkat Lunak
Proses perancangan sistem membagi persyaratan pada sistem perangkat keras atau perangkat lunak. Kegiatan ini menentukan arsitektur sistem secara holistik. Perancangan software melibatkan identifikasi dan pelukisan abstraksi sistem aplikasi yg fundamental serta interaksi-hubungannya (Sommerville, 2003). Sebagaimana persyaratan, desain didokumentasikan serta sebagai bagian menurut konfigurasi perangkat lunak (Pressman, 1997). Tahap desain mencakup perancangan data, perancangan fungsional, serta perancangan antarmuka. 

1. Perancangan data
Perancangan data mentransformasikan contoh data yg didapatkan sang proses analisis menjadi struktur data yang dibutuhkan dalam saat pembuatan acara (coding). Selain itu jua akan dilakukan desain terhadap struktur database yg akan dipakai. 

2. Perancangan fungsional
Perancangan fungsional mendeskripsikan kebutuhan fungsi-fungsi primer software.

3. Perancangan antarmuka 
Perancangan antarmuka mendefinisikan bagaimana pengguna (user) dan perangkat lunak berkomunikasi pada menjalankan fungsionalitas aplikasi.

Implementasi serta Pengujian Unit
Pada termin ini, perancangan perangkat lunak direalisasikan menjadi serangkaian acara atau unit program. Kemudian pengujian unit melibatkan pembuktian bahwa setiap unit acara sudah memenuhi spesifikasinya (Sommerville, 2003).program usahakan dirilis sesudah dikembangkan, diuji buat memperbaiki kesalahan yg ditemukan dalam pengujian buat menjamin kualitasnya (Padmini, 2005). Terdapat 2 metode pengujian yaitu : 
1) Metode white box yaitu pengujian yg serius dalam akal internal software (source code program).
2) Metode black box yaitu mengarahkan pengujian buat menemukan kesalahan-mesalahan dan memastikan bahwa input yg dibatasi akan memberikan output aktual yg sesuai dengan hasil yg diharapkan. Pada tahap pengujian, penulis melakukan metode black box yaitu menguji fungsionalitas menurut perangkat lunak saja tanpa harus mengetahui struktur internal acara (source code).

PENGERTIAN DATA MINING APA ITU DATA MINING

Pengertian Data Mining, Apa Itu Data Mining?
Secara sederhana data mining merupakan penambangan atau penemuan fakta baru dengan mencari pola atau anggaran eksklusif dari sejumlah data yang sangat akbar (Davies, 2004). Data mining jua disebut menjadi serangkaian proses buat menggali nilai tambah berupa pengetahuan yang selama ini nir diketahui secara manual berdasarkan suatu perpaduan data (Pramudiono, 2007). Data mining, sering juga diklaim sebagai knowledge discovery in database (KDD). KDD adalah aktivitas yang mencakup pengumpulan, pemakaian data, historis buat menemukan keteraturan, pola atau interaksi dalam set data berukuran akbar (Santoso, 2007). 

Data mining adalah aktivitas menemukan pola yang menarik menurut data pada jumlah akbar, data bisa disimpan pada database, data warehouse, atau penyimpanan berita lainnya. Data mining berkaitan dengan bidang ilmu – ilmu lain, seperti database system, data warehousing, statistik, machine learning, information retrieval, dan komputasi taraf tinggi. Selain itu, data mining didukung oleh ilmu lain seperti neural network, pengenalan pola, spatial data analysis, image database, signal processing (Han, 2006). Data mining didefinisikan menjadi proses menemukan pola-pola pada data. Proses ini otomatis atau seringnya semiotomatis. Pola yg ditemukan harus penuh arti dan pola tersebut memberikan keuntungan, umumnya keuntungan secara ekonomi. Data yg diperlukan dalam jumlah besar (Witten, 2005).

Karakteristik data mining sebagai berikut
Data mining herbi penemuan sesuatu yg tersembunyi serta pola data eksklusif yg nir diketahui sebelumnya. 
Data mining biasa menggunakan data yang sangat akbar. Biasanya data yang akbar digunakan buat membuat hasil lebih dianggap. 

Data mining bermanfaat buat membuat keputusan yang kritis, terutama dalam strategi (Davies, 2004).
Berdasarkan beberapa pengertian tersebut dapat ditarik konklusi bahwa data mining adalah suatu teknik menggali liputan berharga yang terpendam atau tersembunyi dalam suatu koleksi data (database) yg sangat akbar sehingga ditemukan suatu pola yg menarik yg sebelumnya nir diketahui. Kata mining sendiri berarti usaha buat mendapatkan sedikit barang berharga berdasarkan sejumlah besar material dasar. Lantaran itu data mining sebenarnya mempunyai akar yg panjang dari bidang ilmu seperti kecerdasan protesis (artificial intelligent), machine learning, statistik dan database. Beberapa metode yang seringkali diklaim-sebut pada literatur data mining diantaranya clustering, lassification, association rules mining, neural network, genetic algorithm dan lain-lain (Pramudiono, 2007).

Pengenalan Pola, Data Mining, serta Machine Learning
Pengenalan pola adalah suatu disiplin ilmu yang menyelidiki cara-cara mengklasifikasikan obyek ke beberapa kelas atau kategori serta mengenali kesamaan data. Tergantung dalam aplikasinya, obyek-obyek ini mampu berupa pasien, mahasiswa, pemohon kredit, image atau signal atau pengukuran lain yg perlu diklasifikasikan atau dicari fungsi regresinya (Santoso, 2007).data mining, acapkali juga dianggap knowledge discovery in database (KDD), merupakan kegiatan yang meliputi pengumpulan, pemakaian data historis buat menemukan keteraturan, pola atau interaksi pada set data ukuran akbar. Keluaran dari data mining ini sanggup digunakan buat memperbaiki pengambilan keputusan di masa depan. Sehingga istilah pattern recognition sporadis digunakan lantaran termasuk bagian berdasarkan data mining (Santoso, 2007).

Machine Learning adalah suatu area pada artificial intelligence atau kecerdasan protesis yg berhubungan dengan pengembangan teknik-teknik yg mampu diprogramkan serta belajar menurut data masa lalu. Pengenalan pola, data mining dan machine learning sering digunakan buat menyebut sesuatu yang sama. Bidang ini bersinggungan dengan ilmu probabilitas serta statistik kadang pula meningkatkan secara optimal. Machine learning sebagai alat analisis dalam data mining. Bagaimana bidang-bidang ini bekerjasama mampu dicermati pada gambar (Santoso, 2007).

Tahap-Tahap Data mining
Sebagai suatu rangkaian proses, data mining bisa dibagi sebagai beberapa tahap yg diilustrasikan pada Gambar  Tahap-tahap tersebut bersifat interaktif, pemakai terlibat eksklusif atau dengan perantaraan knowledge base

Tahap-termin data mining ada 6 yaitu :

1. Pembersihan data (data cleaning)
Pembersihan data adalah proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. Pada umumnya data yg diperoleh, baik berdasarkan database suatu perusahaan juga hasil eksperimen, memiliki isian-isian yang tidak paripurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar keliru ketik. Selain itu, terdapat jua atribut-atribut data yang nir relevan menggunakan hipotesa data mining yg dimiliki. Data-data yang tidak relevan itu pula lebih baik dibuang. Pembersihan data jua akan mempengaruhi performasi berdasarkan teknik data mining lantaran data yg ditangani akan berkurang jumlah dan kompleksitasnya.

2. Integrasi data (data integration)
Integrasi data merupakan penggabungan data berdasarkan aneka macam database ke dalam satu database baru. Tidak jarang data yang dibutuhkan buat data mining tidak hanya asal dari satu database namun pula berasal dari beberapa database atau file teks. Integrasi data dilakukan pada atribut-aribut yg mengidentifikasikan entitas-entitas yg unik seperti atribut nama, jenis produk, nomor pelanggan serta lainnya. Integrasi data perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa menghasilkan hasil yg menyimpang dan bahkan menyesatkan pengambilan aksi nantinya. Sebagai contoh apabila integrasi data menurut jenis produk ternyata menggabungkan produk menurut kategori yg berbeda maka akan dihasilkan korelasi antar produk yang sebenarnya nir terdapat. 

3. Seleksi Data (Data Selection)
Data yg ada pada database acapkali kali tidak semuanya digunakan, oleh karenanya hanya data yg sesuai untuk dianalisis yg akan diambil menurut database. Sebagai contoh, sebuah masalah yang meneliti faktor kesamaan orang membeli dalam kasus market basket analysis, tidak perlu merogoh nama pelanggan, relatif menggunakan id pelanggan saja.

4. Transformasi data (Data Transformation)
Data diubah atau digabung ke pada format yg sinkron buat diproses pada data mining. Beberapa metode data mining membutuhkan format data yang spesifik sebelum mampu diaplikasikan. Sebagai contoh beberapa metode standar seperti analisis asosiasi dan clustering hanya mampu mendapat input data kategorikal. Karenanya data berupa nomor numerik yg berlanjut perlu dibagi-bagi sebagai beberapa interval. Proses ini acapkali disebut transformasi data. 

5. Proses mining, 
Merupakan suatu proses primer ketika metode diterapkan untuk menemukan pengetahuan berharga serta tersembunyi menurut data. 

6. Evaluasi pola (pattern evaluation), 
Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan. Dalam termin ini hasil dari teknik data mining berupa pola-pola yang khas juga model prediksi dinilai buat menilai apakah hipotesa yg ada memang tercapai. Jika ternyata output yg diperoleh tidak sinkron hipotesa terdapat beberapa cara lain yg dapat diambil seperti menjadikannya umpan kembali buat memperbaiki proses data mining, mencoba metode data mining lain yg lebih sesuai, atau mendapat output ini menjadi suatu hasil yang pada luar dugaan yang mungkin berguna.

7. Presentasi pengetahuan (knowledge presentation), 
Merupakan visualisasi dan penyajian pengetahuan tentang metode yang dipakai buat memperoleh pengetahuan yang diperoleh pengguna. Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi menurut output analisis yg didapat. Ada kalanya hal ini wajib melibatkan orang-orang yg tidak tahu data mining. Karenanya presentasi output data mining pada bentuk pengetahuan yang bisa dipahami seluruh orang merupakan satu tahapan yg diharapkan pada proses data mining. Dalam presentasi ini, visualisasi pula mampu membantu mengkomunikasikan output data mining (Han, 2006)

Metode Data mining
Dengan definisi data mining yang luas, terdapat poly jenis metode analisis yg bisa digolongkan dalam data mining. 

Association rules
Association rules (aturan asosiasi) atau affinity analysis (analisis afinitas) berkenaan menggunakan studi tentang “apa bersama apa”. Sebagai model dapat berupa berupa studi transaksi pada pasar swalayan, misalnya seorang yang membeli susu bayi pula membeli sabun mandi. Pada masalah ini berarti susu bayi bersama menggunakan sabun mandi. Lantaran awalnya berasal menurut studi mengenai database transaksi pelanggan buat memilih kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi juga tak jarang dinamakan market basket analysis. Aturan asosiasi ingin memberikan warta tersebut pada bentuk hubungan “if-then” atau “jika-maka”. Aturan ini dihitung berdasarkan data yang sifatnya probabilistik (Santoso, 2007). Analisis asosiasi dikenal jua menjadi salah satu metode data mining yang menjadi dasar menurut berbagai metode data mining lainnya. Khususnya galat satu tahap berdasarkan analisis asosiasi yg disebut analisis pola frekuensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti buat membuat algoritma yang efisien. Penting tidaknya suatu aturan assosiatif dapat diketahui dengan 2 parameter, support (nilai penunjang) yaitu prosentase kombinasi item tersebut. Pada database serta confidence (nilai kepastian) yaitu kuatnya interaksi antar item dalam aturan assosiatif. Analisis asosiasi didefinisikan suatu proses buat menemukan semua aturan assosiatif yang memenuhi kondisi minimum buat support (minimum support) dan kondisi minimum buat confidence (minimum confidence) (Pramudiono, 2007).

Ada beberapa prosedur pemecahan yang telah dikembangkan tentang anggaran asosiasi, tetapi ada satu prosedur pemecahan klasik yg sering dipakai yaitu prosedur pemecahan apriori. Ide dasar berdasarkan algoritma ini merupakan menggunakan menyebarkan frequent itemset. Dengan memakai satu item serta secara rekursif membuatkan frequent itemset dengan dua item, tiga item serta seterusnya sampai frequent itemset dengan seluruh ukuran. Untuk menyebarkan frequent set menggunakan dua item, bisa memakai frequent set item. Alasannya adalah apabila set satu item nir melebihi support minimum, maka sembarang berukuran itemset yang lebih besar tidak akan melebihi support minimum tersebut. Secara generik, mengembangkan set dengan fc-item menggunakan frequent set menggunakan k – 1 item yg dikembangkan dalam langkah sebelumnya. Setiap langkah memerlukan sekali inspeksi ke seluruh isi database. 

Dalam asosiasi masih ada kata antecedent dan consequent, antecedent buat mewakili bagian “apabila” serta consequent buat mewakili bagian “maka”. Dalam analisis ini, antecedent dan consequent adalah sekelompok item yang nir punya interaksi secara bersama (Santoso, 2007). Dari jumlah akbar anggaran yg mungkin dikembangkan, perlu memiliki aturan-anggaran yg relatif kuat taraf ketergantungan antar item pada antecedent dan consequent. Untuk mengukur kekuatan aturan asosiasi ini, digunakan ukuran support dan confidence. Support adalah rasio antara jumlah transaksi yg memuat antecedent dan consequent menggunakan jumlah transaksi. Confidence adalah rasio antara jumlah transaksi yang mencakup seluruh item dalam antecedent dan consequent dengan jumlah transaksi yg meliputi seluruh item pada antecedent.

Langkah pertama prosedur pemecahan apriori adalah, support berdasarkan setiap item dihitung menggunakan men-scan database. Setelah support berdasarkan setiap item didapat, item yang mempunyai support lebih akbar dari minimum support dipilih sebagai pola frekuensi tinggi menggunakan panjang 1 atau acapkali disingkat 1-itemset. Singkatan k-itemset berarti satu set yang terdiri dari k item. Iterasi ke 2 menghasilkan 2-itemset yang tiap set-nya mempunyai dua item. Pertama dibentuk kandidat 2-itemset menurut kombinasi seluruh 1-itemset. Lalu buat tiap 

kandidat dua-itemset ini dihitung support-nya menggunakan men-scan database. Support artinya jumlah transaksi dalam database yg mengandung ke 2 item dalam kandidat dua-itemset. Setelah support dari semua kandidat 2-itemset didapatkan, kandidat 2-itemset yang memenuhi syarat minimum support dapat ditetapkan sebagai dua-itemset yang jua adalah pola frekuensi tinggi menggunakan panjang dua.(Pramudiono, 2007)

Untuk selanjutnya iterasi iterasi ke-k dapat dibagi lagi menjadi beberapa bagian :

1. Pembentukan kandidat itemset
Kandidat k-itemset dibuat berdasarkan kombinasi (k-1)-itemset yang didapat berdasarkan perulangan sebelumnya. Satu karakteristik menurut prosedur pemecahan apriori merupakan adanya pemangkasan kandidat k-itemset yg subset-nya yang berisi k-1 item nir termasuk pada pola frekuensi tinggi dengan panjang k-1.

2. Penghitungan support menurut tiap kandidat k-itemset
Support berdasarkan tiap kandidat k-itemset didapat dengan men-scan database buat menghitung jumlah transaksi yang memuat seluruh item pada dalam kandidat k-itemset tersebut. Ini adalah jua ciri menurut algoritma apriori yaitu diperlukan penghitungan dengan scan seluruh database sebesar k-itemset terpanjang.

3. Tetapkan pola frekuensi tinggi
Pola frekuensi tinggi yg memuat k item atau k-itemset ditetapkan dari kandidat k-itemset yg support-nya lebih akbar dari minimum support. Kemudian dihitung confidence masing-masing kombinasi item. Iterasi berhenti ketika seluruh item sudah dihitung sampai nir terdapat kombinasi item lagi. (Pramudiono, 2007)

Secara ringkas algoritma apriori sebagai berikut :
Create L1 = set of supported itemsets of cardinality one 
Set k to 2
while (Lk−1 _= ∅)  
Create Ck from Lk−1
Prune all the itemsets in Ck that are not
supported, to create Lk
Increase k by 1
}
The set of all supported itemsets is L1 ∪ L2 ∪ · · · ∪ Lk 

Selain algoritma apriori, terdapat jua prosedur pemecahan lain seperti FP-Grwoth. 
Perbedaan algoritma apriori dengan FP-Growth pada banyaknya scan database. Algoritma apriori melakukan scan database setiap kali iterasi sedangkan algoritma FP-Growth hanya melakukan sekali pada awal (Bramer, 2007).

Decision Tree
Dalam decision tree nir menggunakan vector jarak buat mengklasifikasikan obyek. Seringkali data observasi mempunyai atribut-atribut yang bernilai nominal. Seperti yg diilustrasikan pada gambar 2.6, misalkan obyeknya adalah sekumpulan butir-buahan yang mampu dibedakan berdasarkan atribut bentuk, warna, ukuran serta rasa. Bentuk, warna, ukuran dan rasa adalah besaran nominal, yaitu bersifat kategoris serta tiap nilai tidak sanggup dijumlahkan atau dikurangkan. Dalam atribut warna ada beberapa nilai yg mungkin yaitu hijau, kuning, merah. Dalam atribut ukuran terdapat nilai akbar, sedang serta mini . Dengan nilai-nilai atribut ini, kemudian dibuat decision tree buat memilih suatu obyek termasuk jenis butir apa jika nilai tiap-tiap atribut diberikan (Santoso, 2007).

Ada beberapa macam prosedur pemecahan decision tree diantaranya CART serta C4.5. Beberapa gosip utama dalam decision tree yang sebagai perhatian yaitu seberapa detail pada menyebarkan decision tree, bagaimana mengatasi atribut yang bernilai continues, menentukan ukuran yg cocok buat penentuan atribut, menangani data pelatihan yg memiliki data yg atributnya tidak memiliki nilai, memperbaiki efisiensi perhitungan (Santoso, 2007).decision tree sinkron digunakan buat perkara-masalah yg keluarannya bernilai diskrit. Walaupun poly variasi contoh decision tree menggunakan taraf kemampuan dan syarat yang tidak selaras, pada umumnya beberapa karakteristik yang cocok buat diterapkannya decision tree adalah sebagai berikut :
1. Data dinyatakan menggunakan pasangan atribut dan nilainya
2. Label/keluaran data umumnya bernilai diskrit
3. Data memiliki missing value (nilai berdasarkan suatu atribut tidak diketahui)

Dengan cara ini akan gampang mengelompokkan obyek ke dalam beberapa gerombolan . Untuk menciptakan decision tree perlu memperhatikan hal-hal berikut adalah :
1. Atribut mana yg akan dipilih buat pemisahan obyek
2. Urutan atribut mana yang akan dipilih terlebih dahulu
3. Struktur tree
4. Kriteria pemberhentian
5. Pruning 
(Santoso, 2007)

Clustering
Clustering termasuk metode yang telah relatif dikenal dan banyak dipakai pada data mining. Sampai sekarang para ilmuwan pada bidang data miningmasih melakukan banyak sekali bisnis buat melakukan perbaikan contoh clustering lantaran metode yg dikembangkan sekarang masih bersifat heuristic. Usaha-bisnis buat menghitung jumlah cluster yg optimal dan pengklasteran yang paling baik masih terus dilakukan. Dengan demikian menggunakan metode yg kini , tidak bisa mengklaim hasil pengklasteran sudah merupakan output yang optimal. Tetapi, output yang dicapai biasanya sudah relatif rupawan dari segi praktis.

Tujuan utama berdasarkan metode clustering merupakan pengelompokan sejumlah data/obyek ke alam cluster (group) sebagai akibatnya pada setiap cluster akan berisi data yg semirip mungkin seperti diilustrasikan dalam gambar dua.7. Dalam clustering metode ini berusaha buat menempatkan obyek yang mirip (jaraknya dekat) dalam satu klaster serta membuat jeda antar klaster sejauh mungkin. Ini berarti obyek dalam satu cluster sangat mirip satu sama lain dan tidak sama menggunakan obyek pada cluster-cluster yg lain. Dalam metode ini tidak diketahui sebelumnya berapa jumlah cluster dan bagaimana pengelompokannya (Santoso, 2007).

Software Aplikasi
Software pelaksanaan terdiri atas acara yang berdiri sendiri yg mampu mengatasi kebutuhan bisnis tertentu. Aplikasi memfasilitasi operasi bisnis atau pengambilan keputusan manajemen juga teknik menjadi tambahan pada aplikasi pemrosesan data konvensional. Sofware aplikasi digunakan buat mengatur fungsi usaha secara real time (Pressman, 2005).

Desain Model Aplikasi
Desain contoh berdasarkan pelaksanaan terdiri menurut physical contoh serta logical model. Physical contoh bisa digambarkan dengan bagan alir sistem. Logical contoh pada sistem liputan lebih menjelaskan kepada pengguna bagaimana nantinya fungsi-fungsi pada sistem warta secara logika akan bekerja. Logical contoh dapat digambarkan menggunakan DFD (Data Flow Diagram) serta kamus data (Data Dictionary). Adapun penjelasan berdasarkan indera bantu pada desain contoh adalah sebagai berikut :

1. Diagram Konteks (Context Diagram)
Diagram konteks merupakan sebuah diagram sederhana yg mendeskripsikan interaksi antara proses serta entitas luarnya. Adapun simbol-simbol pada diagram konteks seperti dijelaskan dalam tabel dua.2.


DFD (Data Flow Diagram)
DFD adalah suatu contoh akal yg mendeskripsikan dari data dan tujuan data yg keluar berdasarkan sistem, serta menggambarkan penyimpanan data dan proses yg mentranformasikan data. DFD memberitahuakn interaksi antara data dalam sistem dan proses dalam sistem. Beberapa simbol yg dipakai dalam DFD diterangkan pada tabel


Perancangan Perangkat Lunak
Proses perancangan sistem membagi persyaratan dalam sistem perangkat keras atau perangkat lunak. Kegiatan ini memilih arsitektur sistem secara keseluruhan. Perancangan aplikasi melibatkan identifikasi serta deskripsi abstraksi sistem aplikasi yang fundamental dan hubungan-hubungannya (Sommerville, 2003). Sebagaimana persyaratan, desain didokumentasikan serta menjadi bagian berdasarkan konfigurasi aplikasi (Pressman, 1997). Tahap desain mencakup perancangan data, perancangan fungsional, serta perancangan antarmuka. 

1. Perancangan data
Perancangan data mentransformasikan contoh data yg didapatkan sang proses analisis sebagai struktur data yang diperlukan pada ketika pembuatan program (coding). Selain itu juga akan dilakukan desain terhadap struktur database yg akan dipakai. 

2. Perancangan fungsional
Perancangan fungsional menggambarkan kebutuhan fungsi-fungsi primer perangkat lunak.

3. Perancangan antarmuka 
Perancangan antarmuka mendefinisikan bagaimana pengguna (user) serta aplikasi berkomunikasi dalam menjalankan fungsionalitas aplikasi.

Implementasi serta Pengujian Unit
Pada tahap ini, perancangan software direalisasikan menjadi serangkaian program atau unit program. Kemudian pengujian unit melibatkan pembuktian bahwa setiap unit acara sudah memenuhi spesifikasinya (Sommerville, 2003).program sebaiknya dirilis sesudah dikembangkan, diuji buat memperbaiki kesalahan yang ditemukan dalam pengujian buat mengklaim kualitasnya (Padmini, 2005). Terdapat 2 metode pengujian yaitu : 
1) Metode white box yaitu pengujian yang serius dalam nalar internal aplikasi (source code program).
2) Metode black box yaitu mengarahkan pengujian buat menemukan kesalahan-mesalahan dan memastikan bahwa input yg dibatasi akan memberikan output aktual yang sinkron dengan hasil yg diperlukan. Pada tahap pengujian, penulis melakukan metode black box yaitu menguji fungsionalitas berdasarkan software saja tanpa harus mengetahui struktur internal program (source code).

PENGERTIAN DAN MANFAAT KOMPRESSING

Pengertian Dan Manfaat Kompressing
Dalam ilmu personal komputer serta teori berita , kompresi data atau sumber pengkodean adalah proses encoding fakta menggunakan menggunakan lebih sedikit bit (atau unit warta-bantalan lainnya) menurut sebuah unencoded representasi akan menggunakan, melalui penggunaan spesifik pengkodean skema. 

Dalam komputasi, deduplication data merupakan teknik kompresi data spesifik buat menghilangkan data-grained berlebihan kasar, umumnya buat menaikkan utilisasi storage. 

Seperti komunikasi apapun, dikompresi komunikasi data hanya bekerja jika ke 2 pengirim serta penerima informasi memahami skema pengkodean. Misalnya, teks ini lumrah hanya apabila penerima mengerti bahwa itu merupakan dimaksudkan buat ditafsirkan menjadi karakter yang mewakili bahasa InggrisDemikian jua, data terkompresi hanya bisa dipahami bila metode decoding diketahui sang penerima. 

Kompresi bermanfaat lantaran membantu mengurangi konsumsi sumber daya mahal, misalnya hard disk space atau transmisi bandwidth . Pada sisi negatifnya, data dikompresi wajib didekompresi untuk digunakan, serta ini pengolahan tambahan mungkin merugikan beberapa pelaksanaan. Sebagai model, skema kompresi buat video mungkin memerlukan perangkat keras mahal buat video yg akan didekompresi cukup cepat untuk ditinjau lantaran sedang decompressed (pilihan buat dekompresi video secara penuh sebelum menonton mungkin nyaman, serta membutuhkan ruang penyimpanan buat decompressed video). Rancangan skema kompresi data sebagai akibatnya melibatkan trade-off antara aneka macam faktor, termasuk taraf kompresi, jumlah distorsi memperkenalkan (apabila memakai skema kompresi lossy ), dan sumber daya komputasi yg diperlukan buat kompres serta uncompress data. 

Ada 2 kompresi data
a. Lossy 
Lossy kompresi gambaran digunakan pada kamera digital , buat menaikkan kapasitas penyimpanan menggunakan minimal penurunan kualitas gambar. Demikian pula, DVD menggunakan lossy MPEG-dua Video codec buat kompresi video . 

Dalam lossy kompresi audio , metode psychoacoustics dipakai buat menghapus non-terdengar (atau kurang terdengar) komponen dari frekuwensi. Kompresi berbicara insan tak jarang dilakukan menggunakan teknik khusus bahkan lebih, sebagai akibatnya " pidato kompresi "atau" suara coding "kadang-kadang dibedakan menjadi suatu disiplin yg terpisah dari" kompresi audio ". Audio yg berbeda dan kompresi baku pidato terdaftar pada bawah codec audio . Suara kompresi akan dipakai pada telepon Internet misalnya, ad interim kompresi audio yang digunakan buat CD ripping dan diterjemahkan oleh pemain audio. 

Berikut ciri-karakteristik 
  • Terdapat kabar yang hilang dalam waktu sampai pada pendengaran dan mata manusia. 
  • Digunakan pada kompresi objek audio, image, video dimana keakuratan data absolut tidak dibutuhkan. 
  • Contoh: apabila video image dikompres menggunakan basis frame-by- frame hilangnya data pada satu frame nir mensugesti penglihatan. 
  • Aplikasi: medical screening systems, video conferencing, dan multimedia messaging systems. 
  • Metode kompresi yg banyak dipakai adalah standar JPEG. 
b. Lossless 
Berikut ini cirri-karakteristik:
  • Data tidak berubah atau hilang dalam proses kompresi atau dekompresi 
  • Membuat satu replika berdasarkan objek asli 
  • Menghilangkan iterasi karakter 
  • Digunakan dalam data teks dan image 
  • Pada saat dilakukan dekompres, perulangan karakter diinstal pulang 
Standart compressing lossless yaitu:
1. Packbits encoding (Run-length encoding) 
  • Kompresi data paling sederhana dan digunakan pada awal penggunaan kompresi. 
  • Digunakan buat kompresi image hitam-putih (binary). 
  • String karakter yg berulang menempati dua byte: 
  • Byte pertama berisi jumlah dari banyaknya perulangan 
  • Byte ke 2 berisi karakter itu sendiri 
  • Dilakukan pada satu baris (atau scanline), dan nir digunakan pada baris yang memiliki jumlah scanline poly. 
  • Byte lebih akbar dari pada byte image orisinil. Efek ini dianggap reverse compression atau negative compression. 
2. CCIT Group 3 1D
  • Berdasarkan run-length encoding, scanline dilakukan dalam pixel menurut rona yang sama (hitam atau putih). 
  • Hanya buat image hitam-putih, bukan grayscale atau rona. 
  • Aplikasi primer digunakan dalam faksimil dan dalam awal document imaging. 
  • Menggunakan Huffman encoding buat encoding pixel runlength pada CCIT Group tiga dan Group 4. 
Keuntungan: 
  • Sederhana pada implementasi 
  • Menjadi standar faksimil dan aplikasi document imaging 
Kerugian: 
  • Satu dimensi menggunakan code setiap baris atau garis terpisah. 
  • Tanpa prosedur buat melindungi dari kesalahan. 
3. CCIT GRoup tiga 2D 
4. CCIT Group 4 
  • Dua dimensi tanpa faktor K, yaitu garis seluruhnya.
  • Garis referensi pertama merupakan semua garis putih pada image permukaan. 
  • Group pertama dari pixel (scanline) dikode yg menduga garis putih menjadi garis referensi berdasarkan garis berikutnya. 
  • Mendapatkan level kompresi yg tinggi.
5. Lempel-Ziv and Welch aalgoruthm LZW 
The Lempel-Ziv (LZ) metode kompresi adalah salah satu algoritma paling populer buat penyimpanan lossless. Mengempis merupakan variasi LZ yg dioptimalkan buat kecepatan dekompresi serta rasio kompresi, sehingga kompresi ini bisa lambat. Deflate dipakai dalam PkZip , gzip dan PNG . LZW (Lempel-Ziv-Welch) digunakan pada gambar GIF. Juga patut diperhatikan merupakan LZR (LZ-Renau) metode, yang melayani menjadi dasar berdasarkan metode Zip. Metode LZ memanfaatkan contoh kompresi berbasis tabel pada mana entri tabel diganti buat string data yang diulang. Untuk metode yg paling LZ, tabel ini didapatkan secara bergerak maju berdasarkan data sebelumnya pada input. Tabel sendiri acapkali Huffman dikodekan (contohnya Shri, LZX). Dari skema coding LZ arus yang baik merupakan melakukan LZX , digunakan dalam Microsoft CAB format. 

Yang sangat kompresor terbaik menggunakan model probabilistik, di mana prediksi yang digabungkan dengan algoritma yang dianggap aritmatika coding. Arithmetic coding, diciptakan sang Jorma Rissanen , serta berubah menjadi metode simpel oleh Witten, Neal, dan Cleary, mencapai kompresi lebih unggul berdasarkan prosedur pemecahan Huffman dikenal-baik, serta cocok terutama baik buat konteks data kompresi adaptif tugas dimana prediksi sangat- tergantung. Pengkodean aritmatika dipakai pada baku kompresi gambar-bilevel JBIG , serta dokumen-standar kompresi DjVu . Entri teks sistem, Dasher , adalah-terbalik aritmatika-coder. 

Lossless versus kompresi lossy
Losseless prosedur pemecahan kompresi memanfaatkan redundansi umumnya statistik sedemikian rupa buat mewakili pengirim data lebih singkat tanpa kesalahan. Kompresi Lossless dimungkinkan karena sebagian besar dunia nyata telah redundansi data statistik. Sebagai model, dalam teks bahasa Inggris, 'e' alfabet jauh lebih generik daripada huruf 'z', dan probabilitas bahwa 'q' huruf akan diikuti oleh alfabet 'z' sangat mini . Kompresi jenis lain, disebut kompresi lossy data atau persepsi coding , adalah mungkin jika beberapa kehilangan kesetiaan diterima. Umumnya, sebuah kompresi data lossy akan dipandu sang penelitian mengenai bagaimana orang melihat data tadi. Sebagai model, mata manusia lebih sensitif terhadap variasi halus dalam terperinci daripada variasi warna. JPEG kompresi gambar yang bekerja di sebagian sang "pembulatan" beberapa informasi penting ini-kurang. Lossy kompresi data menyediakan cara buat mendapatkan kesetiaan terbaik buat jumlah yang diberikan kompresi. Dalam beberapa masalah, transparan (unnoticeable) kompresi yg diinginkan, dalam perkara lain, kesetiaan adalah dikorbankan untuk mengurangi jumlah data sebesar mungkin. 

Skema kompresi Lossless adalah reversibel sehingga data asli dapat direkonstruksi, ad interim skema lossy mendapat beberapa hilangnya data buat mencapai kompresi yang lebih tinggi. 

Namun, algoritma kompresi lossless data akan selalu gagal buat kompres beberapa arsip, memang, setiap algoritma kompresi tentu akan gagal buat kompres data tidak berisi pola-pola yg kentara. Upaya buat kompres data yang sudah dikompres umumnya sudah demikian akan menghasilkan sebuah perluasan, seperti yg akan mencoba buat menekan seluruh tapi yg paling sepele dienkripsi data. 

Dalam prakteknya, data lossy kompresi jua akan datang ke titik pada mana memadatkan lagi tidak bekerja, walaupun suatu prosedur pemecahan yg sangat lossy, misalnya misalnya selalu mengeluarkan byte terakhir menurut sebuah arsip, akan selalu kompres arsip hingga ke titik di mana ia kosong . 

Contoh kompresi lossy vs lossless merupakan string berikut: 

String ini bisa dikompresi menjadi: 

Diartikan sebagai, "25 poin 9 delapan", string aslinya diciptakan paripurna, hanya ditulis dalam bentuk yg lebih mini . In a lossy system, using Dalam sistem lossy, memakai 

Sebaliknya, data asli niscaya hilang, pada manfaat menurut file yang lebih kecil. 

Kompresi Gambar
Kompresi gambar merupakan aplikasi kompresi data. Akibatnya, tujuannya adalah untuk mengurangi redundansi menurut data gambaran dalam rangka buat bisa menyimpan atau mengirimkan data dalam bentuk yg efisien.

kompresi Gambar bisa lossy atau lossless . Kompresi Lossless lebih disukai buat keperluan arsip dan sering untuk pencitraan medis, gambar teknis, clip art , atau komik. Hal ini karena metode kompresi lossy, terutama waktu dipakai pada rendah laju bit , memperkenalkan artefak kompresi . Metode Lossy sangat cocok buat gambaran natural seperti foto dalam aplikasi mana kecil (kadang-kadang tak terlihat) hilangnya kesetiaan bisa diterima buat mencapai pengurangan substansial dalam bit rate. Kompresi lossy yang membuat disparitas tidak terlihat mampu diklaim visual lossless . 

Metode buat kompresi gambar lossless merupakan: 
  • Run-length encoding digunakan sebagai metode standar dalam PCX serta sebagai galat satu kemungkinan di BMP , TGA , TIFF
  • DPCM serta Predictive Coding
  • Entropy Encoding
  • Kamus adaptif algoritma seperti LZW digunakan dalam GIF dan TIFF
  • Deflasi yang digunakan pada PNG, MNG, serta TIFF
Metode untuk kompresi lossy: 
  • Mengurangi ruang rona ke rona yang paling umum dalam gambar. Warna-rona yang dipilih akan dipengaruhi pada palet warna pada header berdasarkan gambar terkompresi. Setiap piksel referensi hanya indeks rona dalam palet warna. Metode ini dapat dikombinasikan menggunakan dithering buat menghindari posterization . 
  • Chroma subsampling . Ini merogoh keuntungan dari kabar bahwa mata insan perceives perubahan spasial kecerahan lebih tajam dibandingkan dengan warna, menggunakan homogen-homogen atau menjatuhkan beberapa berita chrominance dalam gambar. 
  • Transform coding . Ini adalah metode yang paling umum dipakai. A -transform Fourier terkait seperti DCT atau transformasi wavelet diterapkan, diikuti sang kuantisasi dan entropy coding . 
  • Fractal kompresi . 

Properti Lain 
Kualitas gambar terbaik pada diberikan rate-bit (atau tingkat kompresi) adalah tujuan primer menurut kompresi gambar, bagaimanapun, terdapat sifat penting lainnya menurut skema kompresi gambaran.

Skalabilitas 
Skabilitas umumnya mengacu pada penurunan kualitas dapat dicapai sang manipulasi bitstream atau file (tanpa dekompresi serta re-kompresi). Nama lain buat skalabilitas yang bitstreams coding atau tertanam progresif. Meskipun sifat sebaliknya perusahaan, skalabilitas pula bisa ditemukan dalam lossless codec, umumnya pada bentuk scan pixel kasar-buat-baik saja. Skalabilitas ini sangat berguna buat melihat pratinjau gambar waktu men-download (contohnya, pada web browser) atau buat menyediakan akses kualitas variabel contohnya, database. Ada beberapa jenis skalabilitas: 
  • Kualitas progresif atau lapisan progresif: bitstream ini berturut-turut menyempurnakan gambar direkonstruksi. 
  • Resolusi progresif: Pertama encode resolusi gambar yg lebih rendah, lalu menyandikan disparitas buat resolusi yang lebih tinggi. 
  • Komponen progresif: Pertama encode abu-abu, lalu rona. 
Region Of Interest Coding 
Bagian-bagian tertentu dari gambar yang dikodekan menggunakan kualitas yang lebih tinggi daripada yang lain. Hal ini bisa dikombinasikan menggunakan skalabilitas (menyandikan bagian pertama ini, yg lain nanti). 

Meta Information 
Compressed data bisa berisi berita tentang gambar yg bisa digunakan buat dikategorikan, pencarian, atau mengakses foto-foto. Informasi tersebut bisa meliputi serta tekstur statistik warna, kecil pratinjau gambar, dan penulis atau informasi hak cipta. 

Pengolahan Kekuasaan
Algoritma kompresi membutuhkan jumlah yg berbeda menurut kekuatan pemrosesan buat encode dan decode. Beberapa algoritma kompresi tinggi memerlukan kekuatan pemrosesan tinggi. 

Kualitas metode kompresi seringkali diukur dengan rasio signal-to-noise Puncak Ini mengukur jumlah kebisingan diperkenalkan melalui kompresi lossy gambar, namun, penilaian subjektif penampil juga dipercaya menjadi langkah penting, mungkin, menjadi ukuran yang paling krusial.

Kompresi Audio (Data)
Kompresi Audio merupakan bentuk kompresi data yang dirancang buat mengurangi kebutuhan bandwidth transmisi digital audio stream serta ukuran penyimpanan file audio. Audio kompresi algoritma diimplementasikan dalam software personal komputer menjadi codec audio . Algoritma kompresi data Generik berkinerja tidak baik dengan data audio, sporadis mengurangi ukuran data jauh pada bawah 87% menurut aslinya serta tidak didesain buat dipakai pada aplikasi real time. Akibatnya, dioptimalkan secara spesifik audio lossless serta lossy prosedur pemecahan telah dibentuk. Lossy prosedur pemecahan lossy memberikan tingkat kompresi yang lebih akbar dan digunakan dalam perangkat konsumen mainstream audio. 

Dalam ke 2 dan lossless kompresi lossy, redundansi fakta berkurang, dengan menggunakan metode seperti pengkodean , pengenalan pola serta prediksi linier buat mengurangi jumlah keterangan yg dipakai buat mewakili data terkompresi. 

Trade-off antara kualitas audio sedikit berkurang serta transmisi atau berukuran penyimpanan sebanding dengan yang ke 2 buat aplikasi audio yang paling mudah di mana pengguna mungkin tidak akan mencicipi kerugian pada rendisi kualitas pemutaran. Misalnya, keliru satu Compact Disc memegang lebih kurang satu jam berdasarkan kesetiaan musik terkompresi tinggi, kurang menurut dua jam musik terkompresi losslessly, atau 7 jam musik yg dikompresi dalam MP3 format pada media bit rate . 

Audio Kompresi Lossless 
Kompresi lossless audio membentuk representasi data digital yg dapat diperluas ke sempurna digital duplikat dari stream audio orisinil.hal ini kontras menggunakan perubahan ireversibel dalam playback menurut teknik kompresi lossy misalnya Vorbis dan MP3 . Rasio kompresi adalah sama menggunakan yang buat data kompresi lossless umum (lebih kurang 50-60% dari ukuran orisinil ), dan secara substansial kurang berdasarkan buat kompresi lossy, yang umumnya membentuk lima-20% menurut ukuran aslinya

Kesulitan Dalam Kompresi Data Audio Lossless 
Sulit buat menjaga seluruh data pada genre audio dan mencapai kompresi substansial. Pertama, sebagian akbar rekaman bunyi sangat kompleks, direkam dari global nyata. Sebagai keliru satu metode kompresi kunci adalah buat menemukan pola serta pengulangan, data yg lebih kacau seperti audio tidak kompres menggunakan baik. Dalam cara yg sama, foto-foto kompres kurang efisien dengan metode lossless menurut gambar yg didapatkan komputer sederhana lakukan. Tapi yang menarik, bahkan personal komputer yg dihasilkan suara bisa berisi sangat rumit bentuk gelombang yg sebagai tantangan buat prosedur pemecahan kompresi poly. Hal ini ditimbulkan sifat gelombang audio, yg umumnya sulit buat menyederhanakan tanpa konversi (selalu lossy) buat liputan frekuensi, seperti yang dilakukan sang telinga insan. 

Alasan kedua adalah bahwa nilai-nilai berdasarkan audio sample berubah sangat cepat, umum data sebagai akibatnya kompresi prosedur pemecahan tidak bekerja dengan baik buat audio, serta string byte berturut-turut tidak umumnya muncul sangat tak jarang. Tetapi, konvolusi menggunakan] filter [-1 1 (yaitu, merogoh turunan pertama) cenderung sedikit memutihkan ( decorrelate, menciptakan datar) spektrum, sebagai akibatnya memungkinkan kompresi lossless tradisional di encoder buat melakukan tugasnya; integrasi di decoder mengembalikan frekuwensi asli. Codec seperti FLAC, Mempersingkat dan TTA memakai prediksi linier untuk memperkirakan spektrum sinyal. Pada encoder, sebaliknya adalah estimator digunakan untuk memutihkan frekuwensi dengan menghapus puncak spektrum sedangkan estimator digunakan buat merekonstruksi frekuwensi orisinil di decoder. 

Kriteria Evaluasi 
Lossless audio codec nir memiliki kasus kualitas, sehingga kegunaan bisa diperkirakan oleh 
  • Kecepatan kompresi dan dekompresi 
  • Tingkat kompresi 
  • Ketahanan dan koreksi kesalahan 
  • Dukungan produk 
Kompresi Audio Lossy 
Kompresi audio lossy dipakai pada banyak sekali aplikasi. Selain aplikasi eksklusif (mp3 player atau personal komputer ), kompresi digital audio stream yg dipakai dalam DVD video paling; televisi digital, media streaming di internet , satelit dan kabel radio, dan semakin dalam siaran radio terestrial. Kompresi lossy umumnya mencapai kompresi yg jauh lebih besar daripada kompresi lossless (data dari 5 persen sebagai 20 % menurut genre orisinil, bukan berdasarkan 50 persen sebagai 60 %), menggunakan membuang data yang kurang-kritis. 

Inovasi menurut kompresi audio lossy adalah menggunakan psychoacoustics buat mengakui bahwa nir semua data dalam aliran audio bisa dirasakan sang sistem pendengaran insan. Kompresi lossy Kebanyakan mengurangi redundansi persepsi sang bunyi mengidentifikasi pertama yang dianggap nir relevan perseptual, yaitu, bunyi yang sangat sulit buat mendengar. Contoh generik termasuk frekuensi tinggi, atau suara yang terjadi pada saat yang sama dengan suara keras. Mereka bunyi yg dikodekan dengan akurasi menurun atau tidak kode sama sekali. 

Jika mengurangi redundansi persepsi tidak mencapai kompresi yg cukup untuk aplikasi eksklusif, mungkin memerlukan kompresi lebih lanjut lossy. Tergantung dalam asal audio, ini masih belum dapat membentuk perbedaan mencolok. Pidato misalnya bisa dikompresi jauh lebih berdasarkan musik. Kebanyakan skema kompresi lossy memungkinkan kompresi parameter wajib diubahsuaikan buat mencapai taraf target data, umumnya dinyatakan sebagai bit rate . Sekali lagi, reduksi data akan dipandu sang beberapa contoh betapa pentingnya suara adalah sebagai dirasakan sang telinga insan, dengan tujuan efisiensi dan kualitas dioptimalkan buat tingkat target data (Ada banyak sekali model yg dipakai untuk analisis perseptual, beberapa lebih cocok untuk aneka macam jenis audio daripada yang lain.) Oleh karena itu, tergantung pada kebutuhan bandwidth dan penyimpanan, penggunaan kompresi lossy dapat mengakibatkan pengurangan persepsi kualitas audio yg berkisar menurut nir ada sampai parah, akan tetapi biasanya pengurangan jelas terdengar kualitas tidak bisa diterima buat pendengar. 

Karena data akan dihapus selama kompresi lossy serta tidak dapat dipulihkan oleh dekompresi, beberapa orang mungkin nir senang kompresi lossy buat penyimpanan file. Oleh karena itu, sebagaimana dicatat, bahkan mereka yang menggunakan kompresi lossy (buat pelaksanaan audio portabel, misalnya) mungkin ingin menyimpan file losslessly terkompresi buat aplikasi lain. Selain itu, teknologi kompresi terus maju, dan mencapai kompresi lossy state-of-the-art akan memerlukan satu buat memulai lagi menggunakan data lossless audio orisinil dan kompres dengan lossy codec baru. Sifat kompresi lossy (baik buat audio dan gambar) output dalam menaikkan penurunan kualitas jika data terkompress, lalu recompressed menggunakan kompresi lossy. 

Metode Coding 
a. Domain metode Transform 
Dalam rangka buat menentukan apa warta pada sinyal audio perseptual nir relevan, paling algoritma kompresi lossy memakai transformasi misalnya discrete cosine transform dimodifikasi (MDCT) untuk mengkonversi domain saat gelombang sampel sebagai transformasi domain. Setelah berubah, umumnya sebagai domain frekuensi , frekuensi komponen bisa dialokasikan bit menurut bagaimana didengar mereka. Kemampuan didengar komponen spektral dipengaruhi menggunakan terlebih dahulu menghitung ambang masking, di bawah ini yg diperkirakan bunyi akan berada pada luar batas persepsi manusia. 

Ambang masking dihitung dengan menggunakan ambang mutlak indera pendengaran dan prinsip-prinsip masking simultan kenyataan dimana sinyal tertutup oleh frekuwensi lain yg dipisahkan sang frekuensi dan, dalam beberapa kasus, temporal masking - pada mana sebuah sinyal tertutup sang frekuwensi lain dipisahkan sang saat. Sama-kontur kenyaringan jua bisa dipakai untuk bobot pentingnya persepsi dari komponen yang tidak sinkron. Model kombinasi telinga-otak insan memasukkan efek seperti ini acapkali disebut contoh psychoacoustic . 

b. Domain metode Waktu 
Coders ini memakai model generator bunyi itu (misalnya saluran suara manusia menggunakan LPC) buat memutihkan frekuwensi audio (yaitu, homogen spektrum-nya) sebelum kuantisasi. LPC juga bisa dianggap sebagai teknik pengkodean dasar persepsi; rekonstruksi frekuwensi audio menggunakan prediktor linier bentuk kebisingan kuantisasi koder ke pada spektrum menurut frekuwensi sasaran, sebagian masking itu. 

Aplikasi 
Karena sifat algoritma lossy, kualitas audio menderita jika file didekompress serta recompressed ( rugi generasi digital ). Hal ini menciptakan kompresi lossy tidak cocok buat menyimpan output antara pada aplikasi teknik audio profesional, misalnya mengedit bunyi serta merekam multitrack. Namun, mereka sangat terkenal menggunakan pengguna akhir (terutama MP3 ), sebagai satu megabyte dapat menyimpan lebih kurang satu mnt patut musik dalam kualitas memadai. 

Kegunaan 
Kegunaan menurut codec audio lossy ditentukan oleh: 
  • Persepsi kualitas audio 
  • Kompresi faktor 
  • Kecepatan kompresi dan dekompresi 
  • latency prosedur pemecahan (kritis buat pelaksanaan streaming real-time; lihat di bawah) 
  • Dukungan produk 
Format Lossy sering dipakai buat distribusi audio streaming, atau pelaksanaan interaktif (misalnya pengkodean buat transmisi digital pidato pada jaringan ponsel). Dalam pelaksanaan tadi, data wajib decompressed menjadi genre data, bukan setelah seluruh data stream telah terkirim. Tidak seluruh codec audio yang bisa dipakai buat pelaksanaan streaming, dan untuk pelaksanaan seperti codec yg dirancang untuk data stream efektif umumnya akan dipilih. 

Beberapa codec akan menganalisa segmen lagi data buat mengoptimalkan efisiensi, dan lalu kode tadi dengan cara yang membutuhkan segmen yang lebih besar data dalam satu saat buat decode. (Sering codec membuat segmen disebut "frame" buat membuat data segmen diskrit buat encoding dan decoding.) Yang inheren latensi menurut algoritma coding bisa sangat penting, misalnya, ketika terdapat 2 arah transmisi data, misalnya dengan telepon dialog, keterlambatan signifikan serius bisa menurunkan kualitas yg dirasakan. 

Berbeda dengan kecepatan kompresi, yg sebanding menggunakan jumlah operasi yg diperlukan sang algoritma, sini latency mengacu pada jumlah sampel yg wajib dianalisa sebelum blok audio diprosesDalam perkara minimum, latency merupakan 0 nol sampel (contohnya, apabila koder / decoder hanya mengurangi jumlah bit yang dipakai buat quantize frekuwensi). Time domain prosedur pemecahan domain Sisa misalnya LPC jua sering mempunyai latency rendah, maka popularitas mereka pada pidato pengkodean untuk telephonyDalam prosedur pemecahan seperti MP3, bagaimanapun, jumlah sampel yang harus dianalisa buat menerapkan contoh psychoacoustic pada domain frekuensi, serta latensi berada di urutan 23 ms (46 ms buat komunikasi 2 arah). 

Kompresi Video
Video kompresi mengacu buat mengurangi jumlah data yg dipakai untuk mewakili video digital gambar, dan adalah kombinasi menurut ruang kompresi gambar serta temporal kompensasi mobilitas. Kompresi video merupakan contoh dari konsep pengkodean sumber pada teori Informasi Artikel ini membahas aplikasi: video terkompresi secara efektif bisa mengurangi bandwidth yang dibutuhkan buat mengirimkan video melalui siaran terestrial , melalui TV kabel, atau melalui TV satelit layanan.

Kualitas Video 
Kebanyakan video kompresi lossy beroperasi pada premis bahwa poly data kini sebelum kompresi tidak dibutuhkan buat mencapai kualitas persepsi yang baik. Sebagai model, DVD menggunakan standar pengkodean video yang disebut MPEG-dua yg mampu memampatkan lebih kurang dua jam data video menggunakan 15 hingga 30 kali, ad interim masih membuat kualitas gambar yang biasanya dianggap berkualitas tinggi buat baku-definition video. Video kompresi merupakan tradeoff antara disk space, kualitas video, dan porto perangkat keras yg diperlukan buat dekompresi video dalam waktu yg masuk akal. Namun, bila video overcompressed secara lossy, terlihat (serta kadang-kadang mengganggu) artefak dapat timbul. 

Video kompresi umumnya beroperasi dalam kelompok berbentuk persegi tetangga piksel , yang acapkali dianggap makroblok . Kelompok-kelompok pixel atau blok pixel tersebut dibandingkan menurut satu frame ke depan dan codec kompresi video (encode / decode skema) hanya mengirim disparitas pada blok tersebut. Ini bekerja sangat baik apabila video memiliki mosi tidak. Masih kerangka teks, misalnya, dapat diulang menggunakan data yg ditransmisikan sangat sedikit. Di daerah video dengan gerakan lebih, lebih mengubah piksel dari satu frame ke yg berikutnya. Ketika poly piksel berubah, skema kompresi video harus mengirim lebih poly data buat bersaing dengan jumlah yang lebih akbar piksel yang berubah. Apabila konten video termasuk ledakan, api, kawanan ribuan burung, atau gambar lain dengan poly-frekuensi lebih jelasnya tinggi, kualitas akan turun, atau kecepatan bit variabel harus ditingkatkan buat menciptakan kabar ini ditambah dengan sama tingkat lebih jelasnya. 

Penyedia pemrograman mempunyai kontrol atas jumlah kompresi video diterapkan buat program video mereka sebelum dikirim ke sistem distribusi mereka. DVD, Blu-ray disc, serta HD DVD telah kompresi video diterapkan selama proses menguasai mereka, meskipun Blu-ray serta HD DVD mempunyai kapasitas disk yang relatif bahwa kompresi yg diterapkan dalam format ringan, jika dibandingkan dengan contoh seperti video paling streaming dalam yg internet , atau diambil pada ponsel . Software yg digunakan buat menyimpan video pada hard drive atau berbagai format cakram optik akan seringkali memiliki kualitas gambar yang lebih rendah, meskipun tidak dalam semua masalah. High-bitrate codec video menggunakan atau tanpa kompresi sedikit ada untuk video pasca produksi bekerja, tapi membuat arsip besar sangat dan karenanya hampir nir pernah digunakan buat distribusi video terselesaikan. Setelah kompresi video yg hiperbola lossy kompromi kualitas gambar, merupakan mustahil buat mengembalikan gambar buat kualitas aslinya. 

Intraframe Interframe Kompresi Versus 
Salah satu teknik yg paling bertenaga buat video mengompresi adalah kompresi interframe. Kompresi Interframe memakai satu atau lebih atau yang lebih baru frame sebelumnya pada urutan buat kompres frame lancar, sedangkan kompresi intraframe hanya memakai frame waktu ini, yg efektif kompresi gambar. 

Metode yang paling umum digunakan bekerja menggunakan membandingkan setiap frame pada video menggunakan yang sebelumnya. Apabila jendela mempunyai wilayah di mana tidak terdapat yang bergerak, sistem hanya mengeluarkan perintah pendek yg salinan yang bagian dari frame sebelumnya, bit-buat-bit, ke yg berikutnya. Jika bagian berdasarkan memindahkan bingkai menggunakan cara sederhana, kompresor memancarkan perintah (sedikit lebih panjang) yang menceritakan decompresser bergeser, memutar, meringankan, atau menggelapkan copy - perintah lagi, tapi masih jauh lebih pendek daripada kompresi intraframe. Kompresi Interframe bekerja menggunakan baik buat acara yg hanya akan diputar kembali sang penonton, tetapi bisa menyebabkan kasus apabila urutan video perlu diedit. 

Karena data kompresi interframe salinan dari satu frame ke yang lain, jika frame orisinil hanya dipotong (atau hilang di transmisi), frame berikut ini nir bisa direkonstruksi menggunakan benar. Format video Beberapa, misalnya DV, kompres setiap frame secara independen menggunakan menggunakan kompresi intraframe. 'Memotong' Pembuatan dalam intraframe-video terkompresi hampir semudah mengedit video tidak terkompresi - satu menemukan awal dan akhir setiap frame, dan hanya salinan-bit-bit buat setiap frame yg satu ingin tetap, serta membuang frame satu doesn 't inginkan. Perbedaan lain antara intraframe serta kompresi interframe merupakan bahwa dengan sistem intraframe, setiap frame menggunakan jumlah yg sama data. Dalam sistem interframe kebanyakan, frame tertentu (seperti " saya frame "dalam MPEG-2 ) tidak diizinkan buat menyalin data dari frame lain, dan memerlukan lebih poly data menurut frame lain pada sekitarnya. 

Hal ini dimungkinkan buat membangun sebuah editor video berbasis komputer yang spot masalah yang ditimbulkan saat saya berada pada luar frame diedit sementara frame lain membutuhkannya. Hal ini memungkinkan format yg lebih baru seperti HDV yang akan digunakan buat mengedit. Tetapi, proses ini menuntut daya komputasi lebih poly daripada intraframe editing video yg dikompresi menggunakan kualitas gambar yang sama. 

Bentuk Lancar 
Hari ini, hampir semua metode kompresi video yg generik dipakai (misalnya, yg pada baku disetujui oleh ITU-T atau ISO ) menerapkan discrete cosine transform (DCT) untuk mengurangi redundansi spasial. Metode lain, misalnya kompresi fraktal , pengejaran yang cocok dan penggunaan transformasi wavelet diskrit (DWT) sudah sebagai subyek dari beberapa penelitian, tetapi umumnya tidak digunakan pada produk praktis (kecuali buat penggunaan wavelet image coding masih pemrogram menjadi tanpa kompensasi mobilitas). Bunga pada kompresi fractal sepertinya berkurang, lantaran analisis teoritis baru-baru ini menunjukkan kurangnya perbandingan efektivitas metode tersebut. 

Menggunakan Kompresi Yang Tepat
Ada berbagai jenis kompresi buat pekerjaan yg tidak sama. There are audio codecs (like MP3 ) Ada codec audio (misalnya MP3 ) yang memungkinkan Anda buat cepat mendownload musik melalui internet serta banyak menyimpan lagu dalam pemutar portabel Anda. Ada juga codec video yang memungkinkan Anda menonton klip pendek dan TV memberitahuakn secara online, atau menciptakan DVD film dari rekaman video Anda sendiri pada rumah. 

Sebagian besar format audio / video digital memungkinkan Anda buat memilih taraf kompresi yang tidak sinkron ketika Anda sedang membentuk, atau encoding, file. Sebagai contoh, file MP3 bisa dikodekan dalam tingkat yang tidak sama dari kompresi buat aneka macam berukuran file serta kualitas suaraBerkas resolusi diukur pada satuan kilobyte per dtk (kbps) - yaitu, berapa ribu byte yang diharapkan buat menyimpan satu dtk musik. Angka ini dikenal sebagai bitrate. 

Semakin tinggi resolusinya, semakin banyak informasi menurut sumber asli dipertahankan. Sebuah file 256kbps, misalnya, memegang dua kali lebih banyak data menjadi arsip 128kbps.. Umumnya, semakin kecil bitrate, arsip lebih merupakan dikompresi dan semakin akan dikenakan penurunan kualitas. Tetapi, file yang lebih kecil lebih mudah buat menyimpan dan cepat buat men-download atau transfer. Ketika Anda mendownload file atau pengkodean Anda sendiri, mempertimbangkan bagaimana Anda akan menggunakan mereka, dan memilih dari pilihan kompresi Anda sesuai. 

Tabel ini menampakan ukuran arsip relatif lagu tiga menit yg sama disimpan dalam format yang berbeda, dimulai menggunakan lagu CD orisinil pada sebelah kiri. Semakin mini file, sonic lebih poly informasi yang hilang.

Beberapa jenis digital indera perekam audio serta video menggunakan kompresi untuk penyimpanan yg efisien. Encoders di aplikasi perangkat ini kompres konten dicatat selama proses perekaman. Berikut adalah beberapa contoh: 
  • Baik iTunes dan Windows Media Player software secara default kompres robek CD trek ke 128 kbps buat masing-masing format file mereka ( AAC untuk iTunes serta WMA untuk Windows Media Player). Hal ini secara signifikan mengurangi berukuran file, membiarkan kurang lebih 130 lagu yg disimpan dalam jumlah yang sama menurut memori yang file terkompresi asli akan membutuhkan. Baik iTunes serta Windows Media membiarkan Anda menyesuaikan bitrate buat baik kompresi lebih tinggi atau lebih rendah. 
  • DVD recorder memakai MPEG2 kompresi buat menyimpan film serta menunjukkan dalam cakram DVD kosong. Pengguna dapat hampir selalu menentukan dari berbagai ketika perekaman atau pengaturan kualitas gambar apa yg Anda benar-sahih menentukan merupakan bagaimana sangat rekaman Anda akan dikompresi. 
  • Kamera digital menggunakan JPEG kompresi gambar untuk memungkinkan banyak gambar buat disimpan dalam jumlah terbatas memori. Beberapa kamera membiarkan Anda mengambil foto tidak dikompresi (biasanya pada TIFF atau RAW arsip), yg merogoh beberapa kali lebih banyak memori dari gambar JPEG. 
Kompatibilitas dan aplikasi 
Ketika bekerja dengan audio atau video dalam PC Anda, Anda mungkin menemukan bahwa beberapa jenis arsip yang dapat dibuka sang lebih menurut satu aplikasi perangkat lunak. Beberapa jenis arsip bahkan dapat dipakai dalam sistem operasi yang tidak sama (seperti Windows dan Macintosh). Format file lainnya hanya dapat kompatibel dengan aplikasi khusus tunggal. Jika Anda men-download arsip audio / video, perlu diingat bahwa Anda wajib memiliki aplikasi yang kompatibel untuk membukanya dan menerjemahkannya balik ke bentuk bunyi atau ditinjau. 

Ketika tiba ke pengkodean arsip Anda sendiri, Anda mungkin menemukan bahwa beberapa pelaksanaan membuat lebih baik yg terdengar atau hasil yg lebih ganteng daripada yang lain. Demikian juga, bila Anda dihadapkan dengan pilihan antara 2 atau lebih format buat pekerjaan yang sama - misalnya, memilih antara arsip MP3 atau Windows Media Audio file buat player portabel Anda - Anda mungkin menemukan bahwa Anda mempunyai preferensi pribadi buat satu format atau lain. 

Ketika memilih antara format atau perangkat lunak, mencoba pilihan yang tersedia setiap kali Anda bisa untuk melihat apa yang terbaik buat Anda. Jika Anda akan file sharing menggunakan orang lain, tetap dengan codec generik untuk membantu memastikan kompatibilitas playback. 

Media streaming 
Meskipun arsip audio dan video terkompresi umumnya jauh lebih kecil daripada mentah, yang tidak dikompresi, mereka dapat tetap kadang-kadang membutuhkan ketika usang buat download - bahkan apabila Anda memiliki broadband atau koneksi internet DSL designer satu arah web bisa menciptakan konten audio dan video digital lebih mudah tersedia buat surfer higienis homogen-homogen merupakan melalui media streaming. 

Streaming merupakan teknik yg memungkinkan data yg akan diterjemahkan menjadi gambar yang bisa ditinjau atau bunyi terdengar "on the fly" yaitu, file bermain misalnya itu pada download. Streaming umumnya digunakan sang situs radio internet untuk menunjukkan musik terus menerus serta siaran warta. Banyak situs video online misalnya YouTube.com - menggunakan streaming pula. 

Data bisa dialirkan dalam Web pada kecepatan yg tidak sinkron. Koneksi Internet broadband memungkinkan Anda untuk mendapat streaming konten pada bitrate yang lebih tinggi daripada dial-up koneksi, serta lebih tinggi bitrate umumnya memberikan citra yg lebih baik dan / atau kualitas suara. 

Ada beberapa format arsip, seperti RealMedia serta Adobe Flash, yg dipakai hampir secara eksklusif di streaming aplikasi. Format lain, seperti MP3 buat audio serta MPEG4 buat video, dapat menaruh baik streaming dan download konten.