<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:georss="http://www.georss.org/georss" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:media="http://search.yahoo.com/mrss/"
	>

<channel>
	<title>Learning Community &#187; Datamining</title>
	<atom:link href="http://andyku.wordpress.com/category/datamining/feed/" rel="self" type="application/rss+xml" />
	<link>http://andyku.wordpress.com</link>
	<description>Menggapai Mimpi ............</description>
	<lastBuildDate>Mon, 12 Oct 2009 02:02:11 +0000</lastBuildDate>
	<generator>http://wordpress.com/</generator>
	<language>id</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<cloud domain='andyku.wordpress.com' port='80' path='/?rsscloud=notify' registerProcedure='' protocol='http-post' />
<image>
		<url>http://www.gravatar.com/blavatar/d2b8287eb518dc109464a3f531f8c177?s=96&#038;d=http://s.wordpress.com/i/buttonw-com.png</url>
		<title>Learning Community &#187; Datamining</title>
		<link>http://andyku.wordpress.com</link>
	</image>
			<item>
		<title>Melakukan Preprocessing Data</title>
		<link>http://andyku.wordpress.com/2008/11/21/melakukan-preprocessing-data/</link>
		<comments>http://andyku.wordpress.com/2008/11/21/melakukan-preprocessing-data/#comments</comments>
		<pubDate>Fri, 21 Nov 2008 05:56:03 +0000</pubDate>
		<dc:creator>andy</dc:creator>
				<category><![CDATA[Datamining]]></category>
		<category><![CDATA[Data]]></category>
		<category><![CDATA[Data mining]]></category>
		<category><![CDATA[Preprocessing]]></category>

		<guid isPermaLink="false">http://andyku.wordpress.com/?p=197</guid>
		<description><![CDATA[Tahapan dalam melakukan data mining salah satunya adalah preprosesing data. Pertanyaannya adalah mengapa data perlu di bersihkan sebelum diproses ?
Hal ini terjadi karena biasanya data yang akan digunakan belum baik, penyebabnya antara lain :
-	Incomplete : kekurangan nilai-nilai atribut atau  atribut tertentu lainnya.
-	Noisy : berisi kesalahan atau nilai-nilai outlier yang menyimpang dari yang diharapkan.
-	Inconsisten : [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=197&subd=andyku&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p>Tahapan dalam melakukan data mining salah satunya adalah preprosesing data. Pertanyaannya adalah mengapa data perlu di bersihkan sebelum diproses ?<br />
Hal ini terjadi karena biasanya data yang akan digunakan belum baik, penyebabnya antara lain :<br />
-	<strong>Incomplete</strong> : kekurangan nilai-nilai atribut atau  atribut tertentu lainnya.<br />
-	<strong>Noisy</strong> : berisi kesalahan atau nilai-nilai outlier yang menyimpang dari yang diharapkan.<br />
-	<strong>Inconsisten</strong> : ketidakcocokan dalam penggunaan kode atau nama.<br />
Disini kualitas data yang baik didasarkan oleh keputusan yang baik dan data warehouse memerlukan integrasi kualitas data yang konsisten.<br />
<span id="more-197"></span><br />
Beberapa hal yang perlu diperhatikan untuk mendapatkan data yang baik adalah :<br />
-	<strong>Accuracy</strong><br />
-	<strong>Completeness</strong><br />
-	<strong>Consistency</strong><br />
-	<strong>Timeliness</strong><br />
-	<strong>Value added</strong><br />
-	<strong>Interpretability</strong><br />
-	<strong>Accessibility</strong><br />
-	<strong>Contextual</strong><br />
-	<strong>Representational</strong></p>
<p>Teknik atau metode yang digunakan dalam data preprocessing, diantaranya:<br />
•	<strong>Data cleaning</strong>:<br />
Menghilangkan nilai-nilai data yang salah, memperbaiki kekacauan data dan memeriksa data yang tidak konsisten.<br />
•	<strong>Data integrasi</strong>:<br />
Menggabungkan data dari beberapa sumber (database, data cube, atau file) ke dalam penyimpanan data yang sesuai.<br />
•	<strong>Data transformasi</strong>:<br />
Normalisasi dan pengumpulan data sehingga menjadi sama.<br />
•	<strong>Data reduksi</strong>:<br />
Menguraikan data ke dalam bentuk yang lebih kecil ukurannya tetapi tetap menghasilkan hasil analitis yang sama.<br />
•	<strong>Data diskretisasi</strong>:<br />
Bagian dari data reduksi tetapi memiliki arti penting tersendiri, terutama untuk data numerik.</p>
<p><a href="http://andyku.files.wordpress.com/2008/11/proses-preprosesing.jpg"><img class="alignnone size-full wp-image-198" title="proses-preprosesing" src="http://andyku.files.wordpress.com/2008/11/proses-preprosesing.jpg?w=480&#038;h=429" alt="proses-preprosesing" width="480" height="429" /></a></p>
  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/andyku.wordpress.com/197/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/andyku.wordpress.com/197/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/andyku.wordpress.com/197/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/andyku.wordpress.com/197/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/andyku.wordpress.com/197/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/andyku.wordpress.com/197/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/andyku.wordpress.com/197/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/andyku.wordpress.com/197/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/andyku.wordpress.com/197/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/andyku.wordpress.com/197/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=197&subd=andyku&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://andyku.wordpress.com/2008/11/21/melakukan-preprocessing-data/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/131bb95564c2a9034fe7279c5d4209ba?s=96&#38;d=" medium="image">
			<media:title type="html">andy</media:title>
		</media:content>

		<media:content url="http://andyku.files.wordpress.com/2008/11/proses-preprosesing.jpg" medium="image">
			<media:title type="html">proses-preprosesing</media:title>
		</media:content>
	</item>
		<item>
		<title>Konsep Data Mining</title>
		<link>http://andyku.wordpress.com/2008/11/21/konsep-data-mining/</link>
		<comments>http://andyku.wordpress.com/2008/11/21/konsep-data-mining/#comments</comments>
		<pubDate>Fri, 21 Nov 2008 03:14:08 +0000</pubDate>
		<dc:creator>andy</dc:creator>
				<category><![CDATA[Datamining]]></category>
		<category><![CDATA[Data mining]]></category>

		<guid isPermaLink="false">http://andyku.wordpress.com/?p=192</guid>
		<description><![CDATA[Apa sebenarnya yang memotivasi datamining dan mengapa data mining begitu penting ?
Alasan utama mengapa data mining sangat menarik perhatian industri informasi dalam beberapa tahun belakangan ini adalah karena tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna.
Data mining adalah kegiatan mengekstraksi atau menambang pengetahuan [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=192&subd=andyku&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p>Apa sebenarnya yang memotivasi datamining dan mengapa data mining begitu penting ?</p>
<p>Alasan utama mengapa data mining sangat menarik perhatian industri informasi dalam beberapa tahun belakangan ini adalah karena tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna.</p>
<p>Data mining adalah kegiatan mengekstraksi atau menambang pengetahuan dari data yang berukuran/berjumlah besar, informasi inilah yang nantinya sangat berguna untuk pengembangan. Dimana langkah-langkah untuk melakukan data mining adalah sebagai berikut :</p>
<p><a href="http://andyku.files.wordpress.com/2008/11/step-datamining.jpg"><img class="alignnone size-full wp-image-193" title="step-datamining" src="http://andyku.files.wordpress.com/2008/11/step-datamining.jpg?w=480&#038;h=360" alt="step-datamining" width="480" height="360" /></a><br />
<span id="more-192"></span><br />
- Data cleaning (untuk menghilangkan noise data yang tidak konsisten) Data integration (di mana sumber data yang terpecah dapat disatukan)</p>
<p>- Data selection (di mana data yang relevan dengan tugas analisis dikembalikan ke dalam database)</p>
<p>- Data transformation (di mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)</p>
<p>- Data mining (proses esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data)</p>
<p>- Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik)</p>
<p>- Knowledge presentation (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambang kpada user).</p>
<p>Arsitektur dari data mining yang khas memiliki beberapa komponen utama yaitu :</p>
<p>- Database, data warehouse, atau tempat penyimpanan informasi lainnya.</p>
<p>- Server database atau data warehouse.</p>
<p>- Knowledge base</p>
<p>- Data mining engine.</p>
<p>- Pattern evolution module.</p>
<p>- Graphical user interface.</p>
<p>Ada beberapa jenis data dalam data mining yaitu :</p>
<p>- Relation Database : Sebuah sistem database, atau disebut juga database management system (DBMS), mengandung sekumpulan data yang saling berhubungan, dikenal sebagai sebuah database, dan satu set program perangkat lunak untuk mengatur dan mengakses data tersebut.</p>
<p>- Data Warehouse : Sebuah data warehouse merupakan sebuah ruang penyimpaan informasi yang terkumpul dari beraneka macam sumber, disimpan dalam skema yang menyatu, dan biasanya terletak pada sebuah site.</p>
<p>Kemudian pola seperti apa yang dapat ditambang ?</p>
<p>Kegunaan data mining adalah untuk menspesifikasikan pola yang harus ditemukan dalam tugas data mining. Secara umum tugas data mining dapat diklasifikasikan ke dalam dua kategori: deskriptif dan prediktif. Tugas menambang secara deskriptif adalah untuk mengklasifikasikan sifat umum suatu data di dalam database. Tugas data mining secara prediktif adalah untuk mengambil kesimpulan terhadap data terakhir untuk membuat prediksi.</p>
<p><strong>Konsep/Class Description</strong></p>
<p>Data dapat diasosiasikan dengan pembagian class atau konsep. Untuk contohnya, ditoko All Electronics, pembagian class untuk barang yang akan dijual termasuk komputer dan printer, dan konsep untuk konsumen adalah big Spenders dan budget Spender. Hal tersebut sangat berguna untuk menggambarkan pembagian class secara individual dan konsep secara ringkas, laporan ringkas, dan juga pengaturan harga. Deskripsi suatu class atau konsep seperti itu disebut class/concept descripition.</p>
<p><strong>Association Analysis</strong></p>
<p>Association analysis adalah penemuan association rules yang menunjukkan nilai kondisi suatu attribute yang terjadi bersama-sama secara terus-menerus dalam memmberikan set data. Association analysis secara luas dipakai untuk market basket atau analisa data transaksi.</p>
<p><strong>Klasifikasi dan Predikasi</strong></p>
<p>Klasifikasi dan prediksi mungkin perlu diproses oleh analisis relevan, yang berusaha untuk mengidentifikasi atribut-atribut yang tidak ditambahkan pada proses klasifikasi dan prediksi. Atribut-atribut ini kemudian dapat di keluarkan.</p>
<p><strong>Cluster Analysis</strong></p>
<p>Tidak seperti klasifikasi dan prediksi, yang menganalisis objek data dengan kelas yang terlabeli, clustering menganalisis objek data tanpa mencari keterangan pada label kelas yang diketahui. Pada umumnya, label kelas tidak ditampilkan di dalam latihan data simply, karena mereka tidak tahu bagaimana memulainya. Clustering dapat digunakan untuk menghasilkan label-label.</p>
<p><strong>Outlier Analysis</strong></p>
<p>§ Outlier dapat dideteksi menggunakan test yang bersifat statistik yang mengambil sebuah distribusi atau probabilitas model untuk data, atau menggunakan langkah-langkah jarak jauh di mana objek yang penting jauh dari cluster lainnya dianggap outlier.</p>
<p>§ Sebuah database mungkin mengandung objek data yang tidak mengikuti tingkah laku yang umum atau model dari data. data ini disebut outlier.</p>
<p><strong>Evolution Analysis</strong></p>
<p>Data analisa evolusi menggambarkan ketetapan model atau kecenderungan objek yang memiliki kebiasaan berubah setiap waktu. Meskipun ini mungkin termasuk karakteristik, diskriminasi, asosiasi, klasifikasi, atau clustering data berdasarkan waktu, kelebihan yang jelas seperti analisa termasuk analisa data time-series, urutan atau pencocockkan pola secara berkala, dan kesamaan berdasarkan analisa data.</p>
<p>Untuk melakukan data mining yang baik ada beberapa persoalan utama yaitu menyangkut metodologi mining dan interaksi user, performance dan perbedaan tipe database. Hal inilah yang sering kali dihadapi disaat kita ingin melakukan data mining.</p>
  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/andyku.wordpress.com/192/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/andyku.wordpress.com/192/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/andyku.wordpress.com/192/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/andyku.wordpress.com/192/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/andyku.wordpress.com/192/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/andyku.wordpress.com/192/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/andyku.wordpress.com/192/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/andyku.wordpress.com/192/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/andyku.wordpress.com/192/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/andyku.wordpress.com/192/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=192&subd=andyku&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://andyku.wordpress.com/2008/11/21/konsep-data-mining/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/131bb95564c2a9034fe7279c5d4209ba?s=96&#38;d=" medium="image">
			<media:title type="html">andy</media:title>
		</media:content>

		<media:content url="http://andyku.files.wordpress.com/2008/11/step-datamining.jpg" medium="image">
			<media:title type="html">step-datamining</media:title>
		</media:content>
	</item>
		<item>
		<title>Penerapan Data Mining</title>
		<link>http://andyku.wordpress.com/2008/04/17/penerapan-data-mining/</link>
		<comments>http://andyku.wordpress.com/2008/04/17/penerapan-data-mining/#comments</comments>
		<pubDate>Thu, 17 Apr 2008 05:46:52 +0000</pubDate>
		<dc:creator>andy</dc:creator>
				<category><![CDATA[Datamining]]></category>
		<category><![CDATA[Data mining]]></category>

		<guid isPermaLink="false">http://andyku.wordpress.com/?p=18</guid>
		<description><![CDATA[Sebagai cabang ilmu baru di bidang komputer (lihat artikel sebelumnya berjudul ‘Data Mining’) cukup banyak penerapan yang dapat dilakukann oleh Data Mining. Apalagi ditunjang ke-kaya-an dan ke-anekaragam-an berbagai bidang ilmu (artificial intelligence, database, statistik, pemodelan matematika, pengolahan citra dsb.) membuat penerapan data mining menjadi makin luas. Di bidang apa saja penerapan data mining dapat dilakukan? [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=18&subd=andyku&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p><span style="font-size:10pt;font-family:Verdana;">Sebagai cabang ilmu baru di bidang komputer (lihat artikel sebelumnya berjudul ‘Data Mining’) cukup banyak penerapan yang dapat dilakukann oleh Data Mining. Apalagi ditunjang ke-kaya-an dan ke-anekaragam-an berbagai bidang ilmu (artificial intelligence, database, statistik, pemodelan matematika, pengolahan citra dsb.) membuat penerapan data mining menjadi makin luas. </span><span style="font-size:10pt;font-family:Verdana;">Di bidang apa saja penerapan data mining dapat dilakukan? Artikel singkat ini berusaha memberikan jawabannya.<br />
</span><span style="font-size:10pt;font-family:Verdana;"></span><span id="more-18"></span><span style="font-size:10pt;font-family:Verdana;"><strong>Analisa Pasar dan Manajemen </strong></span></p>
<p><span style="font-size:10pt;font-family:Verdana;">Untuk analisa pasar, banyak sekali sumber data yang dapat digunakan seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi tentang gaya hidup publik.<br />
Beberapa solusi yang bisa diselesaikan dengan data mining diantaranya:<br />
• <strong>Menembak target pasar</strong><br />
Data mining dapat melakukan pengelompokan (clustering) dari model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya.<br />
• <strong>Melihat pola beli pemakai dari waktu ke waktu</strong><br />
Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu. Sebagai contoh, ketika seseorang menikah bisa saja dia kemudian memutuskan pindah dari single account ke joint account (rekening bersama) dan kemudian setelah itu pola beli-nya berbeda dengan ketika dia masih bujangan.<br />
• <strong>Cross-Market Analysis</strong><br />
Kita dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu produk dengan produk lainnya. Berikut ini saya sajikan beberapa contoh:<br />
o Cari pola penjualan Coca Cola sedemikian rupa sehingga kita dapat mengetahui barang apa sajakah yang harus kita sediakan untuk meningkatkan penjualan Coca Cola?<br />
o Cari pola penjualan IndoMie sedemikian rupa sehingga kita dapat mengetahui barang apa saja yang juga dibeli oleh pembeli IndoMie. Dengan demikian kita bisa mengetahui dampak jika kita tidak lagi menjual IndoMie.<br />
o Cari pola penjualan<br />
• <strong>Profil Customer</strong><br />
Data mining dapat membantu Anda untuk melihat profil customer/pembeli/nasabah sehingga kita dapat mengetahui kelompok customer tertentu suka membeli produk apa saja.<br />
• <strong>Identifikasi Kebutuhan Customer</strong><br />
Anda dapat mengidentifikasi produk-produk apa saja yang terbaik untuk tiap kelompok customer dan menyusun faktor-faktor apa saja yang kira-kira dapat menarik customer baru untuk bergabung/membeli.<br />
</span><span style="font-size:10pt;font-family:Verdana;">• <strong>Menilai Loyalitas Customer</strong><br />
VISA International Spanyol menggunakan data mining untuk melihat kesuksesan program-program customer loyalty mereka. Anda bisa lihat di www.visa.es/ingles/info/300300.html<br />
• <strong>Informasi Summary</strong><br />
Anda juga dapat memanfaatkan data mining untuk membuat laporan summary yang bersifat multi-dimensi dan dilengkapi dengan informasi statistik lainnya.</span></p>
<p><strong><span style="font-size:10pt;font-family:Verdana;">Analisa Perusahaan dan Manajemen Resiko</span></strong></p>
<p><span style="font-size:10pt;font-family:Verdana;">• Perencanaan Keuangan dan Evaluasi Aset<br />
Data Mining dapat membantu Anda untuk melakukan analisis dan prediksi cash flow serta melakukan contingent claim analysis untuk mengevaluasi aset. Selain itu Anda juga dapat menggunakannya untuk analisis trend.<br />
• Perencanaan Sumber Daya (Resource Planning)<br />
Dengan melihat informasi ringkas (summary) serta pola pembelanjaan dan pemasukan dari masing-masing resource, Anda dapat memanfaatkannya untuk melakukan resource planning.<br />
• Persaingan (Competition)<br />
o Sekarang ini banyak perusahaan yang berupaya untuk dapat melakukan competitive intelligence. Data Mining dapat membantu Anda untuk memonitor pesaing-pesaing Anda dan melihat market direction mereka.<br />
o Anda juga dapat melakukan pengelompokan customer Anda dan memberikan variasi harga/layanan/bonus untuk masing-masing grup.<br />
o Menyusun strategi penetapan harga di pasar yang sangat kompetitif. Hal ini diterapkan oleh perusahaan minyak REPSOL di Spanyol dalam menetapkan harga jual gas di pasaran.</span></p>
<p><strong><span style="font-size:10pt;font-family:Verdana;">Telekomunikasi</span></strong></p>
<p><span style="font-size:10pt;font-family:Verdana;">Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual (dilayani oleh orang). Tujuannya tidak lain adalah untuk menambah layanan otomatis khusus untuk transaksi-transaksi yang masih dilayani secara manual. </span><span style="font-size:10pt;font-family:Verdana;">Dengan demikian jumlah operator penerima transaksi manual tetap bisa ditekan minimal.</span></p>
<p><strong><span style="font-size:10pt;font-family:Verdana;">Keuangan</span></strong></p>
<p><span style="font-size:10pt;font-family:Verdana;">Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry). Mereka menyatakan bahwa hal tersebut akan susah dilakukan jika menggunakan analisis standar. Anda bisa lihat di www.senate.gov/~appropriations/treasury/testimony/sloan.htm. Mungkin sudah saatnya juga Badan Pemeriksa Keuangan Republik Indonesia menggunakan teknologi ini untuk mendeteksi aliran dana BLBI. </span></p>
<p><strong><span style="font-size:10pt;font-family:Verdana;">Asuransi</span></strong></p>
<p><span style="font-size:10pt;font-family:Verdana;">Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi. Hasilnya? Mereka berhasil menghemat satu juta dollar per tahunnya. Anda bisa lihat di www.informationtimes.com.au/data-sum.htm. Tentu saja ini tidak hanya bisa diterapkan untuk asuransi kesehatan, tetapi juga untuk berbagai jenis asuransi lainnya.</span></p>
<p><strong><span style="font-size:10pt;font-family:Verdana;">Olah Raga</span></strong></p>
<p><span style="font-size:10pt;font-family:Verdana;">IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim New York Knicks dan Miami Heat.</span></p>
<p><strong><span style="font-size:10pt;font-family:Verdana;">Astronomi</span></strong></p>
<p><span style="font-size:10pt;font-family:Verdana;">Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa. Anda bisa lihat di www-aig.jpl.nasa.gov/public/mls/news/SKICAT-PR12-95.html.</span></p>
<p><strong><span style="font-size:10pt;font-family:Verdana;">Internet Web Surf-Aid</span></strong></p>
<p><span style="font-size:10pt;font-family:Verdana;">IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman Web khususnya yang berkaitan dengan pemasaran guna melihat prilaku dan minat customer serta melihat ke-efektif-an pemasaran melalui Web.</span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana;">Dengan melihat beberapa aplikasi yang telah disebutkan di atas, terlihat sekali potensi besar dari penerapan Data Mining di berbagai bidang. Bahkan beberapa pihak berani menyatakan bahwa Data Mining merupakan salah satu aktifitas di bidang perangkat lunak yang dapat memberikan ROI (return on investment) yang tinggi. Namun demikian, perlu diingat bahwa Data Mining hanya melihat keteraturan atau pola dari sejarah, tetapi tetap saja sejarah tidak sama dengan masa datang. Contoh: jika orang terlalu banyak minum Coca Cola bukan berarti dia pasti akan kegemukan, jika orang terlalu banyak merokok bukan berarti dia pasti akan kena kanker paru-paru atau mati muda. Bagaimanapun juga data mining tetaplah hanya alat bantu yang dapat membantu manusia untuk melihat pola, menganalisis trend dsb. dalam rangka mempercepat pembuatan keputusan. </span><span style="font-size:10pt;font-family:Verdana;">Kapankah data mining akan banyak digunakan di Indonesia? Kita tunggu saja. </span></p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/andyku.wordpress.com/18/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/andyku.wordpress.com/18/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/andyku.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/andyku.wordpress.com/18/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/andyku.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/andyku.wordpress.com/18/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/andyku.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/andyku.wordpress.com/18/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/andyku.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/andyku.wordpress.com/18/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/andyku.wordpress.com/18/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/andyku.wordpress.com/18/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=18&subd=andyku&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://andyku.wordpress.com/2008/04/17/penerapan-data-mining/feed/</wfw:commentRss>
		<slash:comments>13</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/131bb95564c2a9034fe7279c5d4209ba?s=96&#38;d=" medium="image">
			<media:title type="html">andy</media:title>
		</media:content>
	</item>
		<item>
		<title>Data Mining dan Web Mining</title>
		<link>http://andyku.wordpress.com/2008/04/17/data-mining-dan-web-mining/</link>
		<comments>http://andyku.wordpress.com/2008/04/17/data-mining-dan-web-mining/#comments</comments>
		<pubDate>Thu, 17 Apr 2008 05:45:51 +0000</pubDate>
		<dc:creator>andy</dc:creator>
				<category><![CDATA[Datamining]]></category>
		<category><![CDATA[Data mining]]></category>

		<guid isPermaLink="false">http://andyku.wordpress.com/?p=17</guid>
		<description><![CDATA[Data mining (DM) yang juga dikenal sebagai Knowledge Discovery (Frawley et al., 1992) , merupakan salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Secara umum, data mining dapat didefinisikan sebagai suatu rangkaian proses untuk menggali nilai tambah berupa [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=17&subd=andyku&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p><span style="font-size:10pt;font-family:Verdana;">Data mining (DM) yang juga dikenal sebagai Knowledge Discovery (Frawley et al., 1992) , merupakan salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Secara umum, data mining dapat didefinisikan sebagai suatu rangkaian proses untuk menggali nilai tambah berupa ilmu pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data (Pramudiono, 2003).</span></p>
<p><span style="font-size:10pt;font-family:Verdana;">Web mining merupakan penerapan teknik data mining terhadap web dengan tujuan untuk memperoleh pengetahuan dan informasi lebih dari dalam web. Web mining dapat dikategorikan ke dalam tiga ruang lingkup yang berbeda, yaitu web content mining, web structure mining dan web usage mining (Srivastava et al., 2000).</p>
<p><span id="more-17"></span><br />
<strong>Association Rules dan Algoritma Apriori</strong></span></p>
<p><span style="font-size:10pt;font-family:Verdana;">Association rules merupakan salah satu teknik data mining yang berfungsi untuk menemukan asosiasi antar variabel, korelasi atau suatu struktur diantara item atau objek-objek didalam database transaksi, database relasional, maupun pada penyimpanan informasi lainnya.</span></p>
<p><span style="font-size:10pt;font-family:Verdana;">Sebagai ilustrasi dalam analisis weblog dari association rules adalah sebagai berikut, pola yang mungkin adalah “jika seseorang mengunjungi website CNN, terdapat kemungkinan sebesar 60% orang tersebut mengunjungi website Detik pada bulan yang sama.” Pada ilustrasi tersebut, pola yang ditemukan berpotensi menghasilkan potongan informasi yang menarik dan dibutuhkan oleh perusahaan yang terkait.</span></p>
<p><span style="font-size:10pt;font-family:Verdana;">Proses di dalam teknik assocation rules adalah mencari aturan-aturan yang memenuhi minimum support dan confidence. Algoritma yang pertama kali digunakan dalam teknik association rules dan yang paling banyak digunakan adalah algoritma apriori (Agrawal &amp; Srikant, 1994).</span></p>
<p><strong><span style="font-size:10pt;font-family:Verdana;">Web Crawler</span></strong></p>
<p><span style="font-size:10pt;font-family:Verdana;">Web crawler (yang juga dikenal dengan web spider atau web robot) adalah suatu program atau script otomatis yang menjelajahi WWW dengan menggunakan sebuah metode atau cara yang otomatis. Nama-nama yang jarang digunakan pada sebuah web crawler adalah ants, automatic indexers, bots, worms (Kobayashi &amp; Takeda, 2000).</span></p>
<p><strong><span style="font-size:10pt;font-family:Verdana;">Extended Log File Format</span></strong></p>
<p><span style="font-size:10pt;font-family:Verdana;">Extended Log Format dirancang untuk memenuhi beberapa kebutuhan di bawah ini (Baker &amp; Behlendorf, 1996):</span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana;">* Memperbolehkan kontrol pada data yang direkam.</p>
<p>* Memenuhi kebutuhan proxy, client dan server dalam format yang umum.</p>
<p>* Menyediakan penanganan yang sempurna akan masalah penghilangan karakter.</p>
<p>* Memperbolehkan dalam pertukaran demografis data.</span><span style="font-size:10pt;font-family:Verdana;"> * Memperbolehkan dalam menyajikan rekapitulasi data.</span></p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/andyku.wordpress.com/17/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/andyku.wordpress.com/17/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/andyku.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/andyku.wordpress.com/17/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/andyku.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/andyku.wordpress.com/17/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/andyku.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/andyku.wordpress.com/17/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/andyku.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/andyku.wordpress.com/17/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/andyku.wordpress.com/17/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/andyku.wordpress.com/17/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=17&subd=andyku&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://andyku.wordpress.com/2008/04/17/data-mining-dan-web-mining/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/131bb95564c2a9034fe7279c5d4209ba?s=96&#38;d=" medium="image">
			<media:title type="html">andy</media:title>
		</media:content>
	</item>
		<item>
		<title>Data Mining (Menggali Informasi yang Terpendam)</title>
		<link>http://andyku.wordpress.com/2008/04/17/data-mining-menggali-informasi-yang-terpendam/</link>
		<comments>http://andyku.wordpress.com/2008/04/17/data-mining-menggali-informasi-yang-terpendam/#comments</comments>
		<pubDate>Thu, 17 Apr 2008 05:44:42 +0000</pubDate>
		<dc:creator>andy</dc:creator>
				<category><![CDATA[Datamining]]></category>
		<category><![CDATA[Data mining]]></category>

		<guid isPermaLink="false">http://andyku.wordpress.com/?p=16</guid>
		<description><![CDATA[Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dsb. Ada pihak yang berpendapat bahwa data mining tidak lebih dari machine learning atau analisa statistik yang berjalan di atas [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=16&subd=andyku&ref=&feed=1" />]]></description>
			<content:encoded><![CDATA[<div class='snap_preview'><br /><p><span style="font-size:10pt;font-family:Verdana;">Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dsb. </span><span style="font-size:10pt;font-family:Verdana;">Ada pihak yang berpendapat bahwa data mining tidak lebih dari machine learning atau analisa statistik yang berjalan di atas database. Namun pihak lain berpendapat bahwa database berperanan penting di data mining karena data mining mengakses data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran penting database terutama dalam optimisasi query-nya.<span style="font-size:10pt;font-family:Verdana;"> </p>
<p></span></span></p>
<p><span style="font-size:10pt;font-family:Verdana;"></span><span id="more-16"></span><span style="font-size:10pt;font-family:Verdana;">Lalu apakah data mining itu? Apakah memang berhubungan erat dengan dunia pertambangan…. tambang emas, tambang timah, dsb. Definisi sederhana dari data mining adalah ekstraksi informasi atau pola yang penting atau menarik dari data yang ada di database yang besar. </span><span style="font-size:10pt;font-family:Verdana;">Dalam jurnal ilmiah, data mining juga dikenal dengan nama Knowledge Discovery in Databases (KDD). </span></p>
<p><span style="font-size:10pt;font-family:Verdana;">Kehadiran data mining dilatar belakangi dengan problema data explosion yang dialami akhir-akhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data penjualan, data nasabah, data transaksi dsb.). Hampir semua data tersebut dimasukkan dengan menggunakan aplikasi komputer yang digunakan untuk menangani transaksi sehari-hari yang kebanyakan adalah OLTP (On Line Transaction Processing). Bayangkan berapa transaksi yang dimasukkan oleh hypermarket semacam Carrefour atau transaksi kartu kredit dari sebuah bank dalam seharinya dan bayangkan betapa besarnya ukuran data mereka jika nanti telah berjalan beberapa tahun. Pertanyaannya sekarang, apakah data tersebut akan dibiarkan menggunung, tidak berguna lalu dibuang, ataukah kita dapat me-‘nambang’-nya untuk mencari ‘emas’, ‘berlian’ yaitu<span style="font-size:10pt;font-family:Verdana;">informasi yang berguna untuk organisasi kita. Banyak diantara kita yang kebanjiran data tapi miskin informasi.</p>
<p></span></span></p>
<p> </p>
<p><span style="font-size:10pt;font-family:Verdana;">Jika Anda mempunyai kartu kredit, sudah pasti Anda bakal sering menerima surat berisi brosur penawaran barang atau jasa. Jika Bank pemberi kartu kredit Anda mempunyai 1.000.000 nasabah, dan mengirimkan sebuah (hanya satu) penawaran dengan biaya pengiriman sebesar Rp. 1.000 per buah maka biaya yang dihabiskan adalah Rp. 1 Milyar!! Jika Bank tersebut mengirimkan penawaran sekali sebulan yang berarti 12x dalam setahun maka anggaran yang dikeluarkan per tahunnya adalah Rp. 12 Milyar!! </span><span style="font-size:10pt;font-family:Verdana;">Dari dana Rp. 12 Milyar yang dikeluarkan, berapa persenkah konsumen yang benar-benar membeli? Mungkin hanya 10 %-nya saja. Secara harfiah, berarti 90% dari dana tersebut terbuang sia-sia. </span></p>
<p><span style="font-size:10pt;font-family:Verdana;">Persoalan di atas merupakan salah satu persoalan yang dapat diatasi oleh data mining dari sekian banyak potensi permasalahan yang ada. Data mining dapat menambang data transaksi belanja kartu kredit untuk melihat manakah pembeli-pembeli yang memang potensial untuk membeli produk tertentu. Mungkin tidak sampai presisi 10%, tapi bayangkan jika kita dapat menyaring 20% saja, tentunya 80% dana dapat digunakan untuk hal lainnya. </span></p>
<p><span style="font-size:10pt;font-family:Verdana;">Lalu apa beda data mining dengan data warehouse dan OLAP (On-line Analytical Processing)? Secara singkat bisa dijawab bahwa teknologi yang ada di data warehouse dan OLAP dimanfaatkan penuh untuk melakukan data mining. Teknologi data warehouse digunakan untuk melakukan OLAP, sedangkan data mining digunakan untuk melakukan information discovery yang informasinya lebih ditujukan untuk seorang Data Analyst dan Business Analyst (dengan ditambah visualisasi tentunya). Dalam prakteknya, data mining juga mengambil data dari data warehouse. Hanya saja aplikasi dari data mining lebih khusus dan lebih spesifik dibandingkan OLAP mengingat database bukan satu-satunya bidang ilmu yang mempengaruhi data mining, banyak lagi bidang ilmu yang turut memperkaya data mining seperti: information science (ilmu informasi), high performance computing, visualisasi, machine learning, statistik, neural networks (jaringan syaraf tiruan), pemodelan matematika, information retrieval dan information extraction serta pengenalan pola. Bahkan pengolahan citra (image processing) juga digunakan dalam rangka melakukan data mining terhadap data image/spatial. Dengan memadukan teknologi OLAP dengan data mining diharapkan pengguna dapat melakukan hal-hal yang biasa dilakukan di OLAP seperti drilling/rolling untuk melihat data lebih dalam atau lebih umum, pivoting, slicing dan dicing. </span><span style="font-size:10pt;font-family:Verdana;">Semua hal tersebut diharapkan nantinya dapat dilakukan secara interaktif dan dilengkapi dengan visualisasi. </span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana;">Data mining tidak hanya melakukan mining terhadap data transaksi saja. </span><span style="font-size:10pt;font-family:Verdana;">Penelitian di bidang data mining saat ini sudah merambah ke sistem database lanjut seperti object oriented database, image/spatial database, time-series data/temporal database, teks (dikenal dengan nama text mining), web (dikenal dengan nama web mining) dan multimedia database. Meskipun gaungnya mungkin tidak seramai seperti ketika Client/Server Database muncul, tetapi industri-industri seperti IBM, Microsoft, SAS, SGI, dan SPSS terus gencar melakukan penelitian-penelitian di bidang data mining. Beberapa penelitian sekarang ini sedang dilakukan untuk memajukan data mining diantaranya adalah peningkatan kinerja jika berurusan dengan data berukuran terabyte, visualisasi yang lebih menarik untuk user, pengembangan bahasa query untuk data mining yang sedapat mungkin mirip dengan SQL. Tujuannya tidak lain adalah agar end-user dapat melakukan data mining dengan mudah dan cepat serta mendapatkan hasil yang akurat. </span></p>
<img alt="" border="0" src="http://feeds.wordpress.com/1.0/categories/andyku.wordpress.com/16/" /> <img alt="" border="0" src="http://feeds.wordpress.com/1.0/tags/andyku.wordpress.com/16/" /> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/andyku.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/andyku.wordpress.com/16/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/andyku.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/andyku.wordpress.com/16/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/andyku.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/andyku.wordpress.com/16/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/andyku.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/andyku.wordpress.com/16/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/andyku.wordpress.com/16/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/andyku.wordpress.com/16/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=andyku.wordpress.com&blog=3495008&post=16&subd=andyku&ref=&feed=1" /></div>]]></content:encoded>
			<wfw:commentRss>http://andyku.wordpress.com/2008/04/17/data-mining-menggali-informasi-yang-terpendam/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/131bb95564c2a9034fe7279c5d4209ba?s=96&#38;d=" medium="image">
			<media:title type="html">andy</media:title>
		</media:content>
	</item>
	</channel>
</rss>