Jumat, 04 Juni 2010

Tentang Data Mining

Kemampuan kita dalam memperoleh dan mengolah data telah meningkat secara drastis belakangan ini. Banyak faktor yang mempengaruhi peningkatan data ini, diantaranya komputerisasi dalam bisnis, pemerintahan dan juga ilmiah. Semakin tingginya kapasitas media penyimpanan dengan harga yang relatif terjangkau serta meluasnya penggunaan kamera digital, alat-alat publik, penggunaan bar code dalam proses transaksi produk menjadikan data tumbuh secara ekplosif dalam berbagai bidang. Selain itu, perkembangan jaringan internet sebagai sarana informasi global menjadikan penumpukan data ini semakin tak terkendali.

Pertumbuhan data yang ekplosif itu disimpan dalam database-database sementara yang bersifat operasional. Dengan berjalannya waktu, databse tersebut menjadi gudang data atau lebih dikenal dengan data warehouse. Di dalam data warehouse ini tersimpan banyak sekali data yang telah direkap setiap harinya. Melalui data-data ini lah terdapat informasi yang harus digali untuk menunjang proses bisnis yang ada dalam menjalankan visi misi perusahaan.

Dibutuhkan suatu teknik untuk menggali informasi yang terdapat pada data warehouse tersebut. Lahirlah data mining, yaitu suatu teknik untuk meng-ekstrasi suatu pola dari data. Data mining diterapkan dengan paradigma untuk melihat informasi yang tersembunyi. Proses pencarian ini dilakukan secara otomatis terhadap pola dalam data dengan jumlah besar dengan menggunakan teknik-teknik seperti klasifikasi, clustering, dll. Data mining adalah suatu multidisiplin ilmu yang kompleks dan beririsan dengan ilmu lain seperti statistika, database, information retrieval, machine learning, pattern recognition, algoritma dan ilmu lainnya.

Menurut para ahli, data mining merupakan sebuah analisa dari observasi data dalam jumlah besar untuk menemukan hubungan yang tidak diketahui sebelumnya dan metode baru untuk meringkas data agar mudah dipahami serta kegunaannya untuk pemilik data (David Hand, 2001). Data mining dikenal juga dengan istilah Knowledge Discovery from Data (KDD)Data mining merupakan suatu tahapan dalam penemuan pengetahuan dan menjadi core proses dari suatu jumlah data yang besar, tahapan-tahapan tersebut yaitu :

Gambar 1. Data mining sebagai tahapan dalam penemuan pengetahuan

(Jiawei Han, 2006)

  1. Data cleaning, untuk membersihkan data dari noise data dan data yang tidak konsiten
  2. Data integration, megkombinasikan/mengintegrasikan beberapa sumber data
  3. Data selection, mengambil data-data yang relevan dari database untuk dianalisis
  4. Data transformation, mentransformasikan data summary ataupun operasi agregasi
  5. Data mining, merupakan proses yang esensial dimana metode digunakan untuk mengekstrak pola data yang tersembunyi
  6. Pattern evaluation, untuk mengidentifikasi pola sehingga mereperesentasikan pengetahuan berdasarkan nilai-nilai yang menarik
  7. Knowledge presentation, dimana teknik representasi dan visualisai data digunakan untuk mempresentasikan pengetahuan yang diadapat kepada user

1 komentar:

  1. kita juga punya nih jurnal mengenai Data Mining , silahkan dikunjungi dan dibaca , berikut linknya

    http://repository.gunadarma.ac.id/bitstream/123456789/486/1/Data%20Mining%20Discretization%20Methods%20and%20Performances.pdf
    semoga bermanfaat yaa :)

    BalasHapus