LATAR BELAKANG DATA MINING
- Banyak data yang telah direkam dan disimpan
- Transaksi penjualan di Supermarket
- Transaksi perbankan dan Kartu Kredit
- Log kunjungan WEB
- Akuisisi data dalam penelitian (sosial, kesehatan,…)
- Sistem Komputer semakin cepat dan ekonomis (Moore’s Law)
- Kebutuhan berkompetisi dengan strategi yang tepat semakin meningkat
TRANSFORMASI DIGITAL DATA MINING
LEDAKAN PERTUMBUHAN DATA
MENGAPA HARUS DATA MINING?
- Data yang sangat besar terkadang memiliki informasi yang tersembunyi
- Kemampuan manusia terbatas untuk mengamati kumpulan data tersebut dalama proses analisis
PENGERTIAN DATA MINING- Perangkat lunak yang digunakan untuk menemukan pola-pola tersembunyi maupun hubungan-hubungan yang terdapat dalam basis data yang besar dan menghasilkan aturan-aturan yang digunakan untuk memperkirakan perilaku di masa medatang
- Data mining sering dikatakan berurusan dengan “penemuan pengetahuan” dalam basis data. Suatu aturan yang dihasilkan oleh data mining misalnya seperti berikut : “Kebanyakan pembeli mobil Forsa adalah wanita berusia di atas 30 tahun
PRINSIP DATA MINING
APLIKASI DATA MINING
TEKNOLOGI UNTUK DATA MINING- Statistik
- Neural network
- Fuzzy Logic
- Algoritma genetika
- dan berbagai teknologi kecerdasan buatan yang lain
DATA MINING : VISUALISASI DATA- Pendekatan data mining juga ada yang melalui visualisasi data
- Pada sistem seperti ini, pemakai akan dibantu untuk menemukan sendiri pola dari sejumlah data berukuran besar dengan didasarkan visualisasi oleh data mining
DEFINISI MACHINE LEARNING Sebuah program komputer dikatakan belajar dari pengalaman/experience [E] sehubungan dengan beberapa tugas/task [T] dan mengukur kinerja/ performance [P], jika kinerjanya pada tugas-tugas [T], yang diukur dengan [P,] meningkatkan dengan pengalaman [E].
CONTOH APLIKASI MACHINE LEARNING- Pembelajaran mengenali kata-kata yang diucapkan (Lee, 1989; Waibel, 1989).
- Pembelajaran mengemudikan mobil otomatis (Pomerleau, 1989).
- Pembelajaran klasifikasi struktur astronomi baru (Fayyad et al., 1995).
- Pembelajaran bermain world-class backgammon (Tesauro 1992, 1995).
MENGAPA MACHINE LEARNING DIPERLUKAN? - Beberapa tasks tidak dapat didefinisikan dengan baik, kecuali dengan contoh (mengenali orang). ‣ Relasi dan korelasi dapat tersembunyi dalam data dalam jumlah besar. Machine Learning/Data Mining dapat menemukan relasi tersebut.
- Seorang designers seringkali menghasilkan mesin yang tidak dapat bekerja seperti yang diharapkan untuk bekerja pada lingkungannya dimana mereka digunakan.
- Jumlah pengetahuan yang tersedia tentang tugas-tugas tertentu mungkin terlalu besar untuk pengkodean eksplisit oleh manusia (misalnya, diagnostik medis)
- Lingkungan berubah seiring waktu ‣ Pengetahuan baru tentang tugas terus-menerus ditemukan oleh manusia. Mungkin sulit untuk terus sistem re-desain “secara manual".
BIDANG ILMU YG BERKAITAN - Statistik: Bagaimana cara terbaik menggunakan sample dari distribusi probabilitas yang tidak diketahui untuk mengetahui dari distibusi mana sampel baru diambil.
- Brain Model: Unsur-unsur non-linear dengan input tertimbang (Artificial Neural Networks) telah diusulkan sebagai model sederhana neuron biologis
- Adaptive Control Theory: Bagaimana menangani pengendalian proses yang memiliki parameter yang tidak diketahui tetapi harus diestimasi selama operasi?
- Psychology: Bagaimana model kinerja manusia pada berbagai tugas learning?
- Arificial Intelligence: Bagaimana menulis algoritma yang mampu memperoleh pengetahuan manusia, setidaknya, seperti manusia?
- Evolutionary Models: Bagaimana memodelkan aspek-aspek tertentu dari evolusi biologi untuk meningkatkan kinerja program komputer?
CONTOH DESAIN LEARNING SYSTEM - Mendeskripsikan Problem
- Memilih Training Experience
- Memilih Target Function
- Memilih Representasi Target Function
- Memilih Function Approximation Algorithm
- Design Akhir
- Perangkat lunak yang digunakan untuk menemukan pola-pola tersembunyi maupun hubungan-hubungan yang terdapat dalam basis data yang besar dan menghasilkan aturan-aturan yang digunakan untuk memperkirakan perilaku di masa medatang
- Data mining sering dikatakan berurusan dengan “penemuan pengetahuan” dalam basis data. Suatu aturan yang dihasilkan oleh data mining misalnya seperti berikut : “Kebanyakan pembeli mobil Forsa adalah wanita berusia di atas 30 tahun
APLIKASI DATA MINING
TEKNOLOGI UNTUK DATA MINING
- Statistik
- Neural network
- Fuzzy Logic
- Algoritma genetika
- dan berbagai teknologi kecerdasan buatan yang lain
DATA MINING : VISUALISASI DATA
- Pendekatan data mining juga ada yang melalui visualisasi data
- Pada sistem seperti ini, pemakai akan dibantu untuk menemukan sendiri pola dari sejumlah data berukuran besar dengan didasarkan visualisasi oleh data mining
DEFINISI MACHINE LEARNING
Sebuah program komputer dikatakan belajar dari pengalaman/experience [E] sehubungan dengan beberapa tugas/task [T] dan mengukur kinerja/ performance [P], jika kinerjanya pada tugas-tugas [T], yang diukur dengan [P,] meningkatkan dengan pengalaman [E].CONTOH APLIKASI MACHINE LEARNING
- Pembelajaran mengenali kata-kata yang diucapkan (Lee, 1989; Waibel, 1989).
- Pembelajaran mengemudikan mobil otomatis (Pomerleau, 1989).
- Pembelajaran klasifikasi struktur astronomi baru (Fayyad et al., 1995).
- Pembelajaran bermain world-class backgammon (Tesauro 1992, 1995).
MENGAPA MACHINE LEARNING DIPERLUKAN?
- Beberapa tasks tidak dapat didefinisikan dengan baik, kecuali dengan contoh (mengenali orang). ‣ Relasi dan korelasi dapat tersembunyi dalam data dalam jumlah besar. Machine Learning/Data Mining dapat menemukan relasi tersebut.
- Seorang designers seringkali menghasilkan mesin yang tidak dapat bekerja seperti yang diharapkan untuk bekerja pada lingkungannya dimana mereka digunakan.
- Jumlah pengetahuan yang tersedia tentang tugas-tugas tertentu mungkin terlalu besar untuk pengkodean eksplisit oleh manusia (misalnya, diagnostik medis)
- Lingkungan berubah seiring waktu ‣ Pengetahuan baru tentang tugas terus-menerus ditemukan oleh manusia. Mungkin sulit untuk terus sistem re-desain “secara manual".
BIDANG ILMU YG BERKAITAN
- Statistik: Bagaimana cara terbaik menggunakan sample dari distribusi probabilitas yang tidak diketahui untuk mengetahui dari distibusi mana sampel baru diambil.
- Brain Model: Unsur-unsur non-linear dengan input tertimbang (Artificial Neural Networks) telah diusulkan sebagai model sederhana neuron biologis
- Adaptive Control Theory: Bagaimana menangani pengendalian proses yang memiliki parameter yang tidak diketahui tetapi harus diestimasi selama operasi?
- Psychology: Bagaimana model kinerja manusia pada berbagai tugas learning?
- Arificial Intelligence: Bagaimana menulis algoritma yang mampu memperoleh pengetahuan manusia, setidaknya, seperti manusia?
- Evolutionary Models: Bagaimana memodelkan aspek-aspek tertentu dari evolusi biologi untuk meningkatkan kinerja program komputer?
CONTOH DESAIN LEARNING SYSTEM
- Mendeskripsikan Problem
- Memilih Training Experience
- Memilih Target Function
- Memilih Representasi Target Function
- Memilih Function Approximation Algorithm
- Design Akhir






Tidak ada komentar:
Posting Komentar