Monday, January 9, 2017

MAIN AREA/AREA UTAMA

Pengguna dan Pengembangan Sistem
Spesialis spesialis informasi perusahaan terdiri dari atas analis system , adminisstrtor basis data,webmaster, spesialis jaringan, programmer, dan operator. Para spesialis ini pada awalnya berada dalam unit layanan informasinamun belakangan mereka mulai dialokasikan ke area area bisnis. Seiring dengan perusahaan melakukan evaluasi atas keuntungan organisasi IS, maka diidentifikasikan pula sebuah sekutu, platform, dan model model yang dapat ditentukan skalanya dengan jaringan jaringan khusus yang ditambahkan untuk memastikan tercapainya sasaran.
            Perusahaan hendaknya mengelola pengetahuan yang diawali oleh sumber daya informasinya. Pengetahuan ini terdapat dalam system, peranti lunak, database, dan pengetahuan khusus yang dimiliki oleh pengguna computer dan spesialis informasi.
ORGANISASI BISNIS
Sistem informasi dikembangkan dan digunakan dalam organisasi bisnis. Di Bab 1 , anda telah mempelajari bahwa manajer dapat ditemukan pada semua tingkat dan semua area bisnis perusahaan. Area area dasar perusahaan adalah keungan, sumber daya manusia, layanan informasi, produksi, dan pemasaran.
Dukungan Sistem Informasi bagi Organisasi
Sistem informasi dikembangkan untuk mendukung keseluruhan organisasi, eksekutif, dan area bisnis. SIM dimaksudkan untuk memenuhi kebutuhan informasi umum para manajer perusahaan; system informasi eksekutif dirancang untuk digunakan oleh manajer tingkat strategis perusahaan; dan lima lima system ditingkat lebih rendah dalam figure tersebut mencakup kebutuhan kebutuhan informasi untuk dari area area bisnis tersebut.
ORGANISASI LAYANAN INFORMASI
Kita telah menggunakan istilah layanan informasi untuk menguraikan unit perusahaan yang memiliki tanggung jawab atas mayoritas sumber dayainformasi. Nama nama lain Divisi SIM atau Departemen SIM dan khusus nya teknologi informasi
SUMBER DAYA INFORMASI
Di Bab 2 , kita telah mengidentifikasikan sumber daya informasi yang terdiri atas peranti keras computer, peranti lunak computer , spesialis informasi , pengguna, fasilitas, basis data, dan informasi. Sebagian besar sumber daya ini pada umumya berlokasi di layanan informasi dan merupakan tanggung jawab dari chief information officer (CIO). Sumber daya informai yang terdapat di area area pengguna adalah taggung jawab dari pada manajer area pengguna.
Spesialis Informasi
 Buku ini menggunakan istilah spesialis informasi untuk menggambarkan karyawan yang tanggung jawab utamanya adalah untuk memberikan kontribusi atas tersedianya sumber daya informasi dalam perusahaan spesialis informasi pada awalnya meliputi analisis system, programmer, dan operator. Kemudian, ditambahkan lagi dengan administrator basis data , spesialis jaringan, dan webmaster.
ANALIS SISTEM          Spesialis ini bekerja dengan pengguna untuk mengembangkan system system baru dan memperbaiki system system yang sudah ada. Analis system adalah orang bagaimana computer akan membuaty dokumentasi tertulis mengenai bagaimana computer akan membantu menyelesaikan masalah masalah tersebut.
ADMINISTRATOR BASIS DATA   Seorang spesialis informasi yang bertanggung jawab atas basis data disebut sebagai administrator basis data (database administrator DBA) Tugas DBA terbagi dalam empat area utama; perencanaan, implementasi, operasi, dan keamanan. Kita akan menguraikan tugas tugas ini Bab 6 ketika membahas sumber daya data.
WEBMASTER   Webmaster bertanggung jawab atas isi dan penyajian situs web perusahaan. Webmaster harus bekerja sama dengan spesialis jaringan untuk memastikan bahwa jaringan komunikasi antara perusahaan dan pelanggan dan sekutu bisnis nya selalu terbuka, situs web sangat mengandalkan gambar dan Webmaster biasanya memiliki keahlian dalam memanipulasi atau perencanaan grafik.
            Satu tugas penting dari seorang webmaster adalah melacak orang orang yang mengunjungi halaman web perusahaan. Angka statistic ini dapat memberikan informasi penting mengeai keefktifan situs Web tersebut.
SPESIALIS JARINGAN   Spesialis jaringan bekerja dengan analis system dan pengguna dalam membuat jaringan komunikasi data yang menyatukan sumber daya komputasi menyebar. Spesialis jaringan akan menggabungkan kehalian dari bidang bidang komputasi maupun telekomunikasi. Memelihara jaringan yang memenuhi persyaratan untuk aplikasi aplikasi berbasis Web adalah hal yang sangat sulit untuk dilakukan, karena sebagian besar komunikasi terjadi diluar batsan perusahaan.
PROGRAMER   Programer menggunakan dokumentasi yang dibuat oleh system analis untuk membuat kode program yang mengubahdata menjadi informasi yang dibutuhkan oleh pengguna. Beberapa perusahaan menggabungkan fungsi system analis data programmer, menciptakan suatu posisi analis programmer.
OPERATOR   Operator menjalankan peralatan komputasi berskala besar, seperti computer mainframe dan server , yang biasanya berlokasi dalam fasilitas komputasi perusahaan. Operator akan memonitor konsol, mengganti kertas printer, mengelola perusahaa pita dan disk penyimpanan data, serta melakukan tugas tugas lain yang serupa.
Semua spesialis informasi di atas pada umumnya membentuk tim proyek yang mengembangkan system. Para spesialis juga memiliki tanggung jawab dalam memelihara system setelah system tersebut diimplementasikan.


Struktur dan Komponen Sistem Berbasis Pengetahuan


Struktur Sistem

Struktur Sistem Pakar terdiri dari dua pokok (Sri Kusumadewi, 2003), yaitu: lingkungan pengembang (development environment) dan lingkungan konsultasi (consulatation environment). Lingkungan pengembang digunakan sebagai pembangunan Sistem Pakar baik dari segi pembangunan komponen maupun basis pengetahuan. Lingkungan konsultasi digunakan oleh seseorang bukan ahli untuk berkonsultasi.

Komponen-komponen Sistem

Komponen-komponen Sistem Pakar terlihat pada Gambar 2.1 diatas dan berikut penjelasan dari masing-masing komponen (Sri Kusumadewi, 2003), yaitu:
1.      Subsistem penambahan pengetahuan. Bagian ini digunakan untuk memasukkan pengetahuan, mengkontruksi atau memperluas pengetahuan dalam basis pengetahuan. Pengetahuan itu bisa berasal dari buku, ahli, basis data, penelitian, dan gambar.
2.      Basis pengetahuan. Berisi pengetahuan yang dibutuhkan untuk memahami, memformulasikan dan menyelesaikan masalah.
3.      Motor inferensi (inference engine). Program yang berisi metodologi yang digunakan untuk melakukan penalaran terhadap informasi-informasi basis pengetahuan dan blackboard, serta digunakan untuk memformulasikan konklusi. Ada tiga elemen utama dalam motor inferensi, yaitu:
§  Interpreter: Mengeksekusi item-item agenda yang terpilih menggunakan aturan-aturan dalam basis pengetahuan.
§  Scheduler: Akan mengontrol agenda.
§  Consistency enforce: Akan berusaha memelihara konsistenan dalam mempresentasikan solusi yang bersifat darurat.
4.      Blackboard. Merupakan area dalam memori yang digunakan untuk merekam kejadian yang sedang berlangsung termasuk keputusan sementara. Ada tiga tipe keputusan yang dapat direkam, yaitu:
§  Rencana: Bagaimana menghadapi masalah.
§  Agenda: Aksi-aksi yang potensial yang sedang menunggu untuk dieksekusi.
§  Solusi: Calon aksi yang akan dibangkitkan.
5.      Antarmuka digunakan untuk media komunikasi antar user dan program.
6.      Subsistem penjelas. Digunakan untuk melacak respond dan memberi penjelas tentang kelakuan Sistem Pakar secara interaktif melalui pertanyaan:
§  Mengapa suatu pertanyaan diajukan oleh Sistem Pakar?
§  Bagaimana konklusi dicapai?
§  Mengapa ada arternatif yang dibatalkan?
§  Rencana apa yang digunakan untuk mendapatkan solusi?
7.      Sistem penyaring pengetahuan. Sistem ini digunakan untuk mngevaluasi kinerja Sistem Pakar itu sendiri untuk melihat apakah pengetahuan-pengetahuan yang ada masih cocok digunakan dimasa mendatang.


Kelebihan dan Kekurangan Pohon Keputusan

Pengertian Pohon Keputusan

Pohon yang dalam analisis pemecahan masalah pengambilan keputusan adalah pemetaan mengenai alternatif-alternatif pemecahan masalah yang dapat diambil dari masalah tersebut. Pohon tersebut juga memperlihatkan faktor-faktor kemungkinan/probablitas yang akan mempengaruhi alternatif-alternatif keputusan tersebut, disertai dengan estimasi hasil akhir yang akan didapat bila kita mengambil alternatif keputusan tersebut.

Kelebihan Pohon Keputusan

Kelebihan dari metode pohon keputusan adalah:
§  Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat global, dapat diubah menjadi lebih simpel dan spesifik.
§  Eliminasi perhitungan-perhitungan yang tidak diperlukan, karena ketika menggunakan metode pohon keputusan maka sample diuji hanya berdasarkan kriteria atau kelas tertentu.
§  Fleksibel untuk memilih fitur dari internal node yang berbeda, fitur yang terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain dalam node yang sama. Kefleksibelan metode pohon keputusan ini meningkatkan kualitas keputusan yang dihasilkan jika dibandingkan ketika menggunakan metode penghitungan satu tahap yang lebih konvensional
§  Dalam analisis multivariat, dengan kriteria dan kelas yang jumlahnya sangat banyak, seorang penguji biasanya perlu untuk mengestimasikan baik itu distribusi dimensi tinggi ataupun parameter tertentu dari distribusi kelas tersebut. Metode pohon keputusan dapat menghindari munculnya permasalahan ini dengan menggunakan criteria yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan.

Kekurangan Pohon Keputusan

§  Terjadi overlap terutama ketika kelas-kelas dan criteria yang digunakan jumlahnya sangat banyak. Hal tersebut juga dapat menyebabkan meningkatnya waktu pengambilan keputusan dan jumlah memori yang diperlukan.
§  Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon keputusan yang besar.
§  Kesulitan dalam mendesain pohon keputusan yang optimal.
§  Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan sangat tergantung pada bagaimana pohon tersebut didesain.


KELEBIHAN DAN KEKURANGAN FORWARD DAN BACKWARD CHAINNING

Karakteristik forward dan backward chaining :
Forward chaining
backward chaining
Perencanaan, monitoring, control
diagnosis
Disajikan untuk masa depan
disajikan untuk masa lalu
Antecedent ke konsekuen
konsekuen ke antecedent
Data memandu, penalaran dari bawah ke atas
tujuan memandu, penalaran dari atas ke bawah
Bekerja ke depan untuk mendapatkan solusi apa yang yang mengikuti fakta
bekerja ke belakang untuk mendapatkan fakta yang mendukung hipotesis
Breadth first search dimudahkan
depth first search dimudahkan
Antecedent menentukan pencarian
konsekuen menentukan pencarian
Penjelasan tidak difasilitasi
penjelasan difasilitasi

Kekurangan dari pendekatan ini adalah efisiensi. System backward chaining memudahkan pencarian depth first, sementara itu forward chaining memudahkan pencarian breadth first. Walaupun anda dapat menuliskan aplikasi backward chaining ke system forward chaining dan sebaliknya, system tersebut tidak akan efisien dalam hal pencarian penyelesaiannya. Kesulitan yang kedua adalah konseptual. Pengetahuan diperoleh dari pakar yang harus diubah untuk mengimbangi permintaan dari mesin inferensi.
Adapun kelemahan dan kelebihan forward chaining yaitu (DUR.1994):
Kelebihan :
 1. Kelebihan utama dari forward chaining yaitu metode ini akan bekerja dengan baik ketika problem bermula dari mengumpulkan/ menyatukan informasi lalu kemudian mencari kesimpulan apa yang dapat diambil dari informasi tersebut.
 2. Metode ini mampu menyediakan banyak sekali informasi dari hanya jumlah kecil data.
Kelemahan :
1. Kelemahan utama metode ini yaitu kemungkinan tidak adanya cara untuk mengenali dimana beberapa fakta lebih penting dari fakta lainnya. 2. Sistem bisa saja menanyakan pertanyaan yang tidak berhubungan. Walaupun jawaban dari pertanyaan tersebut penting. Namun hal ini akan membingungkan user untuk menjawab pada subjek yang tidak berhubungan.

MODEL DAN ALGORITMA POHON KEPUTUSAN


Model Pohon Keputusan

Pohon keputusan adalah model prediksi menggunakan struktur pohon atau struktur berhirarki. Contoh dari pohon keputusan dapat dilihat di Gambar berikut ini.


Disini setiap percabangan menyatakan kondisi yang harus dipenuhi dan tiap ujung pohon menyatakan kelas data. Contoh di Gambar 1 adalah identifikasi pembeli komputer,dari pohon keputusan tersebut diketahui bahwa salah satu kelompok yang potensial membeli komputer adalah orang yang berusia di bawah 30 tahun dan juga pelajar. Setelah sebuah pohon keputusan dibangun maka dapat digunakan untuk mengklasifikasikan record yang belum ada kelasnya. Dimulai dari node root, menggunakan tes terhadap atribut dari record yang belum ada kelasnya tersebut lalu mengikuti cabang yang sesuai dengan hasil dari tes tersebut, yang akan membawa kepada internal node (node yang memiliki satu cabang masuk dan dua atau lebih cabang yang keluar), dengan cara harus melakukan tes lagi terhadap atribut atau node daun. Record yang kelasnya tidak diketahui kemudian diberikan kelas yang sesuai dengan kelas yang ada pada node daun. Pada pohon keputusan setiap simpul daun menandai label kelas. Proses dalam pohon keputusan yaitu mengubah bentuk data (tabel) menjadi model pohon (tree) kemudian mengubah model pohon tersebut menjadi aturan (rule).
ALGORITMA C4.5

Salah satu algoritma induksi pohon keputusan yaitu ID3 (Iterative Dichotomiser 3). ID3 dikembangkan oleh J. Ross Quinlan. Dalam prosedur algoritma ID3, input berupa sampel training, label training dan atribut. Algoritma C4.5 merupakan pengembangan dari ID3. Sedangkan pada perangkat lunak open source WEKA mempunyai versi sendiri C4.5 yang dikenal sebagai J48.



Pohon dibangun dengan cara membagi data secara rekursif hingga tiap bagian terdiri dari data yang berasal dari kelas yang sama. Bentuk pemecahan (split) yang digunakan untuk membagi data tergantung dari jenis atribut yang digunakan dalam split. Algoritma C4.5 dapat menangani data numerik (kontinyu) dan diskret. Split untuk atribut numerik yaitu mengurutkan contoh berdasarkan atribut kontiyu A, kemudian membentuk minimum permulaan (threshold) M dari contoh-contoh yang ada dari kelas mayoritas pada setiap partisi yang bersebelahan, lalu menggabungkan partisi-partisi yang bersebelahan tersebut dengan kelas mayoritas yang sama. Split untuk atribut diskret A mempunyai bentuk value (A) ε X dimana X domain(A).
Jika suatu set data mempunyai beberapa pengamatan dengan missing value yaitu record dengan beberapa nilai variabel tidak ada, Jika jumlah pengamatan terbatas maka atribut dengan missing value dapat diganti dengan nilai rata-rata dari variabel yang bersangkutan.[Santosa,2007]
Untuk melakukan pemisahan obyek (split) dukan tes terhadap atribut dengan mengukur tingkat ketidakmurnian pada sebuah simpul (node). Pada algoritma C.45 menggunakan rasio perolehan (gain ratio). Sebelum menghitung rasio perolehan, perlu menghitung dulu nilai informasi dalam satuan bits dari suatu kumpulan objek. Cara menghitungnya dilakukan dengan menggunakan konsep entropi.


S adalah ruang (data) sampel yang digunakan untuk pelatihan, p+ adalah jumlah yang bersolusi positif atau mendukung pada data sampel untuk kriteria tertentu dan p- adalah jumlah yang bersolusi negatif atau tidak mendukung pada data sampel untuk kriteria tertentu. ntropi(S) sama dengan 0, jika semua contoh pada S berada dalam kelas yang sama. Entropi(S) sama dengan 1, jika jumlaontoh positif dan negative dalam S adalah sama. Entropi(S) lebih dari 0 tetapi kurang dari 1, jika jumlah contoh positif dan negative dalam S tidak sama [Mitchell,1997].Entropi split yang membagi S dengan n record menjadi himpunan-himpunan S1 dengan n1 baris dan S2 dengan n2 baris adalah :

Kemudian menghitung perolehan informasi dari output data atau variabel dependent yang dikelompokkan berdasarkan atribut A, dinotasikan dengan gain (y,A). Perolehan informasi, gain (y,A), dari atribut A relative terhadap output data adalah:

nilai (A) adalah semua nilai yang mungkin dari atribut A, dan yc adalah subset dari y dimana A mempunyai nilai c. Term pertama dalam persamaan diatas adalah entropy total dan term kedua adalah entropy sesudah dilakukan pemisahan data berdasarkan atribut A.
Untuk menghitung rasio perolehan perlu diketahui suatu term baru yang disebut pemisahan informasi (SplitInfo). Pemisahan informasi dihitung dengan cara :

bahwa S1 sampai Sc adalah subset yang dihasilkan dari pemecahan dengan menggunakan atribut A yang mempunyai sebanyak nilai. Selanjutnya rasio perolehan (gain ratio) dihitung dengan cara :

Contoh Aplikasi

CREDIT RISK

Berikut ini merupakan contoh dari salah satu kasus resiko kredit (credit risk) yang menggunakan decision tree untuk menentukan apakah seorang potential customer dengan karakteristik savingasset dan income tertentu memiliki good credit risk atau bad credit risk.

Dapat dilihat pada gambar tersebut, bahwa target variable dari decision tree tersebut atau variable yang akan diprediksi adalah credit risk dengan menggunakan predictor variable : saving, asset, dan income. Setiap nilai atribut dari predictor variable akan memiliki cabang menuju predictor variable selanjutnya, dan seterusnya hingga tidak dapat dipecah dan menuju pada target variable.
Penentuan apakah diteruskan menuju predictor variable (decision node) atau menuju target variable (leaf node) tergantung pada keyakinan (knowledge) apakah potential customer dengan nilai atribut variable keputusan tertentu memiliki keakuratan nilai target variable 100% atau tidak. Misalnya pada kasus di atas untuk saving medium, ternyata knowledge yang dimiliki bahwa untuk seluruh potential customer dengan saving medium memiliki credit risk yang baik dengan keakuratan 100%. Sedangkan untuk nilai low asset terdapat kemungkinan good credit risk dan bad credit risk.
Jika tidak terdapat pemisahan lagi yang mungkin dilakukan, maka algoritma decision tree akan berhenti membentuk decision node yang baru. Seharusnya setiap branches diakhiri dengan “pure” leaf node, yaitu leaf node dengan target variable yang bersifat unary untuk setiap records pada node tersebut, di mana untuk setiap nilai predictor variable yang sama akan memiliki nilai target variable yang sama. Tetapi, terdapat kemungkinan decision node memiliki “diverse” atributes, yaitu bersifat nonunary untuk nilai target variablenya, di mana untuk setiap record dengan nilai predictor variable yang sama ternyata memiliki nilai target variable yang berbeda. Kondisi tersebut menyebabkan tidak dapat dilakukan pencabangan lagi berdasarkan nilai predictor variable. Sehingga solusinya adalah membentuk leaf node yang disebut “diverse” leaf node, dengan menyatakan level kepercayaan dari diverse leaf node tersebut. Misalnya untuk contoh data berikut ini :

Dari training data tersebut kemudian disusunlah alternatif untuk candidate split, sehingga setiap nilai untuk predictor variable di atas hanya membentuk 2 cabang, yaitu sebagai berikut:

Kemudian untuk setiap candidate split di atas, dihitung variabelvariabel berikut berdasarkan training data yang dimiliki. Adapun variabelvariabel tersebut, yaitu :

,di mana

Adapun contoh hasil perhitungannya adalah sebagai berikut :

Dapat dilihat dari contoh perhitungan di atas, bahwa yang memiliki nilai goodness of split * Φ(s/t) + yang terbesar, yaitu split 4 dengan nilai 0.64275. Oleh karena itu split 4 lah yang akan digunakan pada root node, yaitu split dengan : assets = low dengan assets = {medium, high}.
Untuk penentuan pencabangan, dapat dilihat bahwa dengan assets=low maka didapatkan pure node leaf, yaitu bad risk (untuk record 2 dan 7). Sedangkan untuk assets = {medium, high} masih terdapat 2 nilai, yaitu good credit risk dan bad credit risk. Sehingga pencabangan untuk assets = {medium, high} memiliki decision node baru. Adapun pemilihan split yang akan digunakan, yaitu dengan menyusun perhitungan nilai Φ(s/t) yang baru tanpa melihat split 4, record 2 dan 7.

Demikian seterusnya hingga akhirnya dibentuk leaf node dan membentuk decision tree yang utuh (fully grown form) seperti di bawah ini :

SISTEM PAKAR DIAGNOSA PENYAKIT (KUSRINI)

Dalam aplikasi ini terdapat tabel-tabel sebagai berikut:
oTabel Rekam_Medis, berisi data asli rekam medis pasien
oTabel Kasus, beisi data variabel yang dapat mempengaruhi kesimpulan diagnosis dari pasien-pasien yang ada, misalnya Jenis Kelamin, Umur, Daerah_Tinggal, Gejala_1 s/d gejala_n, Hasil_Tes_1 s/d Hasi_Tes_n. Selain itu dalam tabel ini juga memiliki field Hasil_Diagnosis.
oTabel Aturan, berisi aturan hasil ekstrak dari pohon keputusan.
Proses akuisisi pengetahuan yang secara biasanya dalam sistem pakar dilakukan oleh sistem pakar, dalam sistem ini akan dillakukan dengan urutan proses ditunjukkan pada gambar berikut:

Hasil pembentukan pohon keputusan bisa seperti pohon keputusan yang tampak pada gambar:
Lambang bulat pada pohon keputusan melambangkan sebagai node akar atau cabang (bukan daun) sedangkan kotak
melambangkan node daun. Jika pengetahuan yang terbentuk beruka kaidah produksi dengan format:
Jika Premis Maka Konklusi Node-node akar akan menjadi Premis dari aturan sedangkan node daun akan menjadi bagian konklusinya. Dari gambar pohon keputusan pada gambar 4, dapat dibentuk aturan sebagai berikut:
1.                      Jika Atr_1 = N_1
Dan Atr_2 = N_4
Dan Atr_3 = N_9
Maka H_1
2.                      Jika Atr_1 = N_1
Dan Atr_2 = N_4
Dan Atr_3 = N_10
Dan Atr_4 = N_11
Maka H_2
3.                      Jika Atr_1 = N_1
Dan Atr_2 = N_4
Dan Atr_3 = N_10
Dan Atr_4 = N_12
Maka H_2
4.                      Jika Atr_1 = N_1
Dan Atr_2 = N_5
Maka H_4
5.                      Jika Atr_1 = N_2
Maka H_5
6.                      Jika Atr_1 = N_3
Dan Atr_5 = N_6
Maka H_6
7.                      Jika Atr_1 = N_3
Dan Atr_5 = N_7
Maka H_7
8.                      Jika Atr_1 = N_3
Dan Atr_5 = N_8
Maka H_8
Model case based reasoning dapat digunakan sebagai metode akuisisi pengetahuan dalam aplikasi system pakar diagnosis penyakit. Aturan yagn dihasilkan system ini mampu digunakan untuk mendiagnosis penyakit didasarkan pada data-data pasien. Dalam penentuan diagnosis penyakit belum diimplementasikan derajat kepercayaan terhadap hasil diagnosis tersebut.