Showing posts with label Datawarehause. Show all posts
Showing posts with label Datawarehause. Show all posts

Apa Itu Pentaho ?

Pentaho adalah kumpulan aplikasi Business Intelligence yang bersifat free open source software (FOSS) dan berjalan di atas platform Java. Aplikasi-aplikasi Pentaho dikembangkan oleh Pentaho corp yang berpusat di Orlanda, Amerika Serikat.

Business Intelligence adalah kemampuan untuk mengumpulkan data dari berbagai sumber, memproses dan menampilkannya dalam bentuk yang dapat dengan mudah dianalisis oleh orang-orang bisnis pada suatu organisasi sehingga dari hasil analisis tadi dapat dihasilkan keputusan yang lebih baik untuk organisasi tersebut.

Selain sifatnya gratis dan adopsi yang semakin hari semakin luas, dukungan Pentaho bisa didapatkan dari Pentaho corp dalam bentuk Service Level Agreement (SLA) dan dipaketkan dalam versi Enterprise Edition yang sifatnya annual subscription atau perlu kontrak tahunan. Selain itu jika Anda tetap menggunakan community edition yang gratis, maka bisa mendapatkan support dari banyak partner Pentaho di seluruh dunia termasuk di Indonesia.

Apa saja kumpulan aplikasi Pentaho ?

Pentaho sebenarnya merupakan kumpulan aplikasi yang terdiri sebagai berikut :
1. Pentaho Reporting
* Merupakan aplikasi perancangan Ad Hoc Report di Pentaho.
* Engine reporting yang bisa di-embed di aplikasi Java.
* Multi Platform.
* Dapat mengambil source dari berbagai relational engine. Lihat link berikut untuk database relasional yang didukung oleh Pentaho Reporting.
* Dapat mengambil source OLAP yang didukung driver OLAP4J seperti Mondrian, SQL Server Analysis Service, PALO Molap, SAP BW, dan lainnya.
* Memiliki kemampuan mengambil source Pentaho Data Integration step. Ini menjadikan source yang dapat diambil hampir menjadi tidak terbatas.
* Dilengkapi designer yang intuitif dan koleksi chart yang lengkap untuk keperluan analisa.
* Output dalam format Format PDF, Excel, HTML dan CSV.

2. Pentaho Analysis / Mondrian OLAP Server
* OLAP server open source terpopuler dan digunakan di berbagai produk BI open source (Pentaho dan Jasper).
* Multi Platform.
* Mondrian merupakan tipe ROLAP (Relational OLAP) dimana semua perintah data query diterjemahkan via SQL dan ditujukan kepada datamart.
* Mendukung datamart dengan rancangan multi dimensional Star Schema maupun Snowflake Schema.
* Mendukung query MDX (Multidimensional Expression) sebagai standar industri.
* Didukung oleh beberapa aplikasi interface baik web based maupun desktop seperti JPivot, Pentaho Reporting, Pentaho Analysis Tools, dan Pentaho Analyzer.
* Semua interface di atas memiliki kemampuan drill down / roll up serta drill through untuk melihat detil penyusun sel-sel nilai analisis.

3. Pentaho Data Integration / Kettle
* Utilitas ETL (Extract, Transform and Load) open source paling populer.
* Designer GUI yang intuitif dan sangat mudah digunakan.
* Multi Platform.
* Script ETL dapat disimpan dalam bentuk filesystem maupun repository.
* Mendukung multi pipelining sehingga load balance maupun optimasi pekerjaan data warehouse dapat dilakukan dengan mudah.
* Mendukung clustering (master-slave) engine ETL
* Terdiri atas lebih dari 200 steps yang mencakup job (workflow kontrol) dan transformation (data worfklow).
* Mendukung Apache Virtual Filesystem (Apache VFS) sehingga filesystem seperti HTTP Webdav, FTP, SFTP, dan lain sebagainya dapat dengan mudah diakses dengan konfigurasi yang minimal.

4. Pentaho Data Mining / Weka
* Utilitas data mining yang sangat populer dan digunakan untuk predictive analysis
* Multi Platform.
* Mendukung data sumber / source berformat ARFF (Attribute-Relation File Format), XRRF (XML attribute Relation File Format), CSV (Comma Separated Value), maupun table / view dari relasional database.
* Mendukung standar PMML (Predictive Model Markup Language).
* Mendukung data nominal dan numerik (continue maupun discrete).
* Mendukung algoritma yang cukup banyak untuk operasi dasar data mining seperti Classification, Clustering dan Association. Algoritma tersebut diantaranya adalah J48, M5P, SimpleCart, SimpleKMeans, Apriori, dsbnya.
* Utilitas grafis yang membantu pengolahan dan pemahaman data mulai dari preprocessing, data visualization dalam bentuk plot maupun curve, tree visualization, dsbnya.

5. Pentaho BI Server / Platform
* Server BI yang berjalan sebagai web application portal yang terdiri dari layanan web service, workflow pada space JVM (Java Virtual Machine), dan sebagai user interface untuk laporan operasional maupun analisis.
* Multi Platform.
* Workflow berupa integrasi dari produk Pentaho yang telah disebutkan sebelumnya (Pentaho Data Integration, Pentaho Reporting, dan Pentaho Analysis) dalam bentuk solution.
* Scheduler berjalan di atas platform BI ini untuk melakukan proses batching, misalkan mengirim laporan dalam bentuk PDF ataupun Excel secara periodik.
* Script JSP (Java Server Pages) dapat dengan mudah diintegrasikan ke dalam platform.
* User dapat memiliki space sendiri untuk menyimpan report dan tipe solution lainnya.
* Ad hoc report yang bisa digunakan untuk membuat rancangan report on the fly tanpa keterlibatan IT.


Read More...

Analisa Data Pengadilan

Lembaga peradilan di USA tentunya memiliki data yang begitu komplek. Dimana setiap Negara bagian akan memiliki data-data mengenai kasus yang ditangani. Jelasnya dalam database tersebut terdapat banyak informasi penting mengenai banyak kasus beserta pihak-pihak yang terlibat didalamnya. Setiap Negara bagian akan menyatukan databasenya ke peradilan tertinggi di USA. Namun karena banyaknya database yang tersedia maka proses penyatuan databasenya memiliki sedikit masalah yaitu :

* Data terlalu detail dan komplek
* System datanya dibuat oleh beberapa vendor
* Tidak konsisten dalam pengkodean/query dari database nya
* Tidak terdapat data tunggal yang dapat dianalisa
* Tidak ada tools untuk menganalisa data

Permasalah-permasalah yang terjadi diatas bisa ditangani dengan menggunakan langkah-langkah berikut :
1. ETL (Ekstraction, Transformation and loading
* Ekstrak -> proses pembacaan data dari suatu database. Maksudnya adalah ketika suatu data itu kita ambil dari beberapa database, belum tentu DBMS yang digunakan semuanya sama. Bisa jadi bersebrangan DBMS. Misal dari MySQL ke Oracle atau dari Oracle ke SQL Server. Proses Ektrak inilah yang nanti akan berperan untuk melakukan penyaringan data.
* Transformation-> Proses pengkonfersian data yang telah diekstrak dari format awal ke format yang dibutuhkan.
* Load-> penulisan kembali suatu data ke target database yang dituju

2. Kualitas data terjamin selama proses ETL

3. mengembangkan ETL sering memberikan umpan balik untuk pengembang pengguna dan OLTP untuk membuat sumber data yang lebih baik.



Timbul pertanyaan untuk pada masa yang akan datang
* berapa banyak kasus akan setiap lima tahun dari sekarang
* dimana mereka akan mengajukan kasus
* berapa hakim yang akan menangani kasus lima tahun kedepan
* berapa biaya yang harus dikeluarkan
* akankah fasilitas yang ada mendukung fungsi peradilan

Nah proses pembuatan datawarehouse dan data mining akan baik jika mengikuti langkah-langkah dan syarat seperti berikut :

Langkah Awal :
* persediaan analis database Bisnis
* analisis analis database Bisnis
* eksekutif AOC menyetujui dimensi dan langkah-langkah
* ETL developer mengotomatisasi transfer data ke dalam database skema bintang

Langkah dua
* Data warehouse desainer menjamin kualitas transfer ke dalam data warehouse
* ETL developer mengotomatisasi transfer dan pengolahan data ke dalam layanan analisis
* Kualitas personil jaminan menjamin fungsionalitas yang benar seluruh proyek
* Oakwood mengusulkan langkah berikutnya dalam data mining


Read More...
  • Mahasiswa STMIK Duta Bangsa
  • description
  • description
  • description
  • description
  • description
  • description
  • description

Free Hosting

Free Hosting

My Blog List

A
B
C
     
D
E
F
DuGMp3    
G
H
I
Goo Otomotif HouseofScript  
J
K
L
Java Hotline    
M
N
O

My Games Collection

MeLangKah LeBih MaJu

   
P
Q
R
Pamella Decoration    
S
T
U
Studied WaLL    
V
W
X
     
Y
Z
0-9
     









Join....!


Free Domain

Free Domain

SiNyO. Powered by Blogger.