GeoKettle¶
Extract Transform Load (ETL)¶
GeoKettle è una versione “con supporto spaziale” di Pentaho Data Integration (anche conosciuto come Kettle). È un potente, strumento spaziale ETL (Extract, Transform and Load) per metadata-driven dedicato all’integrazione di diverse sorgenti dei dati per creare e aggiornare database spaziali, data warehouses e servizi web.
GeoKettle permette l’Estrazione di dati dalla sorgente, la Transformazione dei dati al fine di correggere gli errori, pulire i dati, cambiare la struttura dei dati, rendere i dati conformi agli standard, e Caricare i dati trasformati in un DataBase Management System (DBMS), file GIS o servizio web geospaziale di destinazione. GeoKettle è particolarmente utile per automatizzare complessi e ripetitivi processamenti di dati senza produrre il codice specifico, convertendo tra i formati dei dati, migrandi dati tra diversi database, feeding data into databases, etc.
Nel dominio geospaziale, Geokettle viene comparato a FME, uno strumento ETL spaziale proprietario. GeoKettle è stabile, veloce, conforme agli standard, con centinaia di funzioni e supporto per la scrittura/lettura di molti formati di file, servizi e DBMS. GeoKettle è usato da diverse organizzazione in tutto il monto, incluso agenzia governative, banche, assicurazioni e and geospatial system integrators.
Caratteristiche principali¶
- Estrae dati da:
- 35 e più tipologie di database: MySQL, PostgreSQL/PostGIS, Oracle, ...
- File XML
- File XLS
- File Xbase (dBase, Foxpro, etc)
- File systems information
- Generated data
- File MS Access
- LDAP
- SOLAP (Spatial OLAP) system: GeoMondrian
- Formati di dati geospaziali: Shapefile, GML 3.1.1, KML 2.2, tutti i formati supportati da OGR
- OGC Web services: Web Feature Service (WFS), Sensor Observation Service (SOS), Catalogue Web Service (CSW)
- Transformazione dei dati:
- Motore basato su data transfer (no code generator)
- Looking up data in databases, files or memory
- Calculating
- Scripting: Javascript, SQL, RegExp
- Splitting
- Mapping
- Selecting
- Partitioning
- Filtering
- Merging
- Joining
- Duplicating
- Clustering (MPP)
- Pivotting
- Analisi di dati geospaziali: buffer, centroid, distance, intersection, union, ...
- Eleborazione geografica avanzata: clipping, delaunay, simplify/smooth geometry, split features, ...
- Può eseguire qualsiasi Web Processing Service (WPS)
- Aggregazione spaziale
- Anteprima cartografica
- Carica dati nei seguenti formati di destinazione:
- Database: MySQL, PostgreSQL/PostGIS, Oracle, ...
- Popolazione di data warehouse
- Formati di dati geospaziali: Shapefile, GML 3.1.1, KML 2.2, tutti i formati supportati da OGR
- Servizi OGC Web: Catalogue Web Service (CSW), Web Feature Service (WFS), ...
- Partitioned loading
- Bulk loading
- Parallel loading
- Clustering
- Ambienti:
- GUI completa chiamata “Spoon” per modificare ogni opzione di trasformazione
- Strumenti da linea di comando: eseguono lavori e trasformazione
- Server web: esecuzione remote e clustering perfect in ambienti di cloud computing per elaborazione di set di dati molto grandi
- API di sviluppo per Java
- Plugin eco-system
Standard implementati¶
- OGC standards compliant (SFS, WFS-T, WPS, CSW, SOS, GML, KML)
Dettagli¶
Sito Web: http://www.geokettle.org/
Licenza: GNU Lesser General Public License (LGPL) version 2.1
Versione Software: 2.6
Piattaforme Supportate: Windows, Linux, Mac, Solaris
Interfacce API: Java, Javascript
Supporto: http://www.spatialytics.org & http://www.spatialytics.com