La sfida di Red Hat a Hadoop si chiama Data Grid 6
L'aggiunta da parte della compagnia Red Hat di Data Grid 6 alla sua famiglia di prodotti JBoss consolida la posizione della compagnia come uno tra i maggiori attori nei data center. Il nuovo componente di gestione dello storage all'interno della piattaforma middleware di JBoss è progettato per dare ai clienti di transazioni finanziare e commerciali la possibilità di gestire operazioni in cui la velocità e la scalabilità siano essenziali.
Red Hat Jboss Data Grid 6 non è come le soluzioni big data rintracciabili nell'ecosistema Hadoop: Data Grid è maggiormente ottimizzato per gestire le operazioni che Hadoop non può fare, ovvero transazioni come quelle che incontriamo in sistemi di e-commerce e financial trading. Poiché è richiesta tanta attività di scrittura e lettura in un'unica transazione, un sistema di batch processing come Hadoop o anche un database relazionale non possono mantenere la velocità e la scalabilità necessarie per sistemi di incredibili dimensioni come banche, o grandi giganti del commercio come Amazon.
Il contesto Teorico di Data Grid
Tener conto dei problemi di velocità e scalabilità è il requisito da aggiungere ai principi del calcolo distribuito enunciati dallo scienziato informatico Eric Brewer. Specificamente, Brewer ha postulato il CAP Theorem, che specifica che i sistemi devono essere coerenti con i dati, tutte le richieste devono essere disponibili, e la partition tolerance deve essere resistente alle cadute del sistema. Per avere la velocità e l'uptime desiderato, Amazon userà il suo database non relazionale Dynamo, per applicare un approccio eventualmente coerente ai suoi sistemi di database. Dynamo fa parte di una classe di database non relazionali conosciuti come database distributed key-value store (DKVS). DKVS è una delle cinque classi che comprendono la topologia del panorama NoSQL, ognuna con una diversa architettura e approccio di gestione dei dati.I database DKVS sono specificamente progettati per gestire la diffusione dei dati lungo un ampio numero di server. Questi sistemi sono tabelle di hash distribuite per i loro archivi key-value, ed essendo distribuiti il database usa relazioni peer-to-peer tra i server, senza che ci sia un controllo master. Attualmente la maggior parte dei database in questa classe sono Dynamo o implementazioni basate su di esso, quali il progetto open source Project Voldemort, Dynomite, e KAI databases.
E' questo quindi il settore dell'ecosistema big data in cui JBoss Data Grid si inserisce. Basato sulla piattaforma open source Infinispan, il prodotto Data Grid costituisce un'aggiunta alla piattaforma Jboss Enterprise Application, il fiore all'occhiello di Red Hat tra le suite di servizi middleware.