Was ist Cloudera?
Was ist Cloudera

Was ist Cloudera?

Bei Cloudera handelt es sich um einen US-amerikanischen Hersteller von Software. Er bietet eine Hadoop-Distribution für die Verarbeitung von großen Datenmengen im Big-Data-Umfeld. Cloudera zählt zu den bekanntesten Anbietern solcher Distributionen.

Cloudera ist ein Unternehmen, das 2008 im kalifornischen Palo Alto gegründet wurde. Das Unternehmen ist spezialisiert auf Software rund um Apache Hadoop und bietet eine eigene Hadoop-Distribution an. Die erste Distribution von Cloudera erschien bereits im Jahr 2009. Für die Hadoop-Distribution CDH (Cloudera Distribution Including Apache Hadoop) existiert ein Abonnement-Modell, das abhängig von der Anzahl der verwendeten Knoten ist. Die wesentlichen Bestandteile von CDH sind neben dem Hadoop Distributed File System (HDFS) und MapReduce Funktionen für die Verwaltung von Clustern, die Integration weiterer Software- und Hardwarekomponenten sowie Features rund um die Hochverfügbarkeit der Systeme und die Sicherheit der Daten.

Die Hadoop-Distribution von Cloudera zählt weltweit zu den bekanntesten Distributionen von Apache Hadoop und ermöglicht den Einsatz im Bereich des High Performance Computings (HPC) und der Big-Data-Anwendungen. Die Lösung lässt sich nutzen, wenn sehr große Datenbestände analysiert und verarbeitet werden müssen. Mögliche Anwendungsgebiete sind im Finanzwesen, in der Logistik, dem Kampagnenmanagement oder im Internet of Things (IoT) und in weiteren Bereichen zu finden. Cloudera stellt für diese Anwendungen eine einheitliche Plattform für das Speichern und Prozessieren aller Daten zur Verfügung.

 

Cloudera und der Enterprise Data Hub

Eine sehr wichtige und grundlegende Rolle in der Hadoop-Distribution von Cloudera nimmt der sogenannte Enterprise Data Hub ein. Er stellt die Ressourcen bereit, um alle Daten zentral zu speichern, vorzuhalten und zu bearbeiten. Er lässt sich in bestehende Infrastrukturen und Anwendungen integrieren und sorgt für abgesicherte und standardisierte Zugriffsverfahren. Auf Basis des Enterprise Data Hubs können zahlreiche unterschiedliche Enterprise-Anwendungen betrieben werden. Für diese sind interaktive SQL-Aktionen, die Batch-Verarbeitung von Daten, die Suche von Daten und erweiterte Analysemöglichkeiten nutzbar.

Auf bigdata-insider.de weiterlesen…