Cloudera Search – Die neue Generation von Big Data Search

Wir starteten einst, 3500 vor Christus, mit Bildern und Zeichnungen an Wänden. Im Jahr 105 kam es zur ersten Innovation: dem Papier. Die Archivierung und Auswertung von Daten begann. Heute verarbeiten wir eine Unmengen davon und dies in Echtzeit. Big Data Technologien machen es möglich. Innovationen wie Cloudera´s Search Service bedienen sich an den uns vorliegenden Daten und verhelfen uns zu neuen Erkenntnissen. Zeitgleich steigt die Erkenntnis, dass Big Data ein Wettbewerbsvorteil ist. Es stellt sich „nur noch” die Frage nach der effektivsten Methode.

Das Suchen hat ein Ende

Solr, eines der größten Open-Source-Projekte der Welt, ist eine Enterprise Search Plattform, geschrieben in Java. Es ist heute eine der beliebtes und schnellsten Plattform, erstellt auf Apache Lucene. Einige betrachten Solr als die zuverlässigste und skalierbarste Suchmaschine ihrer Art. Denn sie arbeitet auf der Oberseite der relationalen Datenbanken, Frameworks wie Hadoop und als ein alleinständiger NoSQL-Store. Solr begann als CNET Werkzeug, um seine internen Daten zu durchsuchen. Mehr als zehn Jahre später ist es in den größten Unternehmen im Einsatz und wird für den öffentlichen und den internen Gebrauch genutzt. Die wichtigsten Hadoop-Distributionen von Cloudera, Hortonworks und MapR bündeln Solr als Suchmaschine für ihren großen Datenplattformen.

Cloudera Search Komponenten & Features

Apache Solr ist Bestandteil der Cloudera Search und arbeitet mit Tools zusammen, wie Apache Lucene, Apache SolrCloud, Apache Flume, Apache Tika und Apache Hadoop MapReduce und HDFS. Die Integration von Solr in Hadoop ermöglicht direktes Lesen sowie Schreiben vom HDFS sowie Replikation auf dem HDFS. Dadurch wird im Falle eines Node-Ausfalls die Datenverfügbarkeit sichergestellt. Eine weitere Komponente ist Cloudera Morphlines, welches das Laden von verschiedenen Datentypen nach Cloudera Search optimiert, die Skalierbarkeit erhöht und die Benutzung vereinfacht. Weitere Features sind full text search, hit highlighting, faceted search, dynamic clustering, database integration, and rich document handling (z.B. Word, PDF).

Best Practices

E-Commerce: Effektive Such- und Empfehlungs-Funktionen sind von zentraler Bedeutung für den Erfolg einer E-Commerce-Website. Käufer müssen in der Lage sein, die genauen Produkte, die sie kaufen wollen, leicht zu finden. Solr bietet Vorteile gegenüber anderen Plattformen, einschließlich schneller Bereitstellung, einer konstanten Leistung bei Umfang und Funktionen wie die Volltextsuche, Auto-Suggest und facettierte Navigation. Online-Shops wie eBay, Zappos, Best Buy und Target verlassen sich auf Solr um Tausende von Produkten auffindbar zu machen.
Social networks: Geringe Leistung ist ein Albtraum für jede Plattform oder Webseite, und soziale Netzwerke sind keine Ausnahme. Webseiten ähnlich Instagram, Reddit, Digg und eHarmony nutzen Solr, um die heutige Nachfrage des Nutzers nach Geschwindigkeit zu bedienen.

Big Data Einstieg mit T-Systems

Alle Organisationen unabhängig von der Größe und Branche produzieren mehr Daten als jemals zuvor. Allerdings erkennen die Meisten nicht das riesige Potential von Big Data und verpassen somit die Chance Wettbewerbsvorteile zu erzielen. T-Systems bietet Ihnen verschiedene Möglichkeiten in die Big Data Welt einzusteigen: einen T-Systems Big Data Innovation Workshop, ein Ready Assessment und ein Proof of Concept. Desweiteren kann eine komplett gemanagte Big Data Hadoop Plattform mit verschiedenen Plattform-Services (unteranderem Cloudera Search) gemietet werden.

Big Data Grüße
Sven Löffler

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

* Pflichtfeld

 
 

Twitter

tsystemsde @tsystemsde
Die #SAP-Community trifft sich auf dem DSAG 2019. T-Systems stellt erfolgreiche SAP-Projekte vor. Um 17:45 Uhr in R… https://t.co/cwJmYBikGr
Deutschland kann ein #5G-Pionier sein: #TSystems-CEO Adel Al-Saleh (@adel_al_saleh) sprach auf der Eröffnungsfeier… https://t.co/SZ4mFQVQuN
Alles im Blick: Wie kann man große Außenlager mit moderner Technik effizienter überwachen? #TSystems-Experte Lars V… https://t.co/rfuAwmh719
Consumer Experience im Arbeitsleben – alles rund um Service Automation im Personalbereich erfahren Sie beim… https://t.co/6UwYdaGaXq
Software Defined Wide Area Networks bieten vor allem eines: Flexibilität. Dank einer neuen Partnerschaft mit… https://t.co/7kJXqHt9dN
#Smart City-Lösungen werden zu einem neuen Markt für Versorgungsunternehmen, vor allem in mittelgroßen europäischen… https://t.co/iEf3g11guy
#TSystems hat den “Rising Star of the Year”-Award des @AWS_DACH Partnernetzwerks erhalten. Jetzt mehr über das Rund… https://t.co/tSz106LrJR
Das #SAP Leonardo-Exponat „Connected Greenhouse“ auf der DSAG 2019 zeigt ein modernes, intelligentes Unternehmen au… https://t.co/hOczb56x0c
Dank einer #Verschlüsselungssoftware können nun auch mit dem #iPhone vertrauliche Gespräche geführt werden. Die von… https://t.co/IZAMs5Na47
Load More...