Cloudera Search – Die neue Generation von Big Data Search

Wir starteten einst, 3500 vor Christus, mit Bildern und Zeichnungen an Wänden. Im Jahr 105 kam es zur ersten Innovation: dem Papier. Die Archivierung und Auswertung von Daten begann. Heute verarbeiten wir eine Unmengen davon und dies in Echtzeit. Big Data Technologien machen es möglich. Innovationen wie Cloudera´s Search Service bedienen sich an den uns vorliegenden Daten und verhelfen uns zu neuen Erkenntnissen. Zeitgleich steigt die Erkenntnis, dass Big Data ein Wettbewerbsvorteil ist. Es stellt sich „nur noch” die Frage nach der effektivsten Methode.

Das Suchen hat ein Ende

Solr, eines der größten Open-Source-Projekte der Welt, ist eine Enterprise Search Plattform, geschrieben in Java. Es ist heute eine der beliebtes und schnellsten Plattform, erstellt auf Apache Lucene. Einige betrachten Solr als die zuverlässigste und skalierbarste Suchmaschine ihrer Art. Denn sie arbeitet auf der Oberseite der relationalen Datenbanken, Frameworks wie Hadoop und als ein alleinständiger NoSQL-Store. Solr begann als CNET Werkzeug, um seine internen Daten zu durchsuchen. Mehr als zehn Jahre später ist es in den größten Unternehmen im Einsatz und wird für den öffentlichen und den internen Gebrauch genutzt. Die wichtigsten Hadoop-Distributionen von Cloudera, Hortonworks und MapR bündeln Solr als Suchmaschine für ihren großen Datenplattformen.

Cloudera Search Komponenten & Features

Apache Solr ist Bestandteil der Cloudera Search und arbeitet mit Tools zusammen, wie Apache Lucene, Apache SolrCloud, Apache Flume, Apache Tika und Apache Hadoop MapReduce und HDFS. Die Integration von Solr in Hadoop ermöglicht direktes Lesen sowie Schreiben vom HDFS sowie Replikation auf dem HDFS. Dadurch wird im Falle eines Node-Ausfalls die Datenverfügbarkeit sichergestellt. Eine weitere Komponente ist Cloudera Morphlines, welches das Laden von verschiedenen Datentypen nach Cloudera Search optimiert, die Skalierbarkeit erhöht und die Benutzung vereinfacht. Weitere Features sind full text search, hit highlighting, faceted search, dynamic clustering, database integration, and rich document handling (z.B. Word, PDF).

Best Practices

E-Commerce: Effektive Such- und Empfehlungs-Funktionen sind von zentraler Bedeutung für den Erfolg einer E-Commerce-Website. Käufer müssen in der Lage sein, die genauen Produkte, die sie kaufen wollen, leicht zu finden. Solr bietet Vorteile gegenüber anderen Plattformen, einschließlich schneller Bereitstellung, einer konstanten Leistung bei Umfang und Funktionen wie die Volltextsuche, Auto-Suggest und facettierte Navigation. Online-Shops wie eBay, Zappos, Best Buy und Target verlassen sich auf Solr um Tausende von Produkten auffindbar zu machen.
Social networks: Geringe Leistung ist ein Albtraum für jede Plattform oder Webseite, und soziale Netzwerke sind keine Ausnahme. Webseiten ähnlich Instagram, Reddit, Digg und eHarmony nutzen Solr, um die heutige Nachfrage des Nutzers nach Geschwindigkeit zu bedienen.

Big Data Einstieg mit T-Systems

Alle Organisationen unabhängig von der Größe und Branche produzieren mehr Daten als jemals zuvor. Allerdings erkennen die Meisten nicht das riesige Potential von Big Data und verpassen somit die Chance Wettbewerbsvorteile zu erzielen. T-Systems bietet Ihnen verschiedene Möglichkeiten in die Big Data Welt einzusteigen: einen T-Systems Big Data Innovation Workshop, ein Ready Assessment und ein Proof of Concept. Desweiteren kann eine komplett gemanagte Big Data Hadoop Plattform mit verschiedenen Plattform-Services (unteranderem Cloudera Search) gemietet werden.

Big Data Grüße
Sven Löffler

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

* Pflichtfeld

 
 

Twitter

tsystemsde @tsystemsde
#SiemensInnovationDay: Als @Siemens Partner sind wir bei T-Systems stolz darauf, unsere Innovationen zu #5G,… https://t.co/FdzGX6gr3B
Hawk, einer der leistungsfähigsten Rechner der Welt, wurde im Stuttgarter Höchstleistungsrechenzentrum (#HLRS) in B… https://t.co/DUJLQhzFpS
Die smarte #IoT-Lösung Mobile Identity & Access (#MIA) für die #Logistik-Branche bringt #TSystems zum zweiten Mal i… https://t.co/NVg6c1xgd2
#CustomerExperience zwischen on- und offline Welt? Wie die eigene Marke emotional aufgeladen und damit eine höhere… https://t.co/TKIJyuyaWz
Von Zentrale bis Filiale: Customer Experience macht den #Handel erfolgreich. Diese digitalen #Retail-Lösungen helfe… https://t.co/k5MsOUTkL0
In Webshops sind Wunschartikel nur einen Klick entfernt, doch viele Kunden legen auch weiterhin Wert auf ein klassi… https://t.co/smWXrM7mF9
Mit dem digitalen Preisschild passt der #Handel flexibel Preise an. Händler bieten blitzschnell Sonderrabatte. Sie… https://t.co/015MKhmTrO
Unser #Gesundheitswesen ist digitaler als sein Ruf – Mark Düsener, Leiter von Telekom Healthcare Solutions im Inter… https://t.co/SXXSHBn4jo
T-Systems präsentiert beim 6. Zukunftskongress Bayern wie Co-Creation bei der Digitalisierung unterstützen kann.… https://t.co/eVwbzZkN2j
Load More...