Lucene

Aus Mikiwiki
Zur Navigation springen Zur Suche springen

Lucene ist ein Projekt der Apache Software Foundation, das Suchsoftware erstellt.

Neben den grundlegenden Eigenschaften von Lucene Java, dem Hauptbestandteil des Projekts, besitzt Lucene über eine grosse Auswahl zusätzlicher Funktionen und Werkzeuge.

Durch die hohe Performanz und Skalierbarkeit können die Lucene-Werkzeuge für beliebige Projektgrössen und Anforderungen eingesetzt werden - beispielsweise wird Lucene von der Wikipedia für die Volltextsuche eingesetzt. Zudem verwenden die beiden Desktop-Suchprogramme Beagle und Strigi eine C#- bzw. C++-Portierung von Lucene als Indexer.

Zu den Bestandteile und Unterprojekten von Lucene gehören die folgenden.

Lucene Java Java-Bibliothek, Hauptbestandteil des Projektes
Lucene.Net Portierung von Lucene Java (des Quelltexts, der Programmierschnittstelle, der Algorithmen und Klassen) zu C# und auf Microsofts .NET-Plattform
Lucy C-Portierung von Lucene Java mit Perl- und Ruby-Sprachanbindungen
Pylucene Python-Portierung von Lucene Java
Droids Crawler
Mahout Suite skalierbarer Bibliotheken für maschinelles Lernen
Nutch Auf Lucene Java aufbauene Anwendung für Websuche
Apache Solr Suchserver für Volltextsuche
Tika Parser, der Metadaten oder strukturierten Text aus einer Reihe von Dokumentformaten mittels spezialisierter (möglichst ohnehin existierender) Bibliotheken wie PDFBox oder Apache POI extrahiert, die einheitlich über Tika angesprochen werden und automatisch ausgewählt werden können.

Weblinks

Herausgeber Sprache Webseitentitel Anmerkungen
Wikipedia ger Lucenewbm Enzyklopädischer Artikel