Lucene
Lucene ist ein Projekt der Apache Software Foundation, das Suchsoftware erstellt.
Neben den grundlegenden Eigenschaften von Lucene Java, dem Hauptbestandteil des Projekts, besitzt Lucene über eine grosse Auswahl zusätzlicher Funktionen und Werkzeuge.
Durch die hohe Performanz und Skalierbarkeit können die Lucene-Werkzeuge für beliebige Projektgrössen und Anforderungen eingesetzt werden - beispielsweise wird Lucene von der Wikipedia für die Volltextsuche eingesetzt. Zudem verwenden die beiden Desktop-Suchprogramme Beagle und Strigi eine C#- bzw. C++-Portierung von Lucene als Indexer.
Zu den Bestandteile und Unterprojekten von Lucene gehören die folgenden.
Lucene Java | Java-Bibliothek, Hauptbestandteil des Projektes |
---|---|
Lucene.Net | Portierung von Lucene Java (des Quelltexts, der Programmierschnittstelle, der Algorithmen und Klassen) zu C# und auf Microsofts .NET-Plattform |
Lucy | C-Portierung von Lucene Java mit Perl- und Ruby-Sprachanbindungen |
Pylucene | Python-Portierung von Lucene Java |
Droids | Crawler |
Mahout | Suite skalierbarer Bibliotheken für maschinelles Lernen |
Nutch | Auf Lucene Java aufbauene Anwendung für Websuche |
Apache Solr | Suchserver für Volltextsuche |
Tika | Parser, der Metadaten oder strukturierten Text aus einer Reihe von Dokumentformaten mittels spezialisierter (möglichst ohnehin existierender) Bibliotheken wie PDFBox oder Apache POI extrahiert, die einheitlich über Tika angesprochen werden und automatisch ausgewählt werden können. |
Weblinks
Herausgeber | Sprache | Webseitentitel | Anmerkungen |
---|---|---|---|
Wikipedia | ger | Lucenewbm | Enzyklopädischer Artikel |