Emid implementeert Solr
maandag 07 november 2011 15:05
Apache Solr is een open source zoekplatform, gebaseerd op Lucene.
De afgelopen jaren heeft Solr zichzelf steeds meer bewezen als breed inzetbaar en het geniet een uitstekende ondersteuning vanuit de "community" van ontwikkelaars.
Het is een relatief makkelijk in te zetten zoekplatform, met geavanceerde functies, snelheid en schaalbaarheid. Solr doet op veel gebieden niet onder voor andere commerciële producten:
- Zoeken met Facetten (dynamische filters)
- Dynamische resultaat clustering (op basis van Carrot2)
- Stemming, stopwoorden en andere taalafhankelijke technieken
- "More like this" om gerelateerde / vergelijkbare informatie of personen te vinden
- Autocomplete / query suggestions om zoekacties te versnellen en om spelfouten te voorkomen
- TermVector analyse om gerelateerde zoekopdrachten voor te stellen
Het is uitstekend in te zetten als de te indexeren informatie:
- openbaar is (dus geen documentbeveiliging);
- in databases of eenvoudig toegankelijke repositories is opgeslagen.
Solr is zeer interessant voor organisaties die:
- Zoektechnologie willen inzetten als strategische toepassing
- Volledige controle willen hebben over de techniek en algoritmes
- Bereidt zijn om nieuwe of aangepaste functies terug te geven aan de community
- niet gehinderd willen worden door licentiekosten voor de inzet van zoektechnologie
Solr is een goede balans tussen Open Source Search out-of-the-box en de mogelijkheid om onder de motorkap specifieke aanpassingen te doen.
Solr kan prima ingezet worden voor website search (in combinatie met Nutch of een andere open source crawler), eCommerce search, database search ("database offloading"), nieuws search, etc.
Via andere open source oplossingen zoals Manifold CF is het mogelijk om informatie uit verschillende bronnen op te nemen in de zoekindexen van Solr.
EMID heeft rond Solr een aantal interessante componenten, die het maken van geavanceerde zoektoepassingen verregaand vereenvoudigen:
- Sourcerer - deze component extraheert metadata uit de content, normaliseert de inhoud van metadatavelden, schoont webpagina's op (navigatie en advertenties worden weggeknipt) en slaat een reservekopie op, zodat snel de gehele indexering opnieuw uitgevoerd kan worden, zonder terug te gaan naar bron. Lees meer over Sourcerer.
- Sparks - Een set van User Interface componenten waarmee snel zoektoepassingen kunnen worden gemaakt. Zonder technische kennis kan een functioneel beheerder via drag-n-drop in minuten een nieuwe en specifieke zoektoepassing bouwen binnen uw eigen CMS. Lees meer over Sparks.
Bent u geïnteresseerd in de mogelijkheden van Solr / open source search oplossingen of wilt u weten wat de inzet van Solr voor uw organisatie kan betekenen? Neem contact op met Emid Consult.