Commerciële versus Open Source zoeksoftware
vrijdag 23 april 2010 23:29
Wij komen regelmatig in discussies terecht over wel of niet Open Source zoeksoftware te gebruiken. Er is echter geen goed of fout in dit geval. Op basis van hele duidelijke wensen en eisen kunnen we inzichtelijk maken of Open Source in dat geval een goede investering is of dat juist commerciële zoeksoftware beter is.
Open Source is zeer interessant voor organisaties die:
- sterk willen investeren (mensen, tijd) om zoektechnologie te integreren met hun systemen
- niet gehinderd willen worden door licentiekosten voor de inzet van zoektechnologie
- hele specifieke algoritmes willen toepassen bij het vinden van informatie
Dit zijn organisaties die 'er voor gaan' en Open Source naar een hoger plan willen tillen voor de uitdagingen van hun organisatie. Dit vereist echter een enorme opbouw van kennis, geduld (het blijft werken met een Open Source Community) en het hebben van een duidelijke visie (dat kan natuurlijk nooit kwaad).
Open Source kan echter nu in specifieke gevallen ook al interessant zijn:
- de doorzoekbaar te maken informatie is in tekstformaat (XML, HTML)
- documentbeveiliging is geen issue of kan heel simpel geregeld worden
- de repositories zijn open en goed te benaderen
- de informatie hoeft niet per se automatisch verrijkt te worden
In deze gevallen kan Open Source zoeksoftware worden gebruikt voor het maken van goede en functionele zoektoepassingen. De implementatie vergt vaak nog wel steeds meer tijd dan met commerciële software en is wat onzekerder, maar zeker niet onoverkomelijk. Let er wel op dat er voldoende tijd wordt gereserveerd voor de opbouw van kennis en het opvangen van tegenslagen.
In gevallen waar de eisen qua document formaten, beveiliging, repositories en automatische verrijking hoger liggen, biedt Open Source nog geen goed functioneel en economisch alternatief. Natuurlijk is alles te bouwen, maar het ontwikkelen van deze integratie gaat de meeste projecten in ieder geval te boven. Denk maar eens aan de volgende complexiteit:
- documentformaten
ondersteuning van Office, PDF, grafische formaten, lijntekeningen, audio en video, zip, pst, ... - documentbeveiliging
bij veel organisaties worden meerdere beveiligingsmodellen gebruikt, hebben gebruikers vaak meerdere gebruikersnamen, ... - repositories
informatie die doorzoekbaar gemaakt moet worden staat op allerlei plekken: de netwerkschijf, in document management systemen, databases, websites, emailservers, externe nieuwsfeeds, ... - automatische informatieverrijking
het automatische detecteren van personen, lokaties, bedrijfsnamen, sentiment, onderwerpen, etc., en vervolgens normaliseren van metadata en metadata-inhoud kan voor de terugvindbaarheid en de consistentie bij het zoeken enorme verbeteringen opleveren
Als deze wensen en eisen belangrijk zijn, dan is commerciële zoeksoftware een betere keuze. Op het gebied van Open Source wordt hier wel hard aan gewerkt, maar de oplossingen zijn nog zeer beperkt in scope en slechts na flink aanpassen productierijp te maken.
Conclusie is dan ook dat Open Source in specifieke gevallen een volwaardig alternatief kan bieden, maar voor de meer uitdagende heterogene omgevingen nog geen match is voor commerciële software.
Tevens is niets natuurlijk gratis, het feit dat de licentie geen geld kost, betekent niet ook dat de implementatie daardoor dus goedkoper is. Door het karakter van Open Source (continue ontwikkeling door verschillende partijen) moet extra tijd worden besteed aan de implementatie.