Sourcerer - bewerken van content ter verbetering van de terugvindbaarheid
Sourcerer is een module die web-pagina’s, documenten, database-records van website, netwerkschijven, databases, nieuwsfeeds, etc., verwerkt en bewerkt zodat de vindbaarheid van de informatie enorm verbetert.
Binnenhalen
Sourcerer heeft goede connectiviteit. Sourcerer kan met geavanceerde opties allerlei content van websites halen, van RSS-feeds, netwerkschijven, databases, etc. Deze content kan in allerlei formaten zijn, waarbij het wordt omgevormd naar een standaard formaat.

configuratie van een RSS-feed
Deze content wordt in een cache opgeslagen, zodat deze snel en eenvoudig opnieuw kan worden verwerkt en ook historisch worden vastgehouden (in geval van nieuws en andere content die na verloop van tijd mogelijk verdwijnt).
Opschonen
Met Sourcerer kun u content opschonen en ontdoen van navigatieblokken, standaard menu’s en andere niet-specifieke informatie die zorgen dat informatie te vaak ten onrechte wordt gevonden.
Ook het ontdekken van gelijke content behoort tot de mogelijkheden.
Data-extractie en verrijking
Informatie is meestal maar beperkt voorzien van metadata. Tevens zijn sommige bronnen beter voorzien dan anderen. Met Sourcerer kunt u met behulp van patronen en woordenboeken automatisch metadata toevoegen aan de content. Op basis van woorden in de tekst kan Sourcerer metadata aanmaken en aan het document toevoegen.
Op basis van datums wordt allerlei data verzameld om slim datumselecties te kunnen doen.
Normalisatie
Tussen bronnen zijn er vaak ook verschillen tussen benaming en inhoud van metadatavelden. Met Sourcerer kan dit worden genormaliseerd tot 1 metadatamodel.
Hierdoor is het zoeken over de verschillende bronnen heen een stuk eenvoudiger en transparanter geworden.
Het resultaat
Met Sourcerer is het mogelijk om een index voor de zoektoepassing(en) te maken, die:
- transparant en genormaliseerd over alle bronnen heen is;
- minder ruis opleveren door schonere teksten;
- rijk is en veel zoekfunctionaliteiten mogelijk maakt;

rijke zoekinterface
Met Sourcerer kunt u:
- enorme hoeveelheid content kan verwerken (opschonen en verrijken) door de automatisering;
- met de cache een historie vasthouden;
- regels voor opschonen, verrijken en normalisatie aanpassen en met terugwerkende kracht vanuit de cache opnieuw een index bouwen.
Hoe het werkt
Sourcerer haalt de informatie uit de bronsystemen op of werkt op informatie die al verzameld is. Deze informatie wordt vervolgens bewerkt en dan automatisch doorgestuurd naar de indexer van de zoekmachine, welke vervolgens de rijke en schone index opbouwt. Sourcerer heeft weinig impact op bestaande indexeerprocessen, maar levert wel heel veel nieuwe informatie op.
Informeer nu wat Sourcerer voor uw zoektoepassing kan betekenen.