Beheer en verrijking van informatie

Een veel onderschat issue bij zoeksystemen is het indexeren van informatie. Bij een zoeksysteem wordt de informatie vrijwel altijd beheerd door een andere toepassing (een database of CMS bijvoorbeeld). Voor deze externe systemen wordt meestal andere metadatering gebruikt, met andere velden, maar ook andere waarden. Dat is erg lastig als er over meerdere informatiebronnen moet worden gezocht.

Tevens ontbreekt vaak inhoudelijke metadata, zoals sleutelwoorden, catagorieen, maar vaak komt ook de inhoud van meta-velden tussen verschillende bronnen niet overeen.

Voor het beheren van het indexeerproces zijn de standaardtools vaak niet voldoende. Zo is het standaard webspideren van Internet sites zeer gevoelig voor veranderingen en wordt vaak ten onrechte een pagina als nieuw of geupdate gemarkeerd.

Voor bovenstaande issues kan CatFactory uitkomst brengen. CatFactory is een set van tools en een data- en metadata-opslag die het mogelijk maakt beter het indexeerproces te beheersen.