In mijn vorige blog – Waarom investeren in een data catalogus – heb ik de vereisten van een goede data catalogus uiteen gezet. Een van de technische vereisten die wij daarbij hebben, is dat een data catalogus moet aansluiten bij onze Cloud Native architectuur en dat de catalogus uitbreidbaar moet zijn aan de applicatiezijde. Want je wilt je data eenvoudig ontsluiten en indexeren door de data catalogus te koppelen aan alle applicaties die je gebruikt en wilt gaan gebruiken. Je kijkt dan al snel naar open source oplossingen, omdat open source eindeloze mogelijkheden biedt om te koppelen met andere platformen en applicaties. Omdat de koppelingen er al zijn, of omdat je ze zelf kunt ontwikkelen.
Wat zijn nog meer redenen om voor open source software te kiezen?
Persoonlijk vind ik open source oplossingen enorm belangrijk voor ons vakgebied. Zoals in mijn vorige blog al aangestipt, ben je met open source software niet afhankelijk van integraties die ontwikkeld worden door de fabrikant. Wanneer er geen koppeling is met een databron die je wilt ontsluiten, kun je die vrijwel altijd zelf realiseren. Daarbij is de uitbreidbaarheid van open source software ongekend. Je kunt dit zelf doen als het nodig is, met of zonder vakgenoten uit de community. Je hoeft dus niet te wachten tot een leverancier het een keer op de agenda heeft staan.
Helemaal belangrijk is de veiligheid. Je kunt bij open source valideren of het écht werkt zoals het zou moeten werken. Bijvoorbeeld door je eigen code scanning software of door handmatige validatie. Het is geen ‘black box’ die bewaakt wordt door de leverancier. Je kunt zo zelf verantwoordelijkheid nemen voor de veiligheid van de data en applicaties.
Nu zijn er echt wel goede data catalogi van leveranciers in omloop. Maar voor kleinere organisaties zijn de kosten hiervan vaak veel te hoog. Dan is de keuze voor een open source alternatief al snel gemaakt. Voorbeelden van deze data catalogi zijn CKAN, en DataHub. Hierbij is CKAN een oudere catalogus, en dus ook verder doorontwikkeld. DataHub daarentegen is redelijk nieuw, er worden regelmatig updates uitgebracht op basis van feedback. Daarnaast worden er constant nieuwe connectoren uitgebracht, bijvoorbeeld voor Power BI.
Allemaal goede redenen om met open source oplossingen aan de slag te gaan. Voor mij is het ook een reden om actief bij te dragen aan deze oplossingen. Zoals bijvoorbeeld aan DataHub. Zo draag ik zelf ook bij aan Community-gedreven innovatie.
Natuurlijk wel! Er zijn een aantal zaken waar je echt rekening mee moet houden.
Hoewel open source software vaak gratis beschikbaar is, zijn er alsnog kosten aan verbonden. Niet zo zeer in licenties, meer in de vorm van ondersteuning. Sommige open source projecten bieden Enterprise support contracten, anderen niet. Het is aan jou om af te wegen of deze support nodig is, of dat je dit intern oplost.
Daarnaast is open source software vaak actief in ontwikkeling. Niet alles is dan uitgekristalliseerd en helemaal uitgewerkt. Je moet er niet van uit gaan dat je altijd een ‘plug-and-play’ oplossing tot je beschikking hebt. In veel gevallen moet je dan iets meer moeite doen en uitzoekwerk verrichten om het goed te implementeren en beheren.
Glenn Schuurman
Platform Engineer
Deel dit met uw volgers
In mijn vorige blog – Waarom investeren in een data catalogus – heb ik de vereisten van een goede data catalogus uiteen gezet. Een van de technische vereisten die wij daarbij hebben, is dat een data catalogus moet aansluiten bij onze Cloud Native architectuur en dat de catalogus uitbreidbaar moet zijn aan de applicatiezijde. Want je wilt je data eenvoudig ontsluiten en indexeren door de data catalogus te koppelen aan alle applicaties die je gebruikt en wilt gaan gebruiken. Je kijkt dan al snel naar open source oplossingen, omdat open source eindeloze mogelijkheden biedt om te koppelen met andere platformen en applicaties. Omdat de koppelingen er al zijn, of omdat je ze zelf kunt ontwikkelen.
Wat zijn nog meer redenen om voor open source software te kiezen?
Persoonlijk vind ik open source oplossingen enorm belangrijk voor ons vakgebied. Zoals in mijn vorige blog al aangestipt, ben je met open source software niet afhankelijk van integraties die ontwikkeld worden door de fabrikant. Wanneer er geen koppeling is met een databron die je wilt ontsluiten, kun je die vrijwel altijd zelf realiseren. Daarbij is de uitbreidbaarheid van open source software ongekend. Je kunt dit zelf doen als het nodig is, met of zonder vakgenoten uit de community. Je hoeft dus niet te wachten tot een leverancier het een keer op de agenda heeft staan.
Helemaal belangrijk is de veiligheid. Je kunt bij open source valideren of het écht werkt zoals het zou moeten werken. Bijvoorbeeld door je eigen code scanning software of door handmatige validatie. Het is geen ‘black box’ die bewaakt wordt door de leverancier. Je kunt zo zelf verantwoordelijkheid nemen voor de veiligheid van de data en applicaties.
Nu zijn er echt wel goede data catalogi van leveranciers in omloop. Maar voor kleinere organisaties zijn de kosten hiervan vaak veel te hoog. Dan is de keuze voor een open source alternatief al snel gemaakt. Voorbeelden van deze data catalogi zijn CKAN, en DataHub. Hierbij is CKAN een oudere catalogus, en dus ook verder doorontwikkeld. DataHub daarentegen is redelijk nieuw, er worden regelmatig updates uitgebracht op basis van feedback. Daarnaast worden er constant nieuwe connectoren uitgebracht, bijvoorbeeld voor Power BI.
Allemaal goede redenen om met open source oplossingen aan de slag te gaan. Voor mij is het ook een reden om actief bij te dragen aan deze oplossingen. Zoals bijvoorbeeld aan DataHub. Zo draag ik zelf ook bij aan Community-gedreven innovatie.
Natuurlijk wel! Er zijn een aantal zaken waar je echt rekening mee moet houden.
Hoewel open source software vaak gratis beschikbaar is, zijn er alsnog kosten aan verbonden. Niet zo zeer in licenties, meer in de vorm van ondersteuning. Sommige open source projecten bieden Enterprise support contracten, anderen niet. Het is aan jou om af te wegen of deze support nodig is, of dat je dit intern oplost.
Daarnaast is open source software vaak actief in ontwikkeling. Niet alles is dan uitgekristalliseerd en helemaal uitgewerkt. Je moet er niet van uit gaan dat je altijd een ‘plug-and-play’ oplossing tot je beschikking hebt. In veel gevallen moet je dan iets meer moeite doen en uitzoekwerk verrichten om het goed te implementeren en beheren.
Glenn Schuurman
Platform Engineer
Scamander
Bernhardstraat 1
3433 EL Nieuwegein
Algemeen: 030-6029000
KvK : 30 15 16 09, Utrecht
E-mail: info@scamander.com
Scamander
Bernhardstraat 1
3433 EL Nieuwegein
Algemeen: 030-6029000
KvK : 30 15 16 09, Utrecht
E-mail: info@scamander.com
Copyright Scamander 2024
Copyright Scamander 2024