Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Search in posts
Search in pages
dslc_downloads
events_agenda
klanten
dslc_projects
vacature
Header image blog 2

Waarom kies je voor een open source data catalogus?

  • 25 april 2024

In mijn vorige blog – Waarom investeren in een data catalogus – heb ik de vereisten van een goede data catalogus uiteen gezet. Een van de technische vereisten die wij daarbij hebben, is dat een data catalogus moet aansluiten bij onze Cloud Native architectuur en dat de catalogus uitbreidbaar moet zijn aan de applicatiezijde. Want je wilt je data eenvoudig ontsluiten en indexeren door de data catalogus te koppelen aan alle applicaties die je gebruikt en wilt gaan gebruiken. Je kijkt dan al snel naar open source oplossingen, omdat open source eindeloze mogelijkheden biedt om te koppelen met andere platformen en applicaties. Omdat de koppelingen er al zijn, of omdat je ze zelf kunt ontwikkelen.

De kracht van open source software

Wat zijn nog meer redenen om voor open source software te kiezen?

  1. Kosteneffectiviteit – Open source software is meestal gratis of tegen lage kosten beschikbaar.
  2. Flexibiliteit en Aanpassingsvermogen – Gebruikers kunnen open source software aanpassen aan hun specifieke behoeften.
  3. Community-driven Innovatie – Open source projecten profiteren van bijdragen van een wereldwijde community van ontwikkelaars.
  4. Transparantie -Doordat de broncode toegankelijk is, kunnen gebruikers de code checken op bijvoorbeeld veiligheid en privacy.
  5. Veiligheid en Betrouwbaarheid – Open source software wordt voortdurend gecontroleerd door een groot aantal ontwikkelaars, wat snel signaleren en oplossen van fouten bevordert.
  6. Minder kans op Vendor Lock-in – Gebruikers van open source software zijn niet gebonden aan de producten, prijsstelling of licentievoorwaarden van een specifieke leverancier.
  7. Onderwijs en Leren – Open source biedt een uitstekende leeromgeving voor nieuwe en ervaren ontwikkelaars.
  8. Duurzaamheid – Open source projecten zijn niet afhankelijk van de financiële gezondheid of strategische beslissingen van één bedrijf.
  9. Ondersteuning en Community – Een actieve en betrokken community biedt uitgebreide ondersteuning.

Persoonlijk vind ik open source oplossingen enorm belangrijk voor ons vakgebied. Zoals in mijn vorige blog al aangestipt, ben je met open source software niet afhankelijk van integraties die ontwikkeld worden door de fabrikant. Wanneer er geen koppeling is met een databron die je wilt ontsluiten, kun je die vrijwel altijd zelf realiseren. Daarbij is de uitbreidbaarheid van open source software ongekend. Je kunt dit zelf doen als het nodig is, met of zonder vakgenoten uit de community. Je hoeft dus niet te wachten tot een leverancier het een keer op de agenda heeft staan.

Helemaal belangrijk is de veiligheid. Je kunt bij open source valideren of het écht werkt zoals het zou moeten werken. Bijvoorbeeld door je eigen code scanning software of door handmatige validatie. Het is geen ‘black box’ die bewaakt wordt door de leverancier. Je kunt zo zelf verantwoordelijkheid nemen voor de veiligheid van de data en applicaties.

Open source data catalogus

Nu zijn er echt wel goede data catalogi van leveranciers in omloop. Maar voor kleinere organisaties zijn de kosten hiervan vaak veel te hoog. Dan is de keuze voor een open source alternatief al snel gemaakt. Voorbeelden van deze data catalogi zijn CKAN, en DataHub. Hierbij is CKAN een oudere catalogus, en dus ook verder doorontwikkeld. DataHub daarentegen is redelijk nieuw, er worden regelmatig updates uitgebracht op basis van feedback. Daarnaast worden er constant nieuwe connectoren uitgebracht, bijvoorbeeld voor Power BI.

Actieve bijdrage

Allemaal goede redenen om met open source oplossingen aan de slag te gaan. Voor mij is het ook een reden om actief bij te dragen aan deze oplossingen. Zoals bijvoorbeeld aan DataHub. Zo draag ik zelf ook bij aan Community-gedreven innovatie.

Maar zijn er dan geen valkuilen?

Natuurlijk wel! Er zijn een aantal zaken waar je echt rekening mee moet houden.

Hoewel open source software vaak gratis beschikbaar is, zijn er alsnog kosten aan verbonden. Niet zo zeer in licenties, meer in de vorm van ondersteuning. Sommige open source projecten bieden Enterprise support contracten, anderen niet. Het is aan jou om af te wegen of deze support nodig is, of dat je dit intern oplost.

Daarnaast is open source software vaak actief in ontwikkeling. Niet alles is dan uitgekristalliseerd en helemaal uitgewerkt. Je moet er niet van uit gaan dat je altijd een ‘plug-and-play’ oplossing tot je beschikking hebt. In veel gevallen moet je dan iets meer moeite doen en uitzoekwerk verrichten om het goed te implementeren en beheren.

Glenn Schuurman
Platform Engineer

Deel dit met uw volgers

In mijn vorige blog – Waarom investeren in een data catalogus – heb ik de vereisten van een goede data catalogus uiteen gezet. Een van de technische vereisten die wij daarbij hebben, is dat een data catalogus moet aansluiten bij onze Cloud Native architectuur en dat de catalogus uitbreidbaar moet zijn aan de applicatiezijde. Want je wilt je data eenvoudig ontsluiten en indexeren door de data catalogus te koppelen aan alle applicaties die je gebruikt en wilt gaan gebruiken. Je kijkt dan al snel naar open source oplossingen, omdat open source eindeloze mogelijkheden biedt om te koppelen met andere platformen en applicaties. Omdat de koppelingen er al zijn, of omdat je ze zelf kunt ontwikkelen.

De kracht van open source software

Wat zijn nog meer redenen om voor open source software te kiezen?

  1. Kosteneffectiviteit – Open source software is meestal gratis of tegen lage kosten beschikbaar.
  2. Flexibiliteit en Aanpassingsvermogen – Gebruikers kunnen open source software aanpassen aan hun specifieke behoeften.
  3. Community-driven Innovatie – Open source projecten profiteren van bijdragen van een wereldwijde community van ontwikkelaars.
  4. Transparantie -Doordat de broncode toegankelijk is, kunnen gebruikers de code checken op bijvoorbeeld veiligheid en privacy.
  5. Veiligheid en Betrouwbaarheid – Open source software wordt voortdurend gecontroleerd door een groot aantal ontwikkelaars, wat snel signaleren en oplossen van fouten bevordert.
  6. Minder kans op Vendor Lock-in – Gebruikers van open source software zijn niet gebonden aan de producten, prijsstelling of licentievoorwaarden van een specifieke leverancier.
  7. Onderwijs en Leren – Open source biedt een uitstekende leeromgeving voor nieuwe en ervaren ontwikkelaars.
  8. Duurzaamheid – Open source projecten zijn niet afhankelijk van de financiële gezondheid of strategische beslissingen van één bedrijf.
  9. Ondersteuning en Community – Een actieve en betrokken community biedt uitgebreide ondersteuning.

Persoonlijk vind ik open source oplossingen enorm belangrijk voor ons vakgebied. Zoals in mijn vorige blog al aangestipt, ben je met open source software niet afhankelijk van integraties die ontwikkeld worden door de fabrikant. Wanneer er geen koppeling is met een databron die je wilt ontsluiten, kun je die vrijwel altijd zelf realiseren. Daarbij is de uitbreidbaarheid van open source software ongekend. Je kunt dit zelf doen als het nodig is, met of zonder vakgenoten uit de community. Je hoeft dus niet te wachten tot een leverancier het een keer op de agenda heeft staan.

Helemaal belangrijk is de veiligheid. Je kunt bij open source valideren of het écht werkt zoals het zou moeten werken. Bijvoorbeeld door je eigen code scanning software of door handmatige validatie. Het is geen ‘black box’ die bewaakt wordt door de leverancier. Je kunt zo zelf verantwoordelijkheid nemen voor de veiligheid van de data en applicaties.

Open source data catalogus

Nu zijn er echt wel goede data catalogi van leveranciers in omloop. Maar voor kleinere organisaties zijn de kosten hiervan vaak veel te hoog. Dan is de keuze voor een open source alternatief al snel gemaakt. Voorbeelden van deze data catalogi zijn CKAN, en DataHub. Hierbij is CKAN een oudere catalogus, en dus ook verder doorontwikkeld. DataHub daarentegen is redelijk nieuw, er worden regelmatig updates uitgebracht op basis van feedback. Daarnaast worden er constant nieuwe connectoren uitgebracht, bijvoorbeeld voor Power BI.

Actieve bijdrage

Allemaal goede redenen om met open source oplossingen aan de slag te gaan. Voor mij is het ook een reden om actief bij te dragen aan deze oplossingen. Zoals bijvoorbeeld aan DataHub. Zo draag ik zelf ook bij aan Community-gedreven innovatie.

Maar zijn er dan geen valkuilen?

Natuurlijk wel! Er zijn een aantal zaken waar je echt rekening mee moet houden.

Hoewel open source software vaak gratis beschikbaar is, zijn er alsnog kosten aan verbonden. Niet zo zeer in licenties, meer in de vorm van ondersteuning. Sommige open source projecten bieden Enterprise support contracten, anderen niet. Het is aan jou om af te wegen of deze support nodig is, of dat je dit intern oplost.

Daarnaast is open source software vaak actief in ontwikkeling. Niet alles is dan uitgekristalliseerd en helemaal uitgewerkt. Je moet er niet van uit gaan dat je altijd een ‘plug-and-play’ oplossing tot je beschikking hebt. In veel gevallen moet je dan iets meer moeite doen en uitzoekwerk verrichten om het goed te implementeren en beheren.

Glenn Schuurman
Platform Engineer