Woo-harvester

Bestuursorganen kunnen documentverzamelingen op een eigen publicatieplatform/website publiceren. Vervolgens registreren bestuursorganen in de Woo-index verwijzingen (URL's) naar deze documentverzamelingen zodat KOOP de documenten en metadata in deze verzamelingen centraal doorzoekbaar kan maken. Om dat technisch voor elkaar te krijgen, is de ‘Woo-harvester’ ontwikkeld.

► Nieuws over Indicatieve planning harvester

KOOP is voornemens om vanaf Q2 2026 meer bestuursorganen toe te voegen aan de Woo-harvester. De periode tot dat moment biedt bestuursorganen de ruimte om toe te werken naar het voldoen aan de aansluitvoorwaarden voor de harvester. KOOP ondersteunt bestuursorganen hierbij actief. Zodra een bestuursorgaan aan alle aansluitvoorwaarden voldoet, registreert KOOP dit. Het bestuursorgaan hoeft daarna geen verdere actie te ondernemen; het harvesten zal dan vanaf Q2 2026 volgens een planning die gecommuniceerd wordt met bestuursorganen worden opgepakt en de publicaties zijn vanaf dat moment centraal doorzoekbaar op open.overheid.nl.

Wat betekent dit concreet?
•    Bestuursorganen kunnen de periode tot Q2 2026 gebruiken om hun Woo-publicaties gereed te maken voor harvesting;
•    Bestuursorganen moeten de te harvesten URL’s in de Woo-index registeren;
•    KOOP biedt actieve ondersteuning bij het voldoen aan de aansluitvoorwaarden;
•    Zodra een bestuursorgaan voldoet, wordt dit door KOOP bevestigd aan de Woo-redacteur. Harvesting volgt dan vanaf Q2 2026;
•    Tot Q2 2026 worden geen nieuwe aanlevering opgehaald met de harvester, maar voor reeds aangesloten bestuursorganen blijft KOOP wijzigingen op eerder geharveste documenten verwerken.

Waarom deze aanpak?
De beschikbare ontwikkelcapaciteit binnen KOOP is momenteel, in opdracht van het Ministerie van Binnenlandse Zaken, gericht op twee prioriteiten:
•    Het aansluiten van kerndepartementen en uitvoeringsorganisaties via het handmatig aanleverloket;
•    De doorontwikkeling van de generieke Woo-API.
Deze trajecten zijn essentieel voor een stabiele en toekomstbestendige Generieke Woo-voorziening (GWV). Om dit mogelijk te maken, is gekozen voor deze gefaseerde aanpak.

Blijf op de hoogte
•    Volg deze pagina of neem deel aan onze bijeenkomsten om op de hoogte te blijven van de voortgang;
•    Heeft u vragen of wilt u ondersteuning bij de voorbereidingen? Neem gerust contact met ons op.

Introductie

De Woo-harvester haalt documenten op van de website(s) van bestuursorganen (harvesten) en maakt deze centraal doorzoekbaar op één plek open.overheid.nl. De Woo-harvester haalt alle documenten op zodat deze kunnen worden geindexeerd op inhoud en meegeleverde metadata. Opgehaalde documenten worden niet bij KOOP opgeslagen.Het zoekportaal stuurt uiteindelijk de eindgebruikers voor de gevonden documenten naar de weblocatie van het bestuursorgaan waar het document is gepubliceerd. Eenmaal aangesloten is er dagelijks een check op nieuwe documenten en eventuele wijzigingen.

Er zijn al drie organisaties aangesloten, namelijk: Rijkswaterstaat en de provincies Zeeland en Gelderland.

Voor welke bestuursorganen is de Woo-harvester een geschikte aanlevermethode?

Alle bestuursorganen die volgens de Wet open overheid informatie actief openbaar maken kunnen gebruikmaken van de Woo-harvester.

Om documenten te laten ophalen door KOOP, ook wel ‘harvesten’, is het noodzakelijk dat uw bestuursorgaan:

  • over een publicatieplatform/website beschikt;
  • op het publicatieplatform/website documentverzamelingen zijn ingericht;
  • het publicatieplatform/website voldoet aan de zogeheten publicatievoorwaarden van KOOP.
  • de URL's naar de documentverzamelingen op uw publicatieplatform/website in de Woo-index zijn ingevuld;

Publicatievoorwaarden (handleiding)

In de publicatievoorwaarden staat informatie hoe bestuursorganen documenten via de Woo-harvester aan KOOP kunnen aanleveren.

Stappenplan Harvester

Onderstaande stappen dienen te worden gevolgd zodat de Woo-harvester ingezet kan worden om documenten op te halen.

Voorbereiding

  • (STAP 1) Heb je als bestuursorgaan nog geen toegang tot de Woo-index, raadpleeg deze pagina hoe je dit kunt krijgen: pagina Woo-index;
  • (STAP 2) Implementeer de publicatievoorwaarden (de publicatievoorwaarden) op uw eigen weblocatie. U kunt deze weblocatie kenbaar maken aan de Woo-harvester door de URL hiernaar op te nemen in de Woo-index. Hoe u dit kunt doen leest u hier onder.
  • (STAP 3) Neem de URL's naar de documentverzamelingen op uw publicatieplatform/website op in de Woo-index bij het veld [>Woo-index] bij de betreffende informatiecategorie. Raadpleeg de handleiding Register Overheidsorganisaties voor Woo-redacteuren voor meer informatie. (Als één URL meerdere documentverzamelingen bevat vul deze dan bij meerdere informatiecategorieën in);

Woo-index check

De door bestuursorganen ingevoerde URL's in de Woo-index worden door KOOP gevalideerd op basis van de Woo-index check. Er wordt gevalideerd op een juiste inrichting van de robots.txt in combinatie met de XML sitemaps. (de sitemaps worden niet op inhoud gevalideerd).

  • (STAP 4) Wanneer een URL voldoet aan de publicatievoorwaarden neemt ons implementatieteam contact met de Woo-of ROO-redacteur van uw bestuursorgaan op over de datum waarop documenten worden geharvest;

Indien uit de Woo-index check blijkt dat er sprake is van fouten in de implementatie en er daardoor niet geharvest kan worden, dan neemt KOOP contact op met de betreffende Woo- of ROO-redacteur van het bestuursorgaan.

Harvesten eerste documenten

  • (STAP 5) Na de eerste harvesting en verwerking van documenten en/of metadata worden deze gepubliceerd op het publieke centrale zoekplatform https://open.overheid.nl. De documenten worden na indexering door KOOP niet verder opgeslagen;

Documenten wijzigingen

Na harvesting en verwerking van de eerste documenten zal de Woo-harvester vanaf dat moment regelmatig de verwijzingen van het bestuursorgaan bezoeken en wijziging in documenten en/of metadata harvesten en verwerken.

Al het contact met het bestuursorgaan bij de gecontroleerde livegang ten behoeve van ondersteuning en planning verloopt via het implementatieteam van KOOP (woo@koop.overheid.nl)

Registreren van URL's in de Woo-index

Naast het raadplegen van de handleiding Register Overheidsorganisaties voor Woo-redacteuren kunt u tijdens invulsessies met ondersteuning van KOOP de benodigde URL's (verwijzingen naar documentverzamelingen op uw eigen publicatieplatform/website) in de Woo-index registreren. Kijk op de bijeenkomsten pagina wanneer de eerstvolgende invulsessie is waaraan u kunt deelnemen. 

Referentietrajecten en uitvoeringstoets artikel 3.3b Woo

Er zijn twee referentietrajecten uitgevoerd ten behoeve van de implementatie van de zoekfunctie op documentniveau. Hiermee is beoogd inzicht te krijgen in de vraagstukken en problemen vanuit de praktijksituatie van bestuursorganen en hun leveranciers tijdens de technische implementatie van de Woo-harvester. Mede op basis van deze referentietrajecten is er een interne uitvoeringstoets gedaan op de techniek en de uitvoerbaarheid van het werken met de Woo-index voor wat betreft de door de minister in stand gehouden digitale infrastructuur. Uit deze uitvoeringstoets is gebleken dat vanuit technisch oogpunt de Woo-index met zoekfunctie gereed is en dat bestuursorganen hierop gefaseerd kunnen aansluiten. 

Veelgestelde vragen

Alle veelgestelde vragen staan bij elkaar op één pagina veelgestelde vragen.

Ondersteuning

Gebruik de pagina veelgestelde vragen en  zoekfunctie van de website om een antwoord op uw vraag te vinden. Al uw functionele en technische vragen over het aansluiten op de generieke Woo-voorziening kunt u stellen via woo@koop.overheid.nl. KOOP verzorgt ook diverse online informatiebijeenkomsten en invulsessies over de Woo-index en de technische aanlevermethoden. Kijk hiervoor op de bijeenkomsten pagina