Achtergrondinformatie Methode Inventarisatie-technische aspecten kartering 2012 Clustering
Clustering
Hier worden territoria van vogels gepresenteerd als stippen. Wat zegt zo'n stip nu precies?
Dat daar in de buurt waarschijnlijk gebroed is, meer niet. Onder een voorbeeld met de gegevensadministratie links en de presentatie van de territoria rechts, het betreft de Rietgors in telgebied 12.
strikte minimum interpretatie strikte minimum interpretatie































De stippen zijn gebaseerd op waarnemingen, die zijn geclusterd tot territoria. Hier is de stip steeds "ongeveer" in het midden van het territorium geplaatst.

Bij de clustering zijn de richtlijnen van Sovon nagevolgd. Voorzover deze richtlijnen mogelijkheden bieden tot rekkelijkheid: de hier gepresenteerde data zijn gebaseerd op een strikte minimum interpretatie.
Onder wordt aan de hand van enkele voorbeelden een inkijk gegeven.

Uitgangspunt bij de clustering is: hoe kunnen zo min mogelijk clusters gemaakt.
Onder twee voorbeelden, het betreft de kaart van Grasmus in telgebied 12.
strikte minimum interpretatie strikte minimum interpretatie






























In bovenstaande voorbeelden zijn twee interpretaties weergegeven: een gevoelsmatige interpretatie en een minimum-interpretatie.
Eerst een toelichting bij de administratie, deze is zo eenvoudig mogelijk. Een letter codeert de bezoekdatum, met verschillende kleuren per bezoek om het visueel clusteren te vergemakkelijken. Met een cijfer wordt het waargenomen gedrag weergegeven: 1=paar, 2= territoriaal, 3=broedindicatief, 4=nest, 6=pas uitgevlogen jong.
Het is natuurlijk goed mogelijk dat tijdens de bezoeken maar drie van de vier territoriumhouders hebben gezongen en dat de waarnemer de indeling in goudkleurige clusters het meest realistisch acht. Dit valt echter nooit objectief te beoordelen en laat ruimte voor interpretatieverschillen.
Er kan, gegeven de afgesproken soortspecifieke maximale diameter van een territorium, maar één minimum-clustering gemaakt (clusters in potlood), die weinig van menselijk inzicht afhangt.
Daarom is altijd bij alle soorten in alle telgebieden een minimum nagestreefd, hoewel dit soms tot onderschatting zal leiden.

De soortspecifieke fusieafstanden, die de maximale grootte van een territorium in marginaal habitat bepalen, zijn streng nagevolgd. Hierbij is wel rekening gehouden met enige onnauwkeurigheid in de locaties van de registraties.
De datumgrenzen zijn strikt nagevolgd. Aangezien seizoen 2012 relatief laat was door een koude april maand, waren er weinig pijnlijke momenten bij de interpretatie, want van veel zomergasten kwamen de meeste vogels pas na de datumgrens binnen. Daarnaast is in de planning van de bezoekdata rekening gehouden met de datumgrenzen: bezoeken zijn op en vlak na belangrijke datumgrenzen gebracht.
Het aandeel zingende doortrekkers van een soort is in de duinregio per soort verschillend: bij Grasmus waren het er weinig, bij Nachtegaal veel.
Onder een voorbeeld van Nachtegaal in een deel van telgebied 10.
strikte minimum interpretatie

De datumgrens van Nachtegaal is tegenwoordig 5 mei, de lichtgroene C2-waarnemingen zijn van 3 mei en deze zijn niet meegeteld. De blauwe D2's zijn van 15 mei, de X2's zijn van 16 mei en zijn vanuit het buurgebied opgetekend.
Deze X2's en D2's komen goed overeen, reden om aan te nemen dat er op 3 mei nog doortrekkers waren.

In handleidingen is ruim voldoende aandacht voor clustering van soorten in een gebied,
maar wat als een grote regio is opgedeeld in aparte telgebieden?

Onder een voorbeeld van twee grenzende telgebieden, opnieuw met de waarnemingen van Grasmus.
De waarnemingen van het oostelijke gebied zijn aan de kaart van het westelijke gebied toegevoegd, de waarnemingen met rode X stammen van de blauwe D's van het buurgebied. De gemeenschappelijke territoria zijn daarna aan de rand van het oostelijk gebied verwijderd. strikte minimum interpretatie strikte minimum interpretatie






























Merk op dat bij apart verwerken van de telgebieden met een autoclusterprogramma er territoria dubbel geteld worden langs de rand van bovenstaand voorbeeld.

Onder nog een voorbeeld, zelfde rand, maar nu Graspieper.
In dit voorbeeld is maar één territorium gemeenschappelijk.
strikte minimum interpretatie strikte minimum interpretatie






























Laatste voorbeeld van deze gebieden, iets noordelijker, nu Staartmees.
In dit voorbeeld is wederom één territorium gemeenschappelijk. Zonder info van het noordoostelijke buurgebied zou de groene D een cluster worden in het zuidwestelijk gebied. Na het 'randen', de integratie van de info van beide gebieden, vervalt dat cluster: de groene D wordt samengevoegd met de rode A1 van het noordoostelijk gebied.
strikte minimum interpretatie strikte minimum interpretatie































Bij soorten met vrij grote of grote territoria wordt de kans op telgebiedgrensoverschrijdende territoria aanmerkelijk, helemaal als eenmalige waarnemingen bij de soort tellen als voldoende voor een territorium. Onder een voorbeeld van zo'n soort, de Staartmees in telgebied 2, met totaal vijf territoria die geheel binnen het telgebied liggen en maar liefst negen grensoverschrijdende territoria. Merk hierbij op dat elk grensoverschrijdend territorium in beide gebieden mag tellen, zelfs moet tellen als per gebied gekeken wordt. Het bovenste kaartje is van het noordelijk buurgebied dan, volgt het telgebied 2 en het aangrenzende telgebied 3 en daarna het zuidwestelijk gelegen telgebied 6
strikte minimum interpretatie

strikte minimum interpretatie strikte minimum interpretatie






























strikte minimum interpretatie



Als alleen een afhandeling per telgebied plaats vindt (zonder controle van de randen) dan zal dat tot een forse dubbeltelling leiden, een probleem van autoclusterprogramma's die per telgebied clusteren. In het voorbeeld zou die overtelling fors zijn, van vijf plus negen (n=14) naar vijf plus tweemaal negen (n=23).
Het "randen" is dus een absolute "must" en omdat autoclusterers daarin niet voorzien is handmatig geclusterd (door Bart Veenstra). Verder kon Sovon's autoclusterer niet gebruikt worden in verband met een onduidelijke ondergrond in open duin, zonder hoogtelijnen zijn waarnemingen in open duin niet te plaatsen.
Tot slot nog enkele argumenten tegen invoer van autoclusterer bij grootschalige karteringen.
Een karteerder behoort jaarlijks te clusteren om scherp te blijven in het veld in het volgende seizoen:
wie datumgrenzen en fusieafstanden niet kent, wie zich de lastig te interpreteren kaarten van vorig jaar niet herinnert, die loopt passief waar te nemen, in plaats van actief te karteren.
Daarom moeten we autoclusterer niet verheffen tot de standaard voor grootschalige karteringen. Voor handmatig clusteren bestaat al een goede standaard, die, wanneer ze goed wordt nagevolgd, weinig ruimte laat voor persoonlijke verschillen in manier van clustering. Er zit zoveel meer ruis in het resultaat van karteringen (weersomstandigheden, minuten per hectare, waarnemerskwaliteit), daarbij vergeleken kan autoclusterer weinig tot niets aan de kwaliteit van gegevens toevoegen.