Trekken Steekproef Ondernemingen

Op deze pagina vind u informatie over het algoritme ‘Steekproef Ondernemingen’. Dit algoritme bakent de onderzoekspopulatie MKB af en selecteert hieruit aselect 3.600 entiteiten die in aanmerking komen voor een boekenonderzoek door middel van een gestratificeerde steekproef.

Laatst gewijzigd op 4 september 2025 om 18:43 | Publicatiestandaard 1.0
Publicatiecategorie
Impactvolle algoritmes
Impacttoetsen
Veld niet ingevuld.
Status
In gebruik

Algemene informatie

Thema

Overheidsfinanciën

Begindatum

Veld niet ingevuld.

Contactgegevens

algoritmeregister@belastingdienst.nl

Link naar publiekspagina

https://over-ons.belastingdienst.nl/onderwerpen/omgaan-met-gegevens/algoritmeregister/

Link naar bronregistratie

https://over-ons.belastingdienst.nl/onderwerpen/omgaan-met-gegevens/algoritmeregister/trekken-steekproef-ondernemingen-so/

Verantwoord gebruik

Doel en impact

Het primaire doel van dit werkproces is de inzet van het instrument steekproeven om inzicht te verkrijgen in de juistheid en volledigheid van aangiften. En dat op statistisch verantwoorde wijze. De uitkomst van dit werkproces vormt mede de input voor de processen die leiden tot het jaarplan van de Belastingdienst en de jaarplannen van de Uitvoeringsdirecties.

De steekproef ondernemingen geeft uitvoering aan het Beleidskader Steekproeven en wordt tweejaarlijks uitgevoerd.

De reden voor het gebruik van een algoritme in SAS Enterprise Guide (in plaats van handmatig) zijn:

  • Efficiëntie: Voor de afbakening van de populatie worden grote datasets verwerkt.
  • Nauwkeurigheid: Het algoritme voorkomt menselijke fouten bij het selecteren van eenheden.
  • Reproduceerbaarheid: De steekproef kan exact worden herhaald met dezelfde instellingen.
  • Transparantie: De gebruikte methode is duidelijk gedocumenteerd en controleerbaar.

Dit algoritme bakent de onderzoekspopulatie MKB af en trekt hieruit een aselecte gestratificeerde steekproef van 3600 entiteiten. Deze entiteiten krijgen allemaal een boekenonderzoek. De controle-opdracht is voor alle entiteiten is hetzelfde.

Het doel van het algoritme is het willekeurig en zonder specifieke aanleiding selecteren van 3600 entiteiten uit de MKB-populatie voor een boekenonderzoek.

Afwegingen

De steekproef is belangrijk om het jaarplan van de Belastingdienst te kunnen bepalen. Het algoritme maakt het uitvoeren van de steekproef mogelijk.

Het algoritme bepaalt systematisch en nauwkeurig de onderzoekspopulatie. De selectie die het algoritme maakt is gedocumenteerd en controleerbaar.

Het alternatief is dat een medewerker handmatig de onderzoekspopulatie bepaalt en aselect entiteiten selecteert. Hiervoor zouden alle entiteiten bekeken moeten worden. Dit is niet efficiënt en foutgevoelig

Menselijke tussenkomst

Menselijke tussenkomst in de context van de Belastingdienst houdt in dat een bevoegde en deskundige medewerker een wezenlijke rol speelt in de besluitvorming.

Combinatie van menselijke tussenkomst en beslissingen door het algoritme.

Bij de werking van het algoritme is sprake van menselijke tussenkomst, maar er worden ook beslissingen genomen door het algoritme.

Het deel van het algoritme dat de MKB-populatie afbakent, wordt gecontroleerd gedraaid. Dat wil zeggen dat bij elke stap wordt gecontroleerd of de uitkomst aan de verwachting voldoet.

De uiteindelijke uitvoering is het aselect trekken van een steekproef deze wordt uitgevoerd door het algoritme.

Bij het opvoeren van de controleopdrachten na de steekproef in het systeem, wordt door een medewerker nog allerlei handmatige checks in de relevante systemen gedaan. Deze medewerker maakt uiteindelijk de keuze of het boekenonderzoek uitgevoerd kan worden.

Risicobeheer

  • Privacy en AVG

Het gebruik van de gegevens dient te worden getoetst aan de Algemene Verordening Gegevensbescherming (AVG). Door het toetsen van persoonsgegevens komen eventuele privacyrisico's in beeld en kunnen passende maatregelen genomen worden.

De AVG schrijft voor dat er niet meer gegevens gebruikt mogen worden dan noodzakelijk is. Dat heet dataminimalisatie. De Belastingdienst onderzoekt regelmatig of de gebruikte gegevens nog nodig zijn en dus gebruikt mogen worden.

  • Gebruik bijzondere persoonsgegevens

Er worden in dit algoritme geen bijzondere persoonsgegevens verwerkt.

  • Gelijkheid en non-discriminatie

Het algoritme wordt beoordeeld in lijn met toepasselijke non-discriminatiebeginselen voor directe en indirecte discriminatie. Door zo min mogelijk persoonsgegevens te verwerken, wordt het risico op directe discriminatie verkleind. Medewerkers die betrokken zijn bij de ontwikkeling en het beheer van de algoritmen krijgen training over gegevensbescherming en vooroordelen.

  • Waarborgen

De Algemene wet bestuursrecht (Awb) vereist dat het handelen van de overheid transparant en rechtmatig is. De Belastingdienst neemt bij de toepassing en ontwikkeling van algoritmen de algemene beginselen van behoorlijk bestuur in acht.

In het algoritme worden gegevens gebruikt die zijn verzameld in het kader van verschillende belastingwetten. Zoals de AVG voorschrijft worden er niet meer gegevens gebruikt dan noodzakelijk is.

Wettelijke basis

  1. Algemene wet inzake rijksbelastingen: 
  2. Algemene wet bestuursrecht: 
  3. Algemene verordening gegevensbescherming: 
  4. Uitvoeringswet algemene verordening gegevensbescherming: 
  5. Wet op de Loonbelasting 1964:
  6. Wet Inkomstenbelasting 2001:
  7. Wet op de Vennootschapsbelasting 1969: 
  8. Wet op de Omzetbelasting 1968: 
  9. Wet algemene bepalingen Burgerservicenummer:
  10. Archiefwet 1995: 

Links naar wettelijke basis

  • Algemene wet inzake rijksbelastingen: : https://wetten.overheid.nl/BWBR0002320/
  • Algemene wet bestuursrecht: : https://wetten.overheid.nl/BWBR0005537/
  • Algemene verordening gegevensbescherming: : https://eur-lex.europa.eu/legal-content/NL/TXT/HTML/?uri=CELEX:32016R0679
  • Uitvoeringswet algemene verordening gegevensbescherming: : https://wetten.overheid.nl/BWBR0040940/
  • Wet op de Loonbelasting 1964:: https://wetten.overheid.nl/BWBR0002471/
  • Wet Inkomstenbelasting 2001:: https://wetten.overheid.nl/BWBR0011353/
  • Wet op de Vennootschapsbelasting 1969: : https://wetten.overheid.nl/BWBR0002672/
  • Wet op de Omzetbelasting 1968: : https://wetten.overheid.nl/BWBR0002629/
  • Wet algemene bepalingen Burgerservicenummer:: https://wetten.overheid.nl/BWBR0022428/
  • Archiefwet 1995: : https://wetten.overheid.nl/BWBR0007376/

Werking

Gegevens

  1. Persoons- en entiteitgegevens belastingplichtige
  2. Aangiftegegevens IH voor bepalen belastingplicht IH en indicatie winstaangifte
  3. Omzetgegevens voor bepalen belastingplicht OB en fiscaal belang OB
  4. Loongegevens voor bepalen belastingplicht LH en fiscaal belang LH
  5. Resultaten boekenonderzoeken
  6. Indicatie HT
  7. Indicatie ANBI

Links naar gegevensbronnen

  • Persoons- en entiteitgegevens belastingplichtige: Basisregistratie Personen (BRP), Belastingdienst
  • Aangiftegegevens IH voor bepalen belastingplicht IH en indicatie winstaangifte: Belastingdienst
  • Omzetgegevens voor bepalen belastingplicht OB en fiscaal belang OB: Belastingdienst
  • Loongegevens voor bepalen belastingplicht LH en fiscaal belang LH: UWV
  • Resultaten boekenonderzoeken: Belastingdienst
  • Indicatie HT: Belastingdienst
  • Indicatie ANBI: Data.overheid.nl

Technische werking

Het algoritme bestaat uit selectieregels die inhoudsdeskundigen hebben opgesteld op basis van expertise.

Hiermee wordt de onderzoekspopulatie MKB vastgesteld. Hieruit worden willekeurig en zonder specifieke aanleiding 3600 entiteiten geselecteerd die in aanmerking komen voor een boekenonderzoek door middel van een gestratificeerde steekproef.

De onderzoekspopulatie gaat om alle MKB-entiteiten met relevante belastingplicht (combinatie van IH/VPB/OB,LH) en een actieve onderneming. De MKB-populatie is scheef verdeeld. De MKB-populatie varieert van kleine 1-persoons-ondernemingen tot grote werkgevers (tot 500 werknemers). De groep kleine 1-persoons-ondernemingen is veruit het grootst. Om te waarborgen dat in de steekproef voldoende diversiteit aan ondernemingen aanwezig is, wordt de steekproef gestratificeerd getrokken. Op basis van leeftijd van de entiteit, werkgeverschap, hoogte omzet, hoogte fiscaal belang LH en VPB-belastingplicht wordt een verdeling gemaakt in 7 strata. Binnen elk stratum wordt een aselecte steekproef getrokken. De geselecteerde entiteiten krijgen allemaal een boekenonderzoek. De controle-opdracht voor al deze entiteiten is hetzelfde.

Het algoritme is niet zelflerend. Dat betekent dat het algoritme zichzelf niet ontwikkelt tijdens het gebruik ervan.

Leverancier

Het algoritme is door medewerkers van bij de Belastingdienst ontwikkeld en wordt ook intern onderhouden. 

Soortgelijke algoritmebeschrijvingen

  • Op deze pagina vindt u informatie over het algoritme dat boekenonderzoeken voor duaal studenten selecteert. Dit algoritme selecteert uit de ondernemerspopulatie van MKB-entiteiten die aan bepaalde criteria voldoen.

    Laatst gewijzigd op 4 september 2025 om 18:40 | Publicatiestandaard 1.0
    Publicatiecategorie
    Impactvolle algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Dit algoritme neemt een statistische steekproef uit een bepaalde populatie. Het algoritme ondersteunt het trekken van een statistische steekproef en vastleggen van de stappen daarvan.

    Laatst gewijzigd op 23 september 2025 om 13:30 | Publicatiestandaard 1.0
    Publicatiecategorie
    Impactvolle algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Het algoritme berekent de onderwijsresultaten van scholen (cluster, vestiging, opleiding). Het algoritme levert informatie op die een inspecteur helpt om te beoordelen of een school met deze leerlingen de wettelijke ondergrens voor te behalen leerresultaten behaalt.

    Laatst gewijzigd op 9 oktober 2024 om 7:35 | Publicatiestandaard 1.0
    Publicatiecategorie
    Impactvolle algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik
  • Dit algoritme gebruiken wij ter ondersteuning bij het beslissen op uitkeringsaanvragen, het registreren van de uitkomsten en het produceren van documenten.

    Laatst gewijzigd op 25 juni 2024 om 14:35 | Publicatiestandaard 1.0
    Publicatiecategorie
    Impactvolle algoritmes
    Impacttoetsen
    DPIA
    Status
    In gebruik
  • Het algoritme Speur- en Ontwikkelingswerk helpt medewerkers van de Belastingdienst te reageren op mogelijk onjuiste loonaangiften. 

    Laatst gewijzigd op 22 april 2025 om 15:11 | Publicatiestandaard 1.0
    Publicatiecategorie
    Impactvolle algoritmes
    Impacttoetsen
    Veld niet ingevuld.
    Status
    In gebruik