Meldingen openbare ruimte

Algoritmen > Meldingen openbare ruimte
Stadsbeheer

Overzicht

Meldingen openbare ruimte

Tags

MeldingenKlachtenNatural language processing

Als er op straat of in een park iets gemaakt of opgeruimd moet worden, dan kan dat bij de gemeente worden gemeld via SIA, het online meldingensysteem. Ook een gevaarlijke verkeerssituatie of overlast van personen en horeca kan gemeld worden.

Voorheen moesten mensen zelf kiezen bij welke categorie hun melding het beste paste (bijvoorbeeld ‘overlast’ of ‘straatmeubilair’), zodat de melding bij de juiste afdeling van de gemeente terecht kwam. Maar de gemeente is een complexe organisatie en de lijst met categorieën is lang. Daardoor koos men niet altijd de juiste categorie. Dat zorgde soms voor vertraging in de afhandeling van meldingen.

Daarom gebruiken we nu een algoritme dat woorden herkent, bijvoorbeeld ‘afval’ en ‘stoep’. Op basis daarvan wordt bepaald bij welke categorie de melding het best past en welke afdeling de melding moet afhandelen.

De melder hoeft dus geen categorie meer te kiezen, en de melding wordt sneller afgehandeld omdat hij bij de juiste afdeling terecht komt.


Link naar beschreven dienst

Contactgegevens


  • Afdeling of team

  • Onderzoek, Informatie & Statistiek (OIS)
  • Contactpersoon voor vragen

  • Adviseur Onderzoek en ontwikkeling
  • Leverancier

  • Ontwikkeld in eigen beheer
  • E-mail

  • CIO-office@amsterdam.nl
  • Telefoonnummer

  • 14020


Gedetailleerde informatie over het systeem

U kunt hier zien welke gegevens (data) het algoritme gebruikt, welke programmeerregels het volgt en welke waarborgen er zijn die ervoor zorgen dat het algoritme verantwoord te werk gaat.


DataToon meerToon minder

Overzicht van de belangrijkste datasets die gebruikt zijn in de ontwikkeling en de toepassing van het algoritme. De verschillende datasets worden onderscheiden door subkoppen.

Meldingen

De dataset bestaat uit meldingen die eerder gedaan zijn (vrij tekstveld). In eerste instantie hebben we 300.000 meldingen uit de afgelopen jaren gebruikt om het algoritme te trainen. Regelmatig wordt het bijgetraind met nieuwe meldingen en uitgevoerde correcties op bestaande meldingen. Als het Actie Service Centrum of afdelingen een verkeerde categorisering zien, (zie Menselijk toezicht) corrigeren zij dit handmatig in het meldingensysteem. Deze correcties worden gebruikt bij het bijtrainen. We onderzoeken of het bijtrainen van het algoritme in de toekomst geautomatiseerd kan.

Deze dataset kunnen we in dit register niet openbaar maken. Omdat de data uit een vrij tekstveld komen, kunnen daar persoonsgevegevens in staan, hoewel daar expliciet niet om wordt gevraagd.

Emailadres en telefoonnummer voor vervolgvragen

Iemand die een melding doet, kan zijn of haar telefoonnummer en/of emailadres achterlaten als hij of zij dat wil. We houden de melder dan op de hoogte van de voortgang en we hebben de mogelijkheid om hem of haar terug te bellen. Deze informatie wordt niet langer bewaard dan voor dit doel nodig is en wordt dus niet door het algoritme gebruikt.

Voor overige informatie over verwerking van persoonsgegevens, zie: https://www.amsterdam.nl/privacy/specifieke/privacyverklaringen-wonen/meldingen-overlast-privacy

DataverwerkingToon meerToon minder

Hoe gebruikt het systeem de data?

Architectuur van het model

De tekst van de melding wordt opgedeeld in losse woorden. Van elk woord uit een melding wordt geanalyseerd hoe uniek het is voor die melding, afgezet tegen de de totale collectie woorden (‘TF-IDF’ of ‘term frequency-inverse document frequency’). Een woord als ‘de’ of ‘bedankt’ krijgt daardoor een laag gewicht en een woord als ‘vuilnis’ krijgt een hoger gewicht.

Van die combinatie van woorden wordt vervolgens met logistische regressie (een machine-learning-techniek) bepaald bij welke categorie de melding hoort en daarmee bij welke afdeling binnen de gemeente de melding het meest waarschijnlijk past.

Link naar broncode


Content

Architectuur van het model

Prestatie

Dit algoritme kan zeer nauwkeurig detecteren in welke categorie een combinatie van woorden hoort; het algoritme heeft een score van 0,88 (macrogewogen F1-score). Andere methodes zijn ook uitgeprobeerd (W2V, CNN+LSTM, BERT) maar bleken minder goed te presteren. Meer informatie: https://medium.com/maarten-sukel/how-to-use-machine-learning-for-the-classification-of-citizen-service-requests-b71159a85f36

Tegengaan van discriminatieToon meerToon minder

Hoe bevordert het algoritme gelijke behandeling of gaat het ongelijke behandeling tegen?

Het algoritme werkt op basis van taal. Als iemand geen Nederlandse woorden gebruikt, herkent het algoritme die woorden mogelijk niet. In dat geval zal het Actie Service Centrum de melding beoordelen en bekijken we of het algoritme bijgetraind moet worden.

Menselijk toezichtToon meerToon minder

In hoeverre houden mensen toezicht houden op het op de werking van het algoritme?

Alle meldingen die met minder dan 40% zekerheid bij een bepaalde categorie ingedeeld worden, worden doorgestuurd naar het Actie Service Centrum. Vervolgens vindt een menselijke beoordeling plaats en wordt de melding alsnog gecategoriseerd. Ook de meldingen die onterecht doorgestuurd worden naar een verkeerde categorie, worden door de verantwoordelijke afdeling (soms via het Actie Service Centrum) handmatig in de juiste categorie geplaatst.

Risico’s en waarborgenToon meerToon minder

Welke risico’s heeft het gebruik van het algoritme en wat doet de gemeente om deze risico’s te ondervangen?

Er zitten weinig risico’s aan dit algoritme. Het plaatst een melding in de juiste categorie en zorgt dat het sneller bij de juiste afdeling onder de aandacht is. Als het algoritme een melding niet met voldoende zekerheid in welke categorie kan plaatsen, komt hij in de categorie ‘Overig’ terecht. Medewekers van het Actie Service Centrum bekijken die meldingen en zetten ze handmatig in de juiste categorie. Als het algoritme niet naar behoren werkt, duurt het dus iets langer voordat de melding bij de juiste afdeling is. De melder kan persoonsgegevens toevoegen als hij of zij op de hoogte gehouden wil worden. Deze gegevens worden beveiligd opgeslagen en niet door het algoritme gebruikt.

Vond u deze informatie nuttig?