Meldingen openbare ruimte

Stadsbeheer

Overzicht

Contactgegevens

Afdeling
Onderzoek, Informatie & Statistiek (OIS)
Contact team voor vragen
Adviseur Onderzoek en ontwikkeling
Externe leveranciers
Ontwikkeld in eigen beheer

Contact e-mail
algoritmen@amsterdam.nl
Contact telefoon
14020

Gedetailleerde informatie over het systeem

Hier kunt u kennismaken met de door het systeem gebruikte informatie, de werkingslogica en het bestuur ervan op de gebieden die u interesseren.

Datasets Toon Meer Toon Minder

Belangrijke gegevensbronnen die worden gebruikt bij de ontwikkeling en het gebruik van het systeem, hun inhoud en gebruiksmethoden. De verschillende gegevensbronnen worden gescheiden door subkoppen.

Naam

Meldingen

Datasetbeschrijving

De dataset bestaat uit meldingen die eerder gedaan zijn (vrij tekstveld). In eerste instantie hebben we 300.000 meldingen uit de afgelopen jaren gebruikt om het algoritme te trainen. Regelmatig wordt het bijgetraind met nieuwe meldingen en uitgevoerde correcties op bestaande meldingen. Als het Actie Service Centrum of afdelingen een verkeerde categorisering zien, (zie Menselijk toezicht) corrigeren zij dit handmatig in het meldingensysteem. Deze correcties worden gebruikt bij het bijtrainen. We onderzoeken of het bijtrainen van het algoritme in de toekomst geautomatiseerd kan.

Deze dataset kunnen we in dit register niet openbaar maken. Omdat de data uit een vrij tekstveld komen, kunnen daar persoonsgevegevens in staan, hoewel daar expliciet niet om wordt gevraagd.

Persoonlijke gegevens

Geen persoonlijke gegevens

Naam

Emailadres en telefoonnummer voor vervolgvragen

Datasetbeschrijving

Iemand die een melding doet, kan zijn of haar telefoonnummer en/of emailadres achterlaten als hij of zij dat wil. We houden de melder dan op de hoogte van de voortgang en we hebben de mogelijkheid om hem of haar terug te bellen. Deze informatie wordt niet langer bewaard dan voor dit doel nodig is en wordt dus niet door het algoritme gebruikt.

Voor overige informatie over verwerking van persoonsgegevens, zie: https://www.amsterdam.nl/privacy/specifieke/privacyverklaringen-wonen/meldingen-overlast-privacy

Persoonlijke gegevens

Geïdentificeerd

Uitlegbaarheid Toon Meer Toon Minder

Model explainability

Beschikbaar

Outcome explainability

Beschikbaar

Human oversight Toon Meer Toon Minder

Menselijk toezicht tijdens het gebruik van de dienst.

Alle meldingen die met minder dan 40% zekerheid bij een bepaalde categorie ingedeeld worden, worden doorgestuurd naar het Actie Service Centrum. Vervolgens vindt een menselijke beoordeling plaats en wordt de melding alsnog gecategoriseerd. Ook de meldingen die onterecht doorgestuurd worden naar een verkeerde categorie, worden door de verantwoordelijke afdeling (soms via het Actie Service Centrum) handmatig in de juiste categorie geplaatst.

Gegevensverwerking Toon Meer Toon Minder

De operationele logica van de automatische gegevensverwerking en redenering uitgevoerd door het systeem en de gebruikte modellen.

Beschrijving van de systeemarchitectuur

De tekst van de melding wordt opgedeeld in losse woorden. Van elk woord uit een melding wordt geanalyseerd hoe uniek het is voor die melding, afgezet tegen de de totale collectie woorden (‘TF-IDF’ of ‘term frequency-inverse document frequency’). Een woord als ‘de’ of ‘bedankt’ krijgt daardoor een laag gewicht en een woord als ‘vuilnis’ krijgt een hoger gewicht.

Van die combinatie van woorden wordt vervolgens met logistische regressie (een machine-learning-techniek) bepaald bij welke categorie de melding hoort en daarmee bij welke afdeling binnen de gemeente de melding het meest waarschijnlijk past.

Afbeelding van systeemarchitectuur

meldingen-openbare-ruimte.png

Opslagplaats voor uitkomstgegevens

http://ec2-54-171-141-211.eu-west-1.compute.amazonaws.com/

Prestatie

Dit algoritme kan zeer nauwkeurig detecteren in welke categorie een combinatie van woorden hoort; het algoritme heeft een score van 0,88 (macrogewogen F1-score). Andere methodes zijn ook uitgeprobeerd (W2V, CNN+LSTM, BERT) maar bleken minder goed te presteren. Meer informatie: https://medium.com/maarten-sukel/how-to-use-machine-learning-for-the-classification-of-citizen-service-requests-b71159a85f36

Broncode-opslagplaats

https://github.com/maartensukel/example-textual-classification-citizen-reports

Non-discriminatie Toon Meer Toon Minder

Promotie en realisatie van gelijkheid in het gebruik van de dienst.

Het algoritme werkt op basis van taal. Als iemand geen Nederlandse woorden gebruikt, herkent het algoritme die woorden mogelijk niet. In dat geval zal het Actie Service Centrum de melding beoordelen en bekijken we of het algoritme bijgetraind moet worden.

Referenties Toon Meer Toon Minder

Rechtsgrondslag beschrijving

https://www.rijksoverheid.nl/onderwerpen/gemeenten/taken-gemeente

Live service adres

https://meldingen.amsterdam.nl/incident/beschrijf

Adres privacybeleid

https://www.amsterdam.nl/privacy/specifieke/privacyverklaringen-wonen/meldingen-overlast-privacy

Risicobeheer Toon Meer Toon Minder

Risico's in verband met het systeem en het gebruik ervan en de beheersmethoden.

Er zitten weinig risico’s aan dit algoritme. Het plaatst een melding in de juiste categorie en zorgt dat het sneller bij de juiste afdeling onder de aandacht is. Als het algoritme een melding niet met voldoende zekerheid in een categorie kan plaatsen, komt hij in de categorie ‘Overig’ terecht. Medewerkers van het Actie Service Centrum bekijken die meldingen en zetten ze handmatig in de juiste categorie. Als het algoritme niet naar behoren werkt, duurt het dus iets langer voordat de melding bij de juiste afdeling is. De melder kan persoonsgegevens toevoegen als hij of zij op de hoogte gehouden wil worden. Deze gegevens worden beveiligd opgeslagen en niet door het algoritme gebruikt.

Risico-naam

Persoonsgegevens (per ongeluk)

Risicobeschrijving

De melder doet zijn melding in een vrij tekstveld, dus is er een kans dat hij zijn naam of andere persoonsgegevens invult.

Frequentie

Laag

Beschrijving van risicobeperking

Boven het tekstveld staat de waarschuwing “Typ geen persoonsgegevens in deze omschrijving, dit wordt apart gevraagd”.

Waarschijnlijkheid

Laag

Schaal

Laag

Ernst

Hoog

Risico-type

Privacy loss

Risico-naam

Persoonsgegevens (vrijwillig)

Risicobeschrijving

Er worden persoonsgegevens geregistreerd (telefoonnummer en emailadres) indien de melder daar zelf voor kiest

Frequentie

Laag

Beschrijving van risicobeperking

De gegevens worden beveiligd opgeslagen volgens de Baseline Informatiebeveiliging Overheid (BIO) standaard

Waarschijnlijkheid

Laag

Schaal

Matig

Ernst

Hoog

Risico-type

Privacy loss

Vond u deze informatie nuttig?

Stadsbeheer

Overzicht