[:en]The Crowd-Sourced Intelligence Agency (CSIA) is a creative research project that takes the form of an online application that partially replicates an Open Source Intelligence (OSINT) system, including an interface that allows the viewer to experience how intelligence agents view social media posts and two machine-learning classifiers for predictive policing. The CSIA was created using technical manuals, research reports, academic papers, leaked documents, and Freedom of Information Act files. The goal of the CSIA is to expose potential problems, assumptions, or oversights inherent in current dataveillance processes in order to help people understand both the effectiveness of OSINT processing and its impact on our privacy.
http://www.crowdsourcedintel.org
[:nl]Het Crowd-Sourced Intelligence Agency (CSIA) is een creatief onderzoeksproject in de vorm van een online app, deels een Open Source Intelligence (OSINT) system, met daarin een interface waarmee de gebruiker kan ervaren hoe intelligence agents kijken naar social media posts en predictive policing. CSIA is gemaakt met technische handleidingen, onderzoeksraporten, wetenschappelijker papers, gelekte documenten en WOB verzoeken aka FOIA requests. Doel is om potentiele problemen, aannames of overzicht in het huidige dataveillance proces te krijgen om mensen te helpen inzicht te krijgen in de effectiviteit en de impact op onze privacy.
Tegenwoordig weten we dat onze sociale media berichten worden gelezen door inlichtingendiensten. We zeggen soms dat het niet uitmaakt, dat we niets te verbergen hebben. Maar we weten niet ècht waar ze naar op zoek zijn. Hoe is het om een medewerker van een inlichtingendienst te zijn en te kijken naar wat mensen posten? Hoe weet je wat iemand echt bedoelt als je ze niet kent, en als diegene maar 140 karakters heeft om zijn boodschap te vertellen? Het gedeelte dat dat wij weten komt uit gelekte bestanden, technische handleidingen en documenten vrijgekomen via WOB-verzoeken (Wet Openbaarheid van Bestuur). En soms als het systeem een fout maakt, komt er een verhaal in de media.
Net als de twee Britse studenten die de toegang werd geweigerd tot de Verenigde Staten, omdat ze zeiden ‘Amerika te vernietigen’ en Marilyn Monroe op te graven. Natuurlijk maakten ze een grapje. Of de rechtzaak van de Boston Bomber, waar er sprake was van voldoende fysiek bewijs was dat Tsarnaev verbond met de misdaad. Maar de social media-bewijzen die de FBI presenteerde tastten de zaak aan. Songteksten en grappen werden gepresenteerd als bedreigingen, en de FBI interpreteerde een foto van een moskee in Grozny als zijnde Mekka. Ze hebben zelfs geen moeite genomen om naar een foto van Mekka te kijken.
Computers die machine-learning algoritmen uitvoeren, kunnen dit proces automatiseren, en labelen tienduizenden berichten per seconde. Maar als bij het leren van zo’n algoritme, fouten in de gegevens worden gebruikt, dan worden deze fouten gewoon gerepliceerd. Hoe beïnvloedt de presentatie van data hoe een intelligence-analist het interpreteert? Hoe verandert de metadata wat een intelligence analist denkt, wanneer ze een social media post zien? Hoe is het om aan de andere kant van het scherm te zijn? Misschien is er nu een manier om er achter te komen, wat intelligence analisten denken bij het lezen van onze berichten.
http://www.crowdsourcedintel.org
[:]