Mark van der Heijden
Lees niet verder wanneer je ongedwongen het tv-programma Wie is de Mol? wil blijven kijken. Haico Dorenbos, masterstudent Computer Science aan de Universiteit Twente, heeft een ‘Moldel‘ gebouwd, een algoritme dat op basis van de uitzendingen kan voorspellen wie de Mol is: Marije (50%) of Splinter (40%).
Dorenbos ontwikkelde het algoritme uit frustratie, omdat hij en zijn broer enkele seizoenen terug ieder de verkeerde Mol kozen. ‘Ik vroeg me toen af of een algoritme de uitkomst zou kunnen bepalen. Ik kwam er al vrij snel achter dat dat goed kan. Ik bouwde het Moldel, testte dat op de twintig eerdere seizoenen, en ontwikkelde het steeds verder. Het systeem wordt steeds betrouwbaarder. In de eerdere seizoenen bleek dat het model na aflevering zes, waar we nu ook zijn, de Mol meestal al kon voorspellen.’
Het Moldel maakt gebruik van vijf lagen die samen het hele bouwwerk vormen. Meer info over het systeem is te vinden op de Github-pagina van Haico.
• De Exam Drop layer kijkt hoe afvallers hun zichtbare vragen beantwoorden. Deze layer probeert te voorspellen hoe groot de kans is dat de kandidaten deze vragen goed hebben beantwoord. Eerdere afvallers hebben vaak een grotere kans dan latere afvallers om hun vraag fout te beantwoorden, en vraag 20 ‘Wie is de Mol?’ wordt bijvoorbeeld vaker fout beantwoord dan vraag 1 ‘Is de Mol een man of een vrouw?’.⠀⠀
• De Exam Pass layer probeert aan de hand van hoeveel jokers/vrijstellingen gebruikt worden, te voorspellen wie de mol is. Als iemand de finale bereikt zonder veel jokers/vrijstellingen te gebruiken, is het waarschijnlijker dat die speler de mol is dan spelers die de finale bereiken door veel jokers/vrijstellingen te gebruiken.⠀⠀
• De Wikipedia layer kijkt naar de Wikipediapagina’s van spelers en probeert op basis van Natural Language Processing (een techniek die gebruikt wordt om slimme algoritmes onze taal te laten begrijpen) karaktereigenschappen van spelers te analyseren. Denk aan beroep en bekendheid. Deze layer wordt getraind met Wikipediapagina’s van oud-mollen.⠀⠀
• De Appearance layer kijkt naar hoe vaak spelers in beeld komen tijdens de aflevering door middel van een gezichtsherkenningstool. De mol blijkt namelijk significant minder in beeld te komen tijdens de eerste vijf afleveringen.⠀⠀
• De Social Media layer sluit spelers uit als Mol als ze te vroeg actief zijn op social media tijdens de opnameperiode. De layer kijkt ook naar ander bewijs dat aantoont dat ze niet aanwezig waren bij de gehele opname periode.⠀⠀
Dorenbos testte zijn model op de seizoenen 13 tot en met 21 (Renaissance) en op de seizoen 9 tot en met 12. Echter voor de seizoenen 9 tot en met 12 gebruikte hij alleen de Exam Drop Layer, Exam Pass Layer, Wikipedia Layer, omdat er geen social media analyses zijn gedaan in deze periode en omdat de ‘Mol’ in deze periode nog niet minder in beeld kwam.
Het Moldel laat goede resultaten zien voor de seizoenen 9 t/m 21. Dat wil zeggen in 13 van de 13 finales krijgt de echte ‘Mol’ de hoogste likelihood.