Google: geen bittorrent, geen sex, wel seks
Sinds kort heeft Google zijn zwarte lijst met zoektermen uitgebreid met begrippen die (volgens Google) geassocieerd worden met copyright-inbreuk. Dit betekent dat twijfelende gebruikers, op zoek naar informatie over een willekeurige bioscoopfilm, niet meer richting BitTorrent of Rapidshare worden geloodst wanneer zij nog aan het typen zijn. Als gebruikers zelf een van deze twee termen toevoegen aan hun zoekopdracht, krijgen ze nog wel gewoon de zoekresultaten. Nieuwsgierig als we zijn, hebben we zelf ook een aantal al dan niet discutabele termen geprobeerd. Ben je al nieuwsgierig?
Hoe werkt het?
Voor de mensen die Scroogle, Ixquick of een andere zoekmachine gebruiken, een korte uitleg: wanneer men op de hoofdpagina van Google een zoekopdracht begint te typen verschijnt na iedere toetsaanslag een nieuwe, specifiekere lijst met suggesties. Deze suggesties zijn gebaseerd op veel voorkomende zoekopdrachten, waar de tot dan toe ingevulde zoekterm onderdeel van uitmaakt. Tot voor kort betekende dit dat een gebruiker die begint met het typen van bijvoorbeeld de term “Avatar”, tussen de suggesties onder andere “Avatar bittorrent” en “Avatar rapidshare” zag staan. In het geval van Google Instant kwamen gelijk zoekresultaten naar boven.
De blacklist zorgt ervoor dat er geen suggesties of instant resultaten meer komen wanneer (delen van) bepaalde woorden worden ingetikt. Als we op Google.nl bijvoorbeeld beginnen met het typen van “Bits of Freedom” krijgen we vanaf de eerste drie letters al onze organisatie in beeld. In het lijstje met suggesties zien we echter ook BitLord en BitComet, twee programma’s die werken met het bittorrentprotocol. Gister konden we op Tweakers.net en Slashdot lezen dat onder andere het bedrijf BitTorrent, Inc. nu verontwaardigd is dat zij eruit worden gefilterd. Vanaf “bitt” weigert Google in het geheel iedere suggestie.
Hoe werkt het niet?
De lijst die Google hanteert is natuurlijk zeer arbitrair. Zo wordt na het typen van “pir” gewoon als eerste The Pirate Bay gesuggereerd. Ook “download m” geeft nog de suggestie om muziek, mp3 en movies te downloaden. Google zelf geeft over autocomplete aan: “we (…) apply a narrow set of removal policies for pornography, violence, hate speech, and terms that are frequently used to find content that infringes copyrights“. Een blacklist zoals die vorig jaar met behulp van crowdsourcing is samengesteld, laat zien dat op dat moment veel van de afgeschermde zoektermen scheldwoorden of pornografisch van aard waren.
Bij het uitproberen kwamen we vanzelfsprekend aardig wat interessante bijwerkingen, gemiste zoektermen, en randgevallen tegen. Zo vonden we dat de Nederlandse Google geen suggesties geeft voor “sex”, maar wel voor “seks”, terwijl de Engelstalige variant met geen van beide moeite heeft. Daarnaast blijft het stil als we op zoek zijn naar “how to murder” of “how to kill”, maar de letters “behea” zijn genoeg om op zowel de Nederlandstalige als Engelstalige Google te suggereren dat we misschien wel onthoofdingsfilmpjes willen zien. Ook zien we dat “white power” als suggestie afwezig is, maar dat “black power” wel oké bevonden wordt.
Zelf aan de slag
Voordat wij onze hele vrijdag besteden aan het uitproberen van al dan niet dubieuze woorden, spelen we het door aan jullie: wat vinden jullie aan interessante zoektermen die worden geblacklist, opvallende verschillen tussen de Engelse en Nederlandse blacklist, en volkomen brave zoekopdrachten die in de kiem worden gesmoord?