Ga naar inhoud
  • Drifter
    Drifter

    ChatGPT laat digitale sporen achter: dit moet je weten (en hoe je ze verwijdert)

       (0 reviews)

    Wat ooit een vaag onderscheid leek – is deze tekst door een mens of door een AI geschreven? – wordt ineens veel concreter. Sinds de introductie van de nieuwe o3- en o4-mini-modellen van ChatGPT blijkt dat deze AI-systemen onzichtbare sporen achterlaten in hun output. Niet zichtbaar met het blote oog, maar wel te herkennen in tekstverwerkers en programmeertools.

    Wat gebeurt er precies?

    Bij het genereren van teksten vervangen deze nieuwe modellen soms gewone spaties (Unicode U+0020) door alternatieve spaties of niet-standaard Unicode-karakters. Deze subtiele afwijkingen fungeren als een soort digitale vingerafdruk. Ze zijn niet bedoeld om gelezen te worden, maar kunnen wel degelijk opvallen wanneer je de tekst opent in een programma dat onzichtbare tekens weergeeft.

    In Microsoft Word bijvoorbeeld kun je met de toetscombinatie Ctrl + Shift + 8 verborgen tekens zichtbaar maken. Je ziet dan dat de meeste spaties als standaardstipjes verschijnen, maar sommige worden weergegeven als een ander symbool – zoals een klein rondje (°) of een afwijkend spatiekarakter. Dit verschil verraadt vaak het gebruik van AI bij het schrijven van de tekst.

    Ook andere editors, zoals Google Docs, Notepad++, Sublime Text of gespecialiseerde Unicode-viewers, kunnen deze afwijkingen tonen als je weet waar je moet kijken.

    Bug of opzet?

    Officieel stelt OpenAI dat het hier om een onbedoeld effect gaat – een bug, geen bewuste functie. Desondanks is er weinig publieke toelichting, en blijft het onduidelijk of en wanneer dit verschijnsel verholpen wordt. Wat wél duidelijk is: oudere modellen, zoals GPT-3.5 of eerdere versies van GPT-4, bevatten deze digitale afwijkingen niet. Pas met de nieuwste generatie (o3 en o4-mini) zijn de verschillen structureel zichtbaar geworden.

    Hoe verwijder je deze sporen uit je tekst? (zie ook onderstaande Checklist en Scriptje)

    Wil je AI-sporen wissen uit je tekst, dan zijn er een aantal praktische methoden:

    1. Gebruik een teksteditor die verborgen tekens toont.
      Programma’s als Word, Sublime Text of Visual Studio Code maken afwijkende karakters zichtbaar, zodat je ze handmatig kunt vervangen door standaardspaties.

    2. Zoek-en-vervang op Unicode-niveau.
      Voor wie iets technischer is ingesteld: met tools of scripts kun je specifieke Unicode-karakters opsporen en automatisch omzetten naar reguliere tekens. Denk aan regex-filters of shellscripts die afwijkingen detecteren.

    3. Gebruik kant-en-klare conversietools.
      Online circuleren inmiddels eenvoudige scripts en browserextensies die AI-gegenereerde teksten schonen van afwijkende tekens. Deze tools zijn populair onder redacteuren, studenten en contentcreators die AI gebruiken maar hun output willen anonimiseren.

    Wat betekent dit voor makers van content?

    De aanwezigheid van zulke digitale sporen werpt opnieuw vragen op over transparantie, auteurschap en controle. Moet AI-inhoud herkenbaar zijn? Hebben gebruikers het recht om zulke kenmerken te verwijderen? En in welke mate mogen bedrijven en instellingen eisen dat AI-gebruik gemeld wordt?

    Voor wie teksten schrijft voor commerciële doeleinden – zoals blogs, marketingcampagnes of journalistiek – is het belangrijk om te weten dat je output onbedoeld herleidbaar kan zijn tot een AI-bron. Het risico bestaat dat opdrachtgevers, platforms of lezers AI-inhoud herkennen en vragen stellen over authenticiteit of auteursrecht.

    Wat kun je als gebruiker doen?

    • Controleer je output systematisch op verborgen tekens, zeker als je werkt voor opdrachtgevers of publieke platforms.

    • Wees transparant over het gebruik van AI, of zorg dat je teksten ‘schoon’ zijn voordat je ze publiceert.

    • Bouw het opschonen van AI-teksten in je workflow in, zeker als je werkt met de nieuwste generatie modellen.

    Zeker! Hier zijn zowel een korte checklist als een eenvoudig scriptje waarmee je AI-sporen (zoals afwijkende spaties of ongewone Unicode-tekens) automatisch kunt opsporen en verwijderen uit een tekstbestand.


    Checklist: Zo verwijder je AI-sporen uit een tekst

    1. Open de tekst in een editor met Unicode-ondersteuning
      Gebruik bijvoorbeeld:

      • Microsoft Word (Ctrl + Shift + 8 voor verborgen tekens)

      • Sublime Text

      • Visual Studio Code

      • Notepad++

      • Online Unicode viewer

    2. Controleer op verdachte tekens
      Let op:

      • Kleine rondjes (°)

      • Vreemde spaties (zoals U+00A0 [non-breaking space], U+2002 [en space], U+200B [zero-width space])

      • Symbolen die geen betekenis hebben in jouw context

    3. Gebruik zoek-en-vervang om deze tekens te verwijderen of vervangen door een normale spatie
      Je kunt ze handmatig zoeken of automatisch vervangen met een script.

    4. Opslaan als platte tekst (.txt of .md) om formatting en tekens te resetten
      Exporteer je bestand opnieuw als TXT-bestand om verborgen metadata of tekens te wissen.


    🧼 Scriptje: AI-spaties verwijderen met Python

    Dit script verwijdert of vervangt verdachte Unicode-spaties automatisch door gewone spaties:

    import re
    
    # Plaats hier je AI-gegenereerde tekst
    with open("input.txt", "r", encoding="utf-8") as file:
        text = file.read()
    
    # Lijst van verdachte spaties en tekens
    ai_unicode_chars = [
        "\u00A0",  # non-breaking space
        "\u2002",  # en space
        "\u2003",  # em space
        "\u2009",  # thin space
        "\u200B",  # zero-width space
        "\u2060",  # word joiner
        "\uFEFF",  # zero-width no-break space (BOM)
        "°"        # specifiek zichtbaar teken zoals gebruikt in Word
    ]
    
    # Vervang deze tekens door een gewone spatie
    for ch in ai_unicode_chars:
        text = text.replace(ch, " ")
    
    # Optioneel: vervang meerdere spaties achter elkaar door één spatie
    text = re.sub(r"\s{2,}", " ", text)
    
    # Sla de opgeschoonde tekst op
    with open("output.txt", "w", encoding="utf-8") as file:
        file.write(text)
    
    print("AI-sporen verwijderd en tekst opgeslagen in output.txt")
    

    🔧 Benodigdheden:

    • Python 3.x geïnstalleerd

    • Zet je tekst in een bestand genaamd input.txt in dezelfde map als het script

    AI-content is minder onzichtbaar dan gedacht. Zelfs als de tekst vloeiend, menselijk en foutloos overkomt, kunnen verborgen tekens onbedoeld de herkomst verraden. Voor iedereen die AI inzet in hun schrijfproces – van studenten tot professionals – is het van belang om te weten welke sporen je achterlaat, en hoe je daar bewust mee om kunt gaan.

    Door: Drifter




    Feedback Gebruiker

    Log in om te reageren

    Je kunt een reactie achterlaten na het inloggen



    Login met de gegevens die u gebruikt bij softtrack

    Er zijn geen reviews om weer te geven.


×
×
  • Nieuwe aanmaken...