KI-Detektoren, auch bekannt als KI Scanner oder Content Detektoren, sind Programme, die erkennen k?nnen, ob ein Text von einem Menschen oder einer Künstlichen Intelligenz (KI) wie ChatGPT geschrieben wurde.
In der Regel verwendet ein KI-Detektor einen Algorithmus zum maschinellen Lernen, der mit von Menschen geschriebenen und von Künstlicher Intelligenz generierten Texten trainiert wurde. Dieser erkennt Muster in der natürlichen Sprache und entscheidet, ob ein Text von einem Menschen geschrieben wurde oder nicht.
Der Text wird in einzelne Segmente zerlegt und jeder Satz mit einem Punktwert versehen. Aus diesen Punktwerten wird dann ein Gesamtprozentsatz errechnet, der angibt, wie viel Prozent des Textes nach Ansicht des Algorithmus von der KI stammen.
Um den Inhalt zu bewerten, verwenden die Algorithmen Verfahren wie die Verarbeitung natürlicher Sprache, um die Originalit?t des Textes zu beurteilen. Die beiden wichtigsten Messgr??en hierfür sind Komplexit?t und H?ufigkeit.
Komplexit?t vs. H?ufigkeit
Komplexit?t ist ein Ma? dafür, wie unvorhersehbar oder zuf?llig ein Text ist. Gro?e Sprachmodelle (LLMs) und Tools zur Erstellung von KI-Inhalten sind darauf ausgelegt, Texte mit geringer Komplexit?t zu erzeugen. Das bedeutet, dass sie für den Leser vorhersehbarer und verst?ndlicher sind.
KI-Detektoren messen diese Komplexit?t. Ein niedriger Komplexit?tswert deutet darauf hin, dass ein Text von einer automatisierten L?sung, sprich einer KI geschrieben wurde, w?hrend ein hoher Komplexit?tswert darauf hindeutet, dass ein menschlicher Benutzer mehr Inkonsistenzen in der Sprachwahl aufweist.
Auf der anderen Seite bewertet die H?ufigkeit die Varianz in der Satzstruktur und -l?nge. Texte mit einer geringen Varianz in Satzstruktur und -l?nge werden als wenig abwechslungsreich bezeichnet, w?hrend Texte mit einer gr??eren Varianz zwischen diesen beiden Variablen eine hohe Sprunghaftigkeit aufweisen.
KI-generierte Texte sind weniger sprunghaft und produzieren S?tze mit mittlerer L?nge und konsistenterer Struktur. Im Gegensatz dazu verwenden menschliche Autoren S?tze mit unterschiedlicher L?nge und insgesamt weniger Konsistenz.
Warum sind KI-Detektoren wichtig?
KI-Detektoren sind wichtige Tools für Unternehmen, akademische Einrichtungen und andere Organisationen, die überprüfen müssen, ob ein Text von Menschen verfasst wurde.
Beispielsweise k?nnen Hochschulen mit diesen Tools überprüfen, ob Studierende ihre Texte selbst verfasst haben. Marketingfachleute k?nnen sie verwenden, um sicherzustellen, dass gekaufte Inhalte von Grund auf neu geschrieben wurden. Für Personalverantwortliche sind sie eine gute M?glichkeit, die Authentizit?t von Bewerbungen zu überprüfen.
Mit der zunehmenden Verbreitung von KI werden diese Tools immer wichtiger. Allein im Bildungssektor hat Turnitin festgestellt, dass von 65 Millionen überprüften studentischen Arbeiten 3,3 % aller Arbeiten (d. h. mehr als 2 Millionen) zu 80 % oder mehr von KI geschriebenen Text enthielten.
Auch wenn es schwierig ist, die genaue Verbreitung von KI-generierten Online-Inhalten zu bestimmen, hat NewsGuard, ein auf das Aufspüren von Fehlinformationen spezialisierter Dienst, herausgefunden, dass bereits mehr als 50 Online-Nachrichtenseiten fast ausschlie?lich von KI-Software erstellt werden.
Die oben genannten Daten zeigen, dass KI-generierte Inhalte weit verbreitet sind. Auch wenn dies unter bestimmten Umst?nden nicht unbedingt schlecht ist, gibt es Bereiche wie die Bildung, in denen dies nicht au?er Acht gelassen werden sollte.
Sind KI-Detektoren zuverl?ssig?
Die Zuverl?ssigkeit von KI-Detektoren h?ngt von einer Reihe von Faktoren ab. Obwohl einige L?sungsanbieter wie Originality KI und Turnitin eine Genauigkeit von 99 % bzw. 98 % bei der Erkennung von KI-generierten Inhalten versprechen, h?ngt die Zuverl?ssigkeit eines Detektors von einer Reihe von Faktoren ab.
Eines der gr??ten Probleme besteht darin, dass Benutzer L?sungen wie ChatGPT anweisen k?nnen, die KI-Detektoren absichtlich zu umgehen. Darüber hinaus erstellen viele Benutzer gemischte Texte, indem sie KI nutzen, um einen Text zu erstellen und ihn dann zu bearbeiten oder umgekehrt, um eine Erkennung zu vermeiden.
Gleichzeitig sind viele L?sungen anf?llig für falsch positive Ergebnisse und k?nnen den Eindruck erwecken, dass von Menschen geschriebene Artikel in Wirklichkeit von einem KI-Programm verfasst wurden. Solche falsch positiven Ergebnisse k?nnen ?u?erst sch?dlich sein, wenn eine Organisation oder Institution aufgrund dieser Einsch?tzung Ma?nahmen gegen eine Person ergreift.
Aus diesem Grund werden KI-Detektoren bestenfalls als reines Hilfsmittel eingesetzt, um Inhalte hervorzuheben, die eine weitere Untersuchung rechtfertigen. Auf der anderen Seite werden diese L?sungen mit der Zeit immer besser, so dass ihre Genauigkeit in absehbarer Zeit weiter zunehmen wird.
Welche KI-Detektoren gibt es?
Mittlerweile gibt es eine gro?e Auswahl an KI-Detektoren auf dem Markt. GPTZero, Copyleaks, Scribbr, Undetectable KI und Turnitin bieten alle L?sungen zur Erkennung von KI-generierten Inhalten. Die Gesamtgenauigkeit der einzelnen L?sungen ist jedoch unterschiedlich.
Zudem sind diese Tools für unterschiedliche Anwendungsf?lle konzipiert. GPTZero ist beispielsweise darauf trainiert, studentische Texte und akademische Prosa zu analysieren, um Inhalte zu identifizieren, die mit ChatGPT oder GPT-4 erstellt wurden.
Andere Tools wie Copyleaks bieten einen hybriden Ansatz zur überprüfung von Inhalten und unterstützen Bildungseinrichtungen und Unternehmen mit systemeigenen Plagiatserkennungsfunktionen.
Wie sollte auf KI-generierte Inhalte reagiert werden?
KI-generierte Inhalte sind nicht zwangsl?ufig per se schlecht, so dass jede Organisation und Institution selbst beurteilen muss, ob die Verwendung von KI in einem bestimmten Kontext oder in einem bestimmten Ausma? auf Fehlverhalten oder Unehrlichkeit hindeutet.
Wenn beispielsweise ein Studierender ChatGPT verwendet, um einen Aufsatz zu schreiben und diesen als seine eigene Arbeit ausgibt, kann dies als Fehlverhalten und als Absicht, den Beurteiler in die Irre zu führen, betrachtet werden.
Im Allgemeinen wird ein KI-Erkennungswert oder ein Plagiatswert von weniger als 15% als akzeptabel eingestuft, damit die Arbeit als Originalarbeit angesehen werden kann.