Wie genau ist Ihr LLM-Detektor?
Auf Texten ab 500 Wörtern erreichen wir Erkennungsraten zwischen 92 % und 98 %, abhängig von Modellfamilie und Sprache. Wichtig ist: wir geben keine binären Urteile aus, sondern kalibrierte Wahrscheinlichkeiten. Ein Score von 0,87 heißt: 87 % Konfidenz, nicht "schuldig". Hinter dem System steht PlagAware, eingesetzt an über 20 deutschen Universitäten.
Funktioniert der Detektor in Deutsch und Englisch gleich gut?
Ja. Wir betreiben getrennte Modelle für Deutsch und Englisch, jeweils trainiert auf großen, sprachspezifischen Korpora. Die Erkennungsrate ist in beiden Sprachen vergleichbar, wobei englische Texte historisch leicht besser klassifizierbar sind, weil die meisten LLMs ein stärkeres English-Bias in der Trainingsverteilung haben.
Wie verhält sich der Detektor bei sehr kurzen Texten?
Bei Texten unter 200 Wörtern sinkt die Konfidenz deutlich. Das ist kein Bug, sondern Statistik: Perplexity, Burstiness und stilometrische Merkmale brauchen Stichprobenumfang. Wir geben für sehr kurze Texte daher zusätzlich ein Konfidenzintervall aus und kennzeichnen sie als "low confidence". Für eine belastbare Aussage empfehlen wir mindestens 500 Wörter.
Erkennen Sie auch ganz neue Modelle, die erst vor wenigen Wochen veröffentlicht wurden?
In der Regel ja. Aktuelle Modelle teilen den größten Teil ihrer statistischen Signatur mit ihren Vorgängern, weil sie ähnliche Trainingsdaten und Architekturen verwenden. Komplett neue Stilfingerprints werden quartalsweise in unser Referenzkorpus aufgenommen. Sollte ein brandneues Modell zwischen den Updates erscheinen, fällt es trotzdem meistens in eine der bestehenden Familien (OpenAI-like, Claude-like, Llama-like).
Was ist mit Texten, die ich mit einem Humanizer "menschlicher" gemacht habe?
Humanizer reduzieren die Erkennungsrate, sie eliminieren sie aber nicht. Unsere Detektoren werden gezielt auf Humanizer-Ausgaben mittrainiert, sodass typische Humanizer-Artefakte (unnatürliche Synonymdichte, eingefügte Füllwörter) selbst zum Signal werden. Im Bericht weisen wir explizit darauf hin, wenn der Verdacht auf nachträgliche Bearbeitung besteht.
Wie sieht der wissenschaftliche Forschungsstand zur LLM-Erkennung aus?
Die akademische Diskussion ist noch jung, aber aktiv. Konsens in Computerlinguistik und ML-Forschung: gut kalibrierte Detektoren erreichen verlässliche Indikationsqualität, kein Detektor liefert absolute Sicherheit, und Konfidenzangaben sind Pflicht. Wir folgen exakt diesem Konsens. Konkrete Studien benennen wir auf Anfrage gerne im Detail.
Werden bilinguale oder gemischte Texte korrekt verarbeitet?
Ja. Der Detektor erkennt Sprachwechsel auf Satzebene und wendet das passende sprachspezifische Modell an. Texte mit deutschen Fachzitaten in englischen Arbeiten (oder umgekehrt) werden korrekt segmentiert und gewichtet.
Kann ich das Ergebnis als juristisches Gutachten verwenden?
Der Bericht ist als Indiz mit transparenter Methodik, Konfidenzangabe und Wiederholbarkeit konzipiert, exakt das, was Gerichte für eine Verwertung verlangen. Das letzte Urteil über Echtheit oder Täuschung trifft selbstverständlich das Gericht oder die Prüfungskommission, nicht der Detektor.