ChatGPT (und auch andere KI-Modelle die auf neuronalen Netzen basiert) nimmt eine Eingabe (das was Du bei ChatGPT schreibst) um dafür die „richtige“ Ausgabe zu generieren. Das passiert so, dass Deine Eingabe in Zahlen umgesetzt wird, dann diese Zahlen mit bestimmten Parametern zusammengerechnet werden und dann wird daraus die beste Ausgabe bestimmt.
Das Training ist notwendig, um die Parameter des Modells „richtig“ einzustellen. Man geht dafür so vor, dass man das neuronale Netz immer wieder für Beispieleingaben seine erzielte Ausgabe ausrechnen lässt, schaut, ob sie der erwünschten Ausgabe entspricht, und dann ggfs. die Parameter so verändert, dass sie nächstes mal etwas besser erreicht wird. Das muss man dann seeeeehr oft und für seeeeehr viele Eingabe/Ausgabe-Paare wiederholen und dann ist das Netz trainiert. Ohne Training würde man einfach irgendwelche zufälligen Ausgaben bekommen.
Künstliche neuronale Netze, die Basis der meisten aktuellen KI-Systeme sind, sind am Anfang komplett leere Datenstrukturen. Sie „wissen“ also gar nichst und können damit auch keine Aufgaben übernehmen. Das Training mit entsprechenden Daten sorgt also dafür, dass die Netze etwas „lernen“, das dann ermöglicht, dass diese Netze ihre Aufgaben durchführen können. ChatGPT ist nun ein solches Netz. Als Programm ist es am Anfang also komplett „leer“ und erst durch das Training kann es unsere Eingaben „verstehen“ und Antworten geben.
Warum schreibe ich manche Worte in Anführungszeichen? Weil das Worte sind, die eigentlich nur für Menschen korrekt sind. ChatGPT & Co. „lernen“ anders als Menschen lernen und sie „verstehen“ auch anders als Menschen. Aber da uns die entsprechend geeigneten Worte fehlen, müssen wir auf die Worte zurückgreifen, die für Menschen passen.
Kommentare