50%-Task-Completion Time Horizon verschiedener generativer KI-Modelle

Für eine Aufgabe, die Grok 4 in 50 % der Fälle richtig löst, brauchen Fachleute 1 Stunde und 50 Minuten