Du glaubst, dein KI-Chatbot liegt richtig? Diese Uni beweist das Gegenteil
Mit CheckMate stellt Cambridge eine offene Plattform vor, die KI-Sprachmodelle erstmals interaktiv bewertet – durch echtes Nutzerfeedback auf mathematische Aufgaben. Die Ergebnisse zeigen: Große Sprachmodelle wie GPT-4 wirken oft korrekt, täuschen aber gefährlich regelmäßig...