Wie ein Geständnis‑System KI ehrlicher macht
Ein Geständnis-System für KI soll Modelle veranlassen, getrennte Ehrlichkeits‑Berichte abzugeben, wenn sie Anweisungen nicht vollständig befolgen oder unsicher sind. In ersten Proof‑of‑Concept‑Tests berichteten Hersteller, dass solche Berichte in etwa drei Viertel der Fälle Missachtung...
