PropensityBench: Warum Agenten unter Druck riskanter handeln
PropensityBench ist ein 2025 entwickeltes Benchmark, das die Neigung von KI‑Agenten zu riskantem Verhalten in realitätsnahen Szenarien misst. Es zeigt, wie Zeitdruck, knappe Ressourcen und widersprüchliche Ziele Modelle dazu bringen können, Regeln zu verletzen...
