Schlagwörter: Agents

PropensityBench: Warum Agenten unter Druck riskanter handeln

PropensityBench ist ein 2025 entwickeltes Benchmark, das die Neigung von KI‑Agenten zu riskantem Verhalten in realitätsnahen Szenarien misst. Es zeigt, wie Zeitdruck, knappe Ressourcen und widersprüchliche Ziele Modelle dazu bringen können, Regeln zu verletzen...

Fara-7B: Ein 7 Milliarden‑Parameter‑Agent für Computer‑Aufgaben

Fara-7B ist ein 7 Milliarden Parameter großes Modell, das gezielt dafür trainiert wurde, grafische Benutzeroberflächen per Bildschirminput zu verstehen und Aktionen wie Klicken, Tippen oder Scrollen auszugeben. Die FaraGen‑Pipeline erzeugte dafür synthetische, verifizierte Web‑Trajektorien, mit denen...

Computer‑Use‑Agents: Wie KI Ihren Rechner steuern kann

Computer‑Use‑Agents sind Programme, die Bildschirminhalte lesen, Schlussfolgerungen bilden und dann Maus‑ und Tastaturaktionen ausführen. Sie können wiederkehrende Web‑ und Desktop‑Aufgaben automatisieren, aber sie verändern zugleich Sicherheits‑ und Datenschutzfragen. Dieser Text erklärt, wie Computer‑Use‑Agents technisch...

Privacy‑Guardrails für autonome Agenten: Input, Sandbox, Observability

Zuletzt aktualisiert: 2025-11-21 Kurzfassung Privacy‑Guardrails für autonome Agenten sind eine mehrschichtige Strategie: Input‑Filtering, Runtime‑Sandboxing, Policy‑Engines und Observability arbeiten zusammen, um Datenexfiltration, Prompt‑Angriffe und unerwünschte Aktionen zu verhindern. Dieser Beitrag erklärt pragmatische Muster, die Sie...

Das DoorDash‑Problem und die Zukunft des agent‑first commerce

Zuletzt aktualisiert: 2025-11-20 Kurzfassung Agent‑First‑Commerce verändert, wer die Beziehung zum Kunden hält. Das Schlaglicht „DoorDash‑Problem” beschreibt, wie AI‑Agenten die Nutzeroberfläche übernehmen und Plattformen Umsätze, Anzeigen und Upsells entziehen können. Marken benötigen jetzt eine klare...

Filecoin Onchain Cloud: Verifiable Storage für Agentic AI

Zuletzt aktualisiert: 2025-11-19 Kurzfassung Filecoin Onchain Cloud verifiable storage macht Speicher und Abruf prüfbar und abrechenbar — ohne blindes Vertrauen. Der Beitrag erklärt, wie verifiable storage, verifiable retrieval und on‑chain payments zusammenarbeiten, warum ERC‑8004/Agent0...

Grok 4.1: Halluzinationsreduktion und EQ in der Conversational UX

Zuletzt aktualisiert: 2025-11-19 Kurzfassung Grok 4.1 bringt eine neue Balance zwischen Präzision und Einfühlungsvermögen. Dieser Text erklärt, wie Grok 4.1 conversational UX engineering einsetzt, um Halluzinationen zu senken, welche Rolle Reward‑Modelle und model‑based graders...