Schlagwörter: Deep Learning

Memorization vs. Reasoning: Neural‑Pfade in LLMs verstehen

Zuletzt aktualisiert: 11. November 2025 Kurzfassung Forscher haben gezeigt, dass sich memorization vs reasoning neural pathways in modernen LLM‑Gewichten unterscheiden lassen. Die Goodfire‑Studie nutzt eine K‑FAC‑Kurvaturzerlegung auf OLMo‑7B und zeigt: massives Verbatim‑Gedächtnis lässt sich...

Wie Recommendation Systems Stereotype verbergen — Auditleitfaden

Zuletzt aktualisiert: 11. November 2025 Kurzfassung Recommendation‑Systeme können Attribut‑Assoziationen so verbergen, dass Vorurteile über Nutzer:innen oder Inhalte kaum sichtbar bleiben. Dieser Praxisleitfaden erklärt, wie ein recommendation system bias audit aufgebaut wird, welche Tests (z....

Omnilingual ASR: Was Metas Release für Sprach‑Tech 2026 heißt

Zuletzt aktualisiert: 11. November 2025 Kurzfassung Meta hat mit Omnilingual ASR eine offene Modellfamilie vorgestellt, die laut Unternehmen mehr als 1.600 Sprachen abdeckt. Diese Veröffentlichung bringt leistungsfähige wav2vec2‑Encoder, LLM‑Decoder‑Varianten und Zero‑Shot‑Optionen zusammen. Der Artikel...

YOLO-HRS: KI erkennt PV-Moduldefekte auf einen Blick

Zuletzt aktualisiert: 10. November 2025 Kurzfassung Die KI-Technologie YOLO-HRS revolutioniert die PV-Defekterkennung. Sie scannt Module mit sichtbarem Licht und erkennt Defekte wie Risse oder Staub präzise. In diesem Praxischeck 2025 entdecken wir, wie Drohnen...

Text zu Stimme: Token‑Level Editing mit Step‑Audio‑EditX

Zuletzt aktualisiert: 10. November 2025 Kurzfassung Token‑level Audio Editing ermöglicht punktuelle Änderungen in Sprachaufnahmen — ohne die gesamte Datei neu aufzunehmen. Dieses Stück erklärt praktische Anwendungen und Grenzen von Step‑Audio‑EditX und beleuchtet, wie audio...

Agentic Voice AI: Whisper → SpeechT5 — Praktische Roadmap

Zuletzt aktualisiert: 9. November 2025 Kurzfassung Dieses agentic voice AI tutorial führt durch eine praktikable Whisper → SpeechT5‑Pipeline für latenzarme, autonome Sprachassistenten. Schritt für Schritt erkläre ich, welche Bausteine (Realtime‑ASR, TTS, Vocoder, WebRTC) zusammenkommen,...

TabPFN‑2.5: Deep Dive zu Tabular Foundation Models

Zuletzt aktualisiert: 9. November 2025 Kurzfassung TabPFN‑2.5 ist ein Tabular Foundation Model, das One‑Forward‑Pass‑Inferenz für große Tabellen anstrebt. Dieser Text fasst die Architekturidee, die Herstelleraussagen zu Benchmarks (inkl. AutoGluon‑Vergleiche), Lizenzfragen und praktische Schritte für...

Nested Learning: Wie Modelle dem Vergessen entkommen

Zuletzt aktualisiert: 8. November 2025 Kurzfassung Nested Learning beschreibt Modelle als eine Reihe verschachtelter Optimierungsprobleme und bietet damit einen neuen Blick auf das Problem des “catastrophic forgetting”. Dieser Artikel erklärt das Konzept, fasst die...