TransferEngine und pplx garden: Trillion‑Parameter‑LLMs auf Ihrem Cluster betreiben
Zuletzt aktualisiert: 2025-11-22 Kurzfassung TransferEngine ist eine portable RDMA‑Abstraktion, die in Projekten wie pplx garden eingesetzt wird, um KV‑Cache‑Streaming, MoE‑Dispatch und punktuelle Weight‑Transfers für Trillion‑Parameter‑Modelle zu ermöglichen. Dieser Text erklärt, wie die Technik in...
