Der Endkunde im vorliegenden Projekt ist ein deutscher Hersteller spezialisierter High-Performance-Computing-Systeme (HPC) mit Schwerpunkt auf FPGA-beschleunigtem Rechnen. Das Unternehmen entwickelt modulare Parallelrechner, die in Bereichen wie Kryptographie, Simulation, Bioinformatik und algorithmischer Forschung eingesetzt werden.
Bei dieser Technologie übernehmen Field Programmable Gate Arrays (FPGAs) besonders rechenintensive Aufgaben direkt auf Hardwareebene. Dadurch lassen sich bestimmte Algorithmen erheblich schneller und energieeffizienter ausführen als auf herkömmlichen CPU- oder GPU-Architekturen.
Für die Entwicklung und Validierung solcher Systeme benötigt der Kunde eine robuste, skalierbare Serverplattform, die die parallele Nutzung von CPU-, GPU- und FPGA-Workloads zuverlässig unterstützt.
Projekt-Zeitraum: Q2/2025
Projekt-Volumen: HPC-Systeme im sechsstelligen Bereich
Inhaltsverzeichnis
Projekt-Beschreibung
Ziel des Projekts war der Aufbau einer neuen HPC-Clusterplattform zur Durchführung hochparalleler Berechnungen mit GPU- und FPGA-Support. Der Kunde benötigte ein skalierbares Serversystem, das sich sowohl für klassische Software-Simulationen als auch für hardwarebeschleunigte Rechenoperationen eignet.
Im Mittelpunkt stand die Integration einer leistungsstarken, PCIe-optimierten Serverinfrastruktur, die flexibel mit unterschiedlichen FPGA- und GPU-Karten bestückt werden kann. Neben hoher Rechenleistung waren vor allem Energieeffizienz, Zuverlässigkeit und einfache Wartbarkeit entscheidend.
Die Systeme sollten schlüsselfertig in 19"-Racks integriert und mit vollständiger Verkabelung, Stromverteilung und Netzwerkanbindung ausgeliefert werden. Der gesamte Cluster musste unter Linux getestet und für den sofortigen produktiven Einsatz vorbereitet werden.
Zentrale Anforderungen:
- Hohe Parallelrechenleistung für CPU-, GPU- und FPGA-basierte Anwendungen
- PCIe-Vorbereitung für modulare FPGA-Integration
- Große Arbeitsspeicherkapazität und Erweiterbarkeit für Simulations-Workloads
- Schneller NVMe-Storage mit redundanter Datensicherung
- Redundante 10-Gigabit-Netzwerkanbindung für Daten- und Managementnetz
- Schlüsselfertige Rack-Integration inklusive KVM-Konsole, PDU und Verkabelung
- Vollständiger Funktionstest unter Linux für zuverlässigen Dauerbetrieb
Projekt-Realisierung
- Serverplattform
21× Supermicro SuperServer 420GP-TNR
→ Rack-optimierte 4U-Plattform mit hoher Rechendichte, redundanter Stromversorgung und ausgelegter Kühlung für GPU- und FPGA-Erweiterungen. Ideal für hybride HPC-Workloads, die CPU-, GPU- und FPGA-Beschleunigung kombinieren. - Prozessoren (2 pro Server)
42× Intel Xeon Silver 4310 (12 Kerne / 24 Threads, 2.10 GHz Basis, 3.30 GHz Turbo, Ice Lake-SP, 120 W TDP)
→ Dual-Socket-Setup mit insgesamt 24 physischen und 48 logischen Kernen pro Node. Bietet eine stabile und energieeffiziente Grundlage für parallele HPC-Workloads und Steuerprozesse von FPGA-Clustern. - Arbeitsspeicher (6 × 64 GB pro Server)
126× Samsung DDR4-3200 ECC reg. DR (Gesamt: 384 GB pro Node, effektiv 2666 MHz)
→ Hohe Speicherkapazität mit Fehlerkorrektur für stabile Langläufe und Simulationen. 18 DIMM-Slots bleiben für zukünftige Erweiterungen frei. - System-Storage (1 pro Server)
21× Samsung PM9A3 M.2 NVMe SSD (1,92 TB, PCIe Gen4 x4, bis 5.500 MB/s Lesen, 2.000 MB/s Schreiben)
→ Schneller, ausfallsicherer Boot-Datenträger mit Hardwareverschlüsselung und Power-Loss-Protection – ideal für Linux-basierte Clusterbetriebssysteme. - Netzwerk (1 Modul pro Server)
21× Supermicro AOC-ATGC-i2TM AIOM (2× 10 GbE RJ45)
→ Dual-10-Gigabit-Schnittstelle über OCP3-Modul für redundante Anbindung an Daten- und Managementnetzwerke. - Assemblierung & Test
Vormontage und Zertifizierung nach ISO 9001:2015 / ESD IEC 61340-5-1
PCIe-Powerkabel je Dual-x16-Slot vorkonfektioniert für FPGA-Steckplätze
Funktionstest und Burn-In unter Linux (Red Hat-Derivat)
→ Sicher geprüfte Auslieferung als schlüsselfertiges HPC-System, getrennt verpackt für Transport und Integration beim Endkunden. - Service-Level
3 Jahre Teilegarantie, SLA 1/3 (5×9) inkl. MUSTANG® systems Ticket-System
Ergebnis
Mit der gelieferten Lösung erhielt der Kunde ein vollständig integriertes, schlüsselfertiges HPC-Cluster bestehend aus 21 leistungsstarken Compute-Nodes auf Basis der Supermicro 420GP-TNR-Plattform. Durch die vorkonfigurierte Rack-Integration, inklusive Netzwerk, Stromverteilung und KVM-Infrastruktur, konnte das Gesamtsystem unmittelbar nach der Lieferung in Betrieb genommen werden.
Die Kombination aus Dual-Xeon-Architektur, großzügigem ECC-Arbeitsspeicher und NVMe-Storage schafft eine stabile Grundlage für parallele FPGA- und GPU-Berechnungen. Dank der vorkonfektionierten PCIe-Powerkabel und modularen AIOM-Netzwerkanbindung ist das System optimal vorbereitet für den Einsatz unterschiedlicher Beschleunigerkarten und zukünftige Erweiterungen.
Die integrierte Rack-Infrastruktur mit dediziertem Daten- und Managementnetz sorgt für hohe Betriebssicherheit, klare Trennung von Arbeitslasten und effiziente Wartungsprozesse. Durch den umfassenden Funktionstest unter Linux konnte die Clusterumgebung unmittelbar in den produktiven Forschungs- und Entwicklungsbetrieb überführt werden.
Insgesamt entstand eine skalierbare, energieeffiziente und servicefreundliche HPC-Plattform, die FPGA-basierte Spezialrechner des Kunden ideal ergänzt und neue Spielräume für rechenintensive Simulationen, algorithmische Analysen und Hardware-Evaluierungen eröffnet.