Wichtiger Fortschritt für KI-Markt: Wie Nvidia berichtet, konnten führende Inferenz‑Plattformen wie Baseten, DeepInfra, Fireworks AI und Together AI ihre Kosten für Open‑Source‑Modelle seit dem Einsatz der neuen Blackwell‑Generation drastisch senken.
Nvidia-Aktie: Blackwell-Chips bewirken offenbar deutliche Kostensenkungen
Je nach Modell und Anwendung fallen die Kosten pro Token um das Vier- bis Zehnfache, weil Blackwell höheren Durchsatz, effizientere Speicherformate wie NVFP4 und optimierte Software‑Stacks wie TensorRT‑LLM kombiniert. Die Unternehmen sprechen von einem Technologiesprung, der sowohl Geschwindigkeit als auch Wirtschaftlichkeit verbessere.
Die positiven Effekten reichen quer durch Branchen:
- Gesundheit: Sully.ai reduziert die Inferenzkosten für medizinische Dokumentation um 90 % und beschleunigt Antworten um 65 %.
- Videospiele: DeepInfra halbiert die Kosten für große Mixture‑of‑Experts‑Modelle und senkt sie mit NVFP4 sogar auf ein Viertel.
- Agentischer Chat: Fireworks AI ermöglicht komplexe Multi‑Agent‑Workflows mit bis zu 50 % geringeren Kosten.
- Kundendienst: Together AI erzielt bei Voice‑Agents eine 6‑fach günstigere Kostenstruktur und Reaktionszeiten unter 400 Millisekunden.
Nvidia-Aktie: Chip-Wahnsinn geht weiter – Rubin soll noch 2026 kommen
Nvidia spricht von „extremer Codesign‑Effizienz“: Hardware, Netzwerk und Software greifen demnach so eng ineinander, dass die Token-Kosten schneller sinken als die Infrastrukturkosten steigen.
Und mit dem kommenden Rubin‑System stellt Nvidia bereits die nächste 10‑fach‑Stufe in Aussicht. Nvidia hatte die Supercomputer-Mikroarchitektur Rubin vor einigen Monaten vorgestellt und will die neuen Chips ab Ende 2026 auf den Markt bringen.
Nvidia-Aktie: Kaufen oder verkaufen?! Neue Nvidia-Analyse vom 22. Februar liefert die Antwort:
Die neusten Nvidia-Zahlen sprechen eine klare Sprache: Dringender Handlungsbedarf für Nvidia-Aktionäre. Lohnt sich ein Einstieg oder sollten Sie lieber verkaufen? In der aktuellen Gratis-Analyse vom 22. Februar erfahren Sie was jetzt zu tun ist.
