Marktreaktion auf DeepSeek-Nachrichten: Seeking the Deep
Von Karen Kharmandarian, Gründer & Portfolio Manager und Alexandre Zilliox, Portfolio Manager bei Thematics AM
Was ist passiert?
Der Markt reagierte sehr negativ auf die Ankündigung eines neuen Modells, das angeblich nur 6 Millionen Dollar gekostet hat, um es zu trainieren, wobei Chips verwendet wurden, die zwei Generationen alt sind. Die Prognose für die Inferenzkosten liegt mehr als zehnmal niedriger als bei den Modellen von OpenAI.
Gründe für die Reaktion
Diese Reaktion rührt von den Bedenken des Marktes hinsichtlich der zukünftigen Nachfrage nach Rechenleistung her. Wenn es tatsächlich möglich ist, Modelle zu erstellen, die genauso effektiv sind wie die bekanntesten Modelle (wie Meta’s Llama oder OpenAI’s GPT), aber mit weniger fortschrittlicher Hardware und deutlich niedrigeren Betriebskosten, stellt sich die Frage nach der Notwendigkeit von leistungsstarken KI-Beschleunigern. Dies könnte letztlich zu einer verringerten Nachfrage nach Produktionsausrüstung führen, was sich in den Kursrückgängen von ASM und ASML widerspiegelte.
Aktuelle Einschätzung
Die Marktreaktion ist im Kontext der hohen Bewertungen verständlich, insbesondere mit den bevorstehenden Quartalsberichten. Es gibt zunehmende Unsicherheiten hinsichtlich der Kapazität und des Zeitrahmens, den die grossen Tech-Unternehmen benötigen, um ihre erheblichen Investitionen wieder hereinzuholen. Wir überprüfen unsere Positionen Fall für Fall, sehen dies jedoch allgemein als eine Gelegenheit, Positionen zu stärken, die weniger betroffen sind.
Kostenschätzungen
Es gibt sehr wenig konkrete Information über die genauen Trainingskosten von DeepSeek’s Modell. Einige Marktteilnehmer schlagen vor, dass das Unternehmen über ein Cluster von 50.000 Nvidia H100 GPUs verfügt, was die Investition in Milliardenhöhe treiben würde. Ohne die Gehälter der an dem Projekt beteiligten Ingenieure zu berücksichtigen, erscheint die Zahl von 6 Millionen Dollar äusserst fragwürdig.
Modelltypen
Die Mehrheit der DeepSeek-Modelle sind «distillierte» (eine Wissensübertragungsmethode von einem grossen Modell auf ein kleineres Modell), was darauf hindeutet, dass das ursprüngliche Modell wahrscheinlich wesentlich mehr Rechenressourcen für das Training benötigt hat. Die Transparenz bezüglich der Betriebsweise des Unternehmens bleibt begrenzt.
Vorteile einer offenen Architektur
Da DeepSeek ein Modell mit offener Architektur betreibt, profitieren alle Akteure im Ökosystem von den architektonischen Verbesserungen des Unternehmens. Dies ermöglicht eine breitere Analyse der Fortschritte, die diese Modelle bieten. Dies könnte letztlich für Softwareanbieter von Vorteil sein und die Technologieadoption fördern.
Nachfrage nach Chips
Wenn diese Behauptungen berücksichtigt werden, könnte dies die Nachfrage nach Rechenleistung und folglich nach Chips verringern. Allerdings legt das Jevons-Paradoxon nahe, dass mit zunehmender Effizienz von Modellen der Gesamtverbrauch ebenfalls steigen könnte. Mit anderen Worten, diese Fortschritte könnten die Einführung durch wirtschaftliche Mittel fördern, indem sowohl die Trainings- als auch die Inferenzkosten gesenkt werden. Daher sind wir nicht überzeugt, dass die Nachfrage nach Chips drastisch sinken wird; im Gegenteil, sie könnte weiterhin gesund bleiben.
Risikobewertung
Historisch gesehen haben wir Anbieter von grundlegenden Modellen als am stärksten gefährdet innerhalb der Wertschöpfungskette betrachtet, mit der Annahme, dass bestimmte Modelle schnell zu «Kommoditäten» werden könnten. Aus diesem Grund ist unser Portfolio in diesem Bereich nur minimal exponiert.
Zusätzliche Überlegungen
Geopolitische Faktoren dürfen bei diesen Ankündigungen nicht unbeachtet bleiben. Chinesische Unternehmen könnten versuchen, das Kräfteverhältnis zu verschieben, indem sie zeigen, dass Exportbeschränkungen nur begrenzte Auswirkungen auf ihre Fähigkeit haben, mit den USA im Bereich der KI zu konkurrieren – insbesondere indem sie das Modell als Open Source anbieten (ein kollaboratives/dezentralisiertes System), während die meisten amerikanischen Modelle Closed Source bleiben (ein proprietäres, monetarisiertes System).
Zusammenfassung
Obwohl die Marktreaktion in berechtigten Bedenken hinsichtlich der zukünftigen Rechenbedürfnisse und der Investitionsrenditen verwurzelt ist, erfordern die vollständigen Auswirkungen dieser Entwicklungen eine sorgfältige Überwachung und ein differenziertes Verständnis.