VP Bank: DeepSeek stellt US-Vorherrschaft bei KI in Frage

Chinesisches Start-up verblüfft mit seinem KI-Modell und verunsichert Investoren. Fünf Fragen.

Das chinesische KI-Start-up Unternehmen DeepSeek hat am 20. Januar seine KI namens R1 vorgestellt. R1 ist mit Anwendungen künstlicher Intelligenz (KI) aus den USA wie etwa ChatGPT von OpenAI vergleichbar, kostet aber nur einen Bruchteil. Der Tag der Publikation fiel auf die Amtseinführung des neuen US-Präsidenten.

von Marcello Musio, Head of Equity & Bond Selection, VP Bank

R1 ist offen zugänglich (open source) und kann somit für Anwendungen aller Art genutzt und angepasst werden. Gemäss den eigenen Benchmark-Tests überzeugt es in vielen Aufgaben und übertrifft in einigen Bereichen, wie zum Beispiel bei Programmieraufgaben, gar die Leistung von ChatGPT und Llama 3 von Meta. Einzig bei politisch sensiblen Themen, insbesondere im Zusammenhang mit China, weicht es Antworten aus.

Beeindruckend ist die Effizienz der Entwicklung: Trotz der US-Handelsbeschränkungen für die modernsten Chips hat DeepSeek laut eigenen Angaben R1 innerhalb von wenigen Monaten auf älteren Prozessoren von Nvidia trainiert – und weniger als 6 Millionen US-Dollar investiert. DeepSeek behauptet, nur etwa 2’000 Chips von Nvidia benötigt zu haben.

Die bekannten KI-Modelle aus den USA benötigen hingegen bis zu 16’000 Chips. OpenAI-CEO Sam Altman hat vor Kurzem gesagt, dass das Training von GPT-4oAr über 100 Mio. Dollar gekostet habe. Viele Investoren fragen sich nun zu Recht, wie kosten- und energieintensiv die Ressourcen für KI wirklich sein müssen. Und es steht die Frage im Raum, ob der Vorsprung der USA im Bereich der künstlichen Intelligenz geschwunden ist.

Fest steht, dass sich DeepSeek R1 diese Woche an die Spitze der App-Store-Charts in den USA katapultiert hat und ChatGPT als meist heruntergeladene kostenlose App abgelöst hat. Aktienkurse vieler KI-Technologieunternehmen, darunter auch Börsenliebling Nvidia und Rechenzentren-Ausrüster Arista Networks sowie Schneider Electric, verloren bis zu 20 % an einem Tag. Nvidia verlor am Montag beinahe 590 Mrd. US-Dollar an Börsenwert, so viel wie noch nie ein Unternehmen in der Wall-Street-Geschichte.

Wir stellen die fünf drängendsten Fragen und liefern die relevanten Antworten für Anleger.

Wer steckt hinter DeepSeek?
DeepSeek ist ein KI-Start-up aus China mit 200 Mitarbeitenden, 2023 gegründet von Liang Wengfeng. Trotz eines US-Exportverbots für leistungsstarke Chips nach China, ist es dem Jungunternehmen gelungen, mit schwächeren Nvidia-Chips und zu einem Bruchteil der Kosten das KI-Modell namens DeepSeek R1 zu lancieren. Nach eigenen Angaben schneidet DeepSeek in den gängigen Leistungstests für sprachliche, mathematische und logische Fähigkeiten sowie Allgemeinwissen, Programmier- und Fachwissen gleich gut und teilweise sogar besser ab als ChatGPT aus den USA.

    Laut DeepSeek soll das Unternehmen lediglich Zugang zu 2’000 Nvidia H800 Rechenchips gehabt haben, eine Angabe, die nicht verifiziert werden kann. Sie wird etwa von Alexander Wang, CEO von Scale AI, das Daten für Trainingsmodelle bereitstellt, angezweifelt. Wang sagte in einem Interview mit dem TV-Sender CNBC, er glaube, dass DeepSeek Zugang zu 50’000 Nvidia-Chips des Typs H100 hatte, was ein Verstoss gegen die US-Exportvorschriften darstellen würde. Zum Vergleich: Das Meta KI-Modell Llama 3 wurde auf zwei Rechenclustern mit je 24’000 H100-GPUs trainiert.

    Verblüffend sind auch die geringen Kosten. Genaue Zahlen, was das Training von R1 gekostet hat, machte DeepSeek zwar nicht öffentlich. Aber das zweimonatige Training von DeepSeek V3, dem Modell, auf dem DeepSeek R1 basiert, soll nur 5.6 Mio. US-Dollar gekostet haben. Zum Vergleich: Das leistungsmässig mit DeepSeek V3 vergleichbare GPT-4o von OpenAI soll 78 Mio. US-Dollar gekostet haben.

    Warum und wie betrifft das den Chip-Hersteller Nvidia, dessen Aktie zu Wochenbeginn um 17 % gefallen sind?
    Das Training und die Entwicklung von KI-Modellen ist nur mit Hochleistungschips möglich. Nvidia ist nicht nur der grösste Anbieter, sondern auch der unangefochtene Technologieführer. Aufgrund der Bedeutung solcher Chips bewertet der Markt Nvidia deutlich höher als andere Techunternehmen. Neben dem starken Umsatzwachstum war diese Bewertungsausweitung einer der grossen Treiber hinter dem Aktienkurs von Nvidia.

      Die Nvidia-Chips vom Typ H100 und H200 zählen aktuell zu den leistungsstärksten beim Trainieren von Sprachmodellen. H100 soll zwischen 25’000 und 40’000 US-Dollar kosten, offiziell hält sich Nvidia zu den Preisen allerdings bedeckt. Der für chinesische Unternehmenskunden aufgelegte H800, eine beschnittene Version des H100, soll in China zu Preisen von bis zu 69’000 USD pro Stück gehandelt worden sein. Seit Oktober 2023 ist auch der Export dieser Chips verboten.

      Der Preis für die Nvidia-Chips ist rund zehnmal höher als die geschätzten Kosten von 3’300 USD pro Chip. Kein Wunder haben Investoren kalte Füsse bekommen und Nvidia-Aktien verkauft. Anleger fragen sich, ob künftig weniger Hochleistungs-Chips mit hohen Margen nachgefragt werden.

      DeepSeek hat sich als innovativer Akteur herauskristallisiert, der zeigt, wie eine effektive Feinabstimmung und strategische Optimierung die Hürde für die Entwicklung leistungsstarker KI-Systeme senken kann. Experten sind sich jedoch einig, dass für gross angelegte, ausgeklügelte Sprachmodelle (Large Language Models – LLMs) leistungsstarke Prozessoren wie jene von Nvidia unverzichtbar sind. Nvidia überschüttet DeepSeek mit kräftigem Lob. Der Konzern geht davon aus, dass der chinesische Durchbruch die Nachfrage nach seinen Produkten sogar zusätzlich befeuern wird.

      Wieso wurden Zulieferer von Rechenzentren, Infrastrukturaktien und Versorger ebenfalls stark abverkauft?
      Bisher gingen Investoren davon aus, dass enorme Investitionen benötigt werden, um leistungsstarke KI-Modelle nutzen zu können. Neben Chips braucht es dazu auch Rechenzentren, deren Betrieb enorm viel Strom verbraucht. Investoren zweifeln nun an den Investitionsplänen für Rechenzentren und der damit verbundenen Energieproduktion.

        Selbst wenn sich KI-Modelle viel effizienter entwickeln und betreiben lassen als bisher angenommen, dürfte der Gesamtstromverbrauch jedoch deutlich zulegen. Kostengünstigere Modelle erlauben neue Anwendungen wirtschaftlich zu betreiben und führen zu erhöhter Nachfrage. Dies führt zwangsmässig zu einem Anstieg des Gesamtstromverbrauchs.

        Wir erwarten daher, dass die Ausgaben für Rechenzentrumsinfrastruktur und die dazugehörige Hardware mittel- bis langfristig weiter steigen werden. Das Anlagethema rund um Rechenzentren und Anbieter von Energieerzeugungsanlagen bleibt attraktiv. Zudem halten wir die Marktreaktion bei Energieunternehmen mit KI-Exposure für übertrieben.

        Dasselbe gilt für den Infrastrukturbereich. Die Stromnetzwerke in den USA sind marode und müssen ersetzt werden. Die Dekarbonisierung und die Digitalisierung werden die Infrastrukturinvestitionen in den nächsten 30 bis 40 Jahren prägen, daran ändert in unseren Augen auch der Durchbruch von DeepSeek nichts.

        Wie geht es jetzt weiter?
        Trotz Exportbeschränkungen und Zugang zu rechenstarker Hardware ist es DeepSeek scheinbar gelungen, die US-Vormachtstellung in Sachen KI ins Wanken zu bringen. Anleger fragen sich, ob die immens hohen KI-Investitionen in den USA gerechtfertigt sind.

          Mark Zuckerberg, CEO von Meta, will an seinen Plänen festhalten und ein Rechenzentrum mit einer Leistung von 2 Gigawatt (GW) bauen. Noch in diesem Jahr will man etwa 1 GW Rechenleistung online bringen und dafür mehr als 1.3 Millionen Grafikprozessoren verbauen und zwischen 60 bis 65 Mrd. US-Dollar in die Hand nehmen. Microsoft will in diesem Jahr 80 Mrd. US-Dollar in KI investieren.

          Die Fortschritte von DeepSeek lassen jedoch viele Anleger zweifeln, ob dies der Anfang vom Ende des rasanten Anstiegs der KI-Investitionen ist. Wir gehen jedoch davon aus, dass der Stein erst richtig ins Rollen kommt. DeepSeek ist eine Weiterentwicklung von KI und ein perfektes Beispiel für die Testzeitskalierung, bei der die Rechenleistung an die Komplexität der Aufgabe angepasst wird. Das KI-Modell R1 überzeugt durch seinen offenen, für alle zugänglichen Quellcode. Dies erlaubt Entwicklern weltweit, das Modell zu analysieren, auf eigene Bedürfnisse anzupassen und weiterzuentwickeln. Sie werden auch die Datenströme untersuchen. Sie werden wissen wollen, ob bei der Anwendung von DeepSeek Nutzerdaten nach China fliessen, und welche das sind.

          DeepSeek hat unserer Meinung nach Unternehmen und Forschungseinrichtungen gezeigt, dass die Entwicklung eigener LLMs nicht zu teuer und zu aufwendig sein muss. Microsoft-Chef Satya Nadella scheint der Entwicklung auch etwas Positives abgewinnen zu können. Auf Social Media schreibt er: Wenn KI immer effizienter und zugänglicher wird, wird ihre Nutzung explodieren und sie zu einer unverzichtbaren Ressource machen.

          Was heisst das für das Verhältnis zwischen den USA und China?
          Die KI-Überraschung aus China trifft die neue US-Regierung auf dem falschen Fuss. Erst letzte Woche kündigte Präsident Donald Trump an, 500 Mrd. US-Dollar in KI investieren zu wollen, um die Vormachtstellung der USA in diesem Bereich zu festigen. Auch wenn er gegenüber Republikanern im Repräsentantenhaus von einem «positiven Weckruf» sprach, so könnte dieser KI-Wettkampf die politischen Beziehungen zwischen den USA und China verschlechtern. DeepSeek hat für einen Gesichtsverlust der USA und der Trump-Regierung gesorgt.

            Die USA werden versuchen, an ihrer Rolle als Supermacht festzuhalten. Trump hat als erste Reaktion auf DeepSeek angekündigt, in sehr naher Zukunft Zölle auf im Ausland produzierte Computerchips und Halbleiter zu erheben. (VP Bank/mc/pg)

            Exit mobile version