Thema:
Re:DeepSeek R1 Konkurrenz overhyped flat
Autor: _bla_
Datum:27.01.25 17:34
Antwort auf:Re:DeepSeek R1 Konkurrenz overhyped von Eidolon

>Das ist ja nichts Neues (siehe Meta Llama)

Es ist aber insofern neu als das diese Modelle einerseits auch mit sehr großen Aufwand trainiert wurden und andererseits qualitativ doch deutlich hinter den Topmodellen hinterher hinkten. Das ist mit DeepSeek R1 anders. Und selbst das ganz kleine Modell mit lediglich 1.5B Parametern ist für viele Zwecke ganz brauchbar. Auch das ist neu.

>Das glaube ich nicht, bisher hält noch jede Firma die komplette Data Lineage (Trainingsdaten -> Training -> Model) geheim und veröffentlicht maximal die trained weights. Kaum vorstellbar, dass das bei DeepSeek anders sein soll.

Es scheint hauptsächlich eine entscheidende Strategie zu sein, die zur guten Performance des Modells führt, nämlich kein Supervised Finetuning, sondern Reinforment Learning. Auf X konnten man schon lesen, das die ersten Reproduktionen schon am laufen sind und gute Ergebnisse zeigen.

>Und "weniger Kosten" ist ja trotzdem noch Nvidia Umsatz... Der in China sowieso schon gedeckelt war wegen der Exportbeschränkungen. Es wird m.E. Jetzt niemand sagen "hey cool dann storniere ich die moderne GPU und gebe mich mit den gleichen Restriktionen wie China zufrieden".

Nö, aber das Ganze könnte gut eine neue Mode anstoßen. Ähnlich wie bspw. der Stellenabbau bei Twitter/X dazu geführt hat, das die großen Techkonzerne auf ihre Personalkosten geschaut haben und jetzt massiv am Stellen abbauen sind oder Stellen nach Indien oder Osteuropa verlegen. Genauso wird jetzt halt auch darauf geschaut werden, dass dort kosteneffizienter gearbeitet wird. Wenn der Bedarf an GPU Leistung zurückgeht, kann eher Druck auf die Preise ausgeübt werden und alternative Lösungen, die nicht die Spitzenleistung von NVIDIA GPUs erreichen, aber wesentlich kostengünstiger sind, werden attraktiver, womit auch der Druck auf die Margen von NVIDIA steigt.


< antworten >