maniac forum | message

Thema:

Re:DeepSeek R1 Konkurrenz overhyped

Autor:

Eidolon

Datum:

27.01.25 16:45

Antwort auf:

Re:DeepSeek R1 Konkurrenz overhyped von _bla_

>Du übersiehst den entscheidenden Punkt: DeepSeek hat einerseits die Gewichte veröffentlicht, so dass jeder das Modell lokal laufen lassen kann

Das ist ja nichts Neues (siehe Meta Llama)

>und für viele Anwendungen wie bspw. Unterstützung beim Programmieren ist Chinesische Propaganda irrelevant.

Ja, da muss ich mir dann wohl mal die Benchmarks anschauen

>Noch viel wichtiger ist es aber, das sie genau veröffentlicht haben, wie sie das Modell trainiert haben und das mit sehr überschaubaren Kosten hinbekommen haben.

Das glaube ich nicht, bisher hält noch jede Firma die komplette Data Lineage (Trainingsdaten -> Training -> Model) geheim und veröffentlicht maximal die trained weights. Kaum vorstellbar, dass das bei DeepSeek anders sein soll. Und "weniger Kosten" ist ja trotzdem noch Nvidia Umsatz... Der in China sowieso schon gedeckelt war wegen der Exportbeschränkungen. Es wird m.E. Jetzt niemand sagen "hey cool dann storniere ich die moderne GPU und gebe mich mit den gleichen Restriktionen wie China zufrieden".

> Es werden immer noch GPUs gebraucht, aber wohl deutlich weniger als bisher.

Das glaube ich irgendwie noch nicht... Werde mir aber jetzt mal die Paper anschauen um hinter den Hype (um DeepSeek) zu schauen.

< antworten >