
deepseek v4: die billige chinesische ia, die opus 4.6 überschreitet
Es ist 484 Tage seit dem "DeepSeek-Moment" und es ist schon hier. Tiefsee v4, eins IA von Open Source die versprechen, die Domain von Riesen wie Anthropic, OpenAI oder Google zu brechen.
Die Modell kommt in zwei Aromen:
- Pro: 1,6 Milliarden Parameter (1.6 T) mit 49 Milliarden aktiven Parametern.
- Flash: 248 Milliarden Parameter (248 B) mit 13 Milliarden aktiven Parametern.
Beide Versionen verwenden eine ArchitekturMixtur-of-Experts (MoE), was bedeutet, dass bei jeder Inferenz nur ein Bruchteil der Parameter aktiviert wird. Dadurch wird das Kontextfenster auf eine Million Token (vor 128 000) und der Verbrauch auf 27% der Tokengeschäfte und 10% KV-Cache bezüglich der Version v3.2.
In Nachweis intern, die Variante V4-Pro-Max Übergänge oder Gleiche Modelle wie Claude Opus 4.6 Max, GPT-5.4 xHigh, Gemini 3.1 Pro High, Kimi K2.6 und GLM 5.1. Im Programmier-Benchmark LiveCodeBuch Es ist 93,5% Punktzahl, im Vergleich zu 88,8% Opus 4.6 und 91,7% Gemini 3.1 Pro.
Die Preis ist ein weiterer starker Punkt: DeepSeek v4 Pro Kosten 1,74 USD pro Million Tonnen Input und 3,48 USD pro Million Output, bis sieben Mal weniger als Opus 4,7 und fast neun Mal weniger als die neue GPT-5.5. Die Version Flash bis zu 0,14 USD / 0,28 USD pro Million Token, während GPT-5.4 Mini Er zahlt bis zu 16 Mal mehr.
Was die Hardware betrifft, hat DeepSeek nicht die genaue Ausrüstung, sondern behauptet, dass das Modell so viel auf Chips funktioniert NVIDIA wie im Anhang Huawei, mit voller Unterstützung in den Ascend 950 Clustern. Diese Kompatibilität hat in den USA Besorgnis erweckt. USA, weil es die Abhängigkeit von NVIDIA-Chips reduziert.
Die Einführung steht im Einklang mit der Abfahrt von mehreren wichtigen Talenten in Richtung ByteDance und Xiaomi, und mit einer Runde der Finanzierung von $300 Millionen das würde das Unternehmen in 20 Milliarden. Nach dem "DeepSeek-Moment" von 2025 markiert das v4 Modell den Übergang von der Überraschung zur Kontinuität und hält die Macht auf einen extrem niedrigen Kosten.
Warum ist Moe-Architektur der Schlüssel?
Die Mosambik nur einen Teil des Milliarden von Parametern wird auf jeder Anfrage aktiviert, was den Rechenverbrauch drastisch reduziert. Zusätzlich wurde das Kontextfenster auf eine Million Token, die die Einführung von Texten der Größe eines vollständigen Romans in einer einzigen Konsultation erlaubt.
Das Effizienz wird in eine Nutzung übersetzt 27% der Tokengeschäfte und nur 10% KV-Cache in Bezug auf die vorherige Version, machen DeepSeek v4 viel schneller und billiger.
Benchmarks, die Riesen zittern lassen
In internen Beweisen, V4-Pro-Max gleich oder größer Claude Opus 4.6 Max, GPT-5.4 xHigh, Gemini 3.1 Pro High, Kimi K2.6 und GLM 5.1. Im Programmier-Benchmark LiveCodeBuch erreichte 93,5% Punktzahl, über 88,8% von Opus 4.6 und näherte sich 91,7% von Gemini 3.1 Pro.
Preis des Wahnsinns: wie viel kostet es wirklich?
Die Kosten von DeepSeek v4 Pro sind von 1,74 USD pro Million Token-Input und 3,48 USD pro Million Output, was bedeutet, bis zu sieben Mal weniger als Opus 4.7 und fast neunmal weniger als GPT-5.5. Die Version Flash bis zu 0,14 USD / 0,28 USD pro Million Token, während GPT-5.4 Mini Er zahlt bis zu 16 Mal mehr.
