Die KI-Welle rollt weiter

Vielleicht seit Ihr in den vergangenen Wochen mal über das Wort / die Software DeepSeek gestolpert, das ist ein chinesisches KI-Paket, welches nicht nur online getestet werden, sondern, da OpenSource, sogar via GitHub heruntergeladen und auf eigener Hardware installiert werden kann, weiterhin interessant finde ich aktuell NotebookLM.google.com – wo man mit bis zu 50 Uploads/Informationen sein eigenes „Notebook“ erstellen kann und Notizen sowohl zusammengefasst bekommt, aber auch ergänzt – wenn man möchte.

Zurück zu DeepSeek v3, welches inzwischen sogar OpenAI 4o übertreffen soll – aber ob auch das kommende OpenAI o3 Model bleibt abzuwarten.

Weiterhin im KI-Spiel mischt anthropic Claude 3.5 mit, sowie Facebook/Meta’s Llama (bald in der Version 2.0 und zudem in Facebook und Instagram integriert), Google’s LaMDA / Gemini (weniger für die Suche, aber vor allem auf „Smart“Phones, X’s Grok und- ebenfalls chinesisch – Alibaba’s Qwen 2.5.

Insgesamt zeigt sich, dass das KI-Spiel immer noch US-dominiert ist, chinesische Firmen aber stark aufholen (könnten).
Europa, Afrika, AustralAsia – aktuell noch Fehlanzeige..

We present DeepSeek-V3, a strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token. To achieve efficient inference and cost-effective training, DeepSeek-V3 adopts Multi-head Latent Attention (MLA) and DeepSeekMoE architectures, which were thoroughly validated in DeepSeek-V2…

DeepSeek v3 | GitHub