DeepSeek pregătește lansarea modelului AI V4, cu o scalare masivă a parametrilor - Stiri - GAMELIFE România Jump to content

DeepSeek pregătește lansarea modelului AI V4, cu o scalare masivă a parametrilor


Recommended Posts

  • Administrators
Posted

rssImage-95f57b431eea6efbd1a2c00a682eec0f.jpeg

DeepSeek se apropie de lansarea unei noi generații de model de inteligență artificială, denumită V4, care ar putea debuta spre finalul lunii aprilie.

Noul sistem promite un salt semnificativ în performanță și marchează o etapă importantă în evoluția tehnologiilor AI dezvoltate în China.

Un model de dimensiuni impresionante

Potrivit informațiilor apărute până în prezent, DeepSeek V4 ar putea integra aproximativ un trilion de parametri, o valoare care îl plasează în categoria celor mai avansate modele existente.

Modelul utilizează o arhitectură de tip Mixture-of-Experts, care activează doar o parte din parametri pentru fiecare sarcină. Această abordare permite menținerea costurilor de operare la un nivel controlat, în timp ce oferă performanțe ridicate.

Eficiență și scalabilitate

Prin activarea a aproximativ 32-37 de miliarde de parametri pentru fiecare operațiune, modelul reușește să combine dimensiunea mare cu eficiența. Această strategie permite extinderea capacităților fără o creștere proporțională a resurselor necesare pentru rulare.

Conceptul nu este nou pentru companie, însă V4 duce această abordare la un nivel superior, atât din punct de vedere al dimensiunii, cât și al optimizării.

Tehnologie bazată pe infrastructură chineză

Un element esențial al acestui proiect îl reprezintă utilizarea procesoarelor dezvoltate de Huawei, din gama Ascend. Alegerea acestor componente reflectă o orientare strategică către dezvoltarea unui ecosistem tehnologic independent.

Decizia de a colabora cu furnizori locali, în detrimentul unor companii precum NVIDIA sau AMD, sugerează o schimbare de direcție în industria AI din China.

Capacitate extinsă de procesare a contextului

Un alt aspect intens discutat este posibilitatea ca modelul să suporte un context de până la un milion de tokeni. Deși această specificație nu a fost confirmată oficial, există indicii că arhitectura tehnică ar putea susține o astfel de capacitate.

Cercetările recente ale companiei în domeniul memoriei condiționale indică o orientare clară către modele capabile să gestioneze volume mari de informații într-o singură interacțiune.

Lansare amânată, dar iminentă

Modelul V4 a fost deja amânat de două ori, iar calendarul exact rămâne incert. Totuși, testele recente ale unei versiuni preliminare, denumită V4-Lite, sugerează că lansarea completă este aproape.

Industria urmărește cu atenție acest moment, în condițiile în care fiecare nou model lansat de DeepSeek a avut un impact semnificativ asupra pieței.

Un posibil moment de cotitură în industria AI

Dacă specificațiile vehiculate se confirmă, DeepSeek V4 ar putea reprezenta un punct de referință atât din punct de vedere tehnologic, cât și strategic. Combinația dintre performanță ridicată, eficiență și independență față de furnizorii occidentali ar putea influența direcția întregii industrii.

Rămâne de văzut dacă lansarea va avea loc conform estimărilor, însă așteptările sunt deja ridicate.

Articolul DeepSeek pregătește lansarea modelului AI V4, cu o scalare masivă a parametrilor apare prima dată în Go4IT.

View the full article

Donator: SteamDB

Donator: SteamLadder

Steam Level Up: https://slvlup.com/r/krrna6

Steam™ Hour Boosting!: https://freehourboost.com/?r=cosminzm

3177671.png

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Recently Browsing   0 members

    • No registered users viewing this page.


×
×
  • Create New...

Important Information