Il 20 gennaio 2025, la startup cinese DeepSeek ha lanciato DeepSeek-R1, una serie di modelli linguistici open-source all’avanguardia. Contestualmente, ha pubblicato un articolo scientifico in cui illustra le innovazioni introdotte nella fase di addestramento. Le tecniche adottate hanno permesso di ridurre significativamente i costi di addestramento, contenendo la spesa per le GPU sotto i 6 milioni di dollari.
strategia
Deepseek, usarlo in azienda: la guida completa
DeepSeek-R1 richiede una strategia che valuti obiettivi aziendali, rischi e costi. Aziende possono scegliere tra API, self-hosting o approcci ibridi per integrare l’LLM in modo efficace e sicuro
DATA & AI Engineer @ P4I
DATA & AI Software Engineer @ P4I
Cybersecurity Advisor @ P4I

Continua a leggere questo articolo
Argomenti
Canali