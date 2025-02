Nvidia

Microsoft

Goldman Sachs

(Teleborsa) -è una startup cinese diondata nel 2023 da. La società ha sede ad Hangzhou e si distingue per lo sviluppo di Large Language Model altamente performanti, che sulla carta richiedono moltasia per la fase di addestramento che per quella cosiddetta di "inferenza", ovvero di utilizzo del modello stesso. L’ultima versione di Deepseek è stata rilasciata il 25 Gennaio 2025 ed in poche ore l'app omonima ha superato i numeri di download dinegli Stati Uniti.Uncosì ampio è da ricercare principalmente nelle, che effettivamente raggiunge la qualità di ChatGPT (in alcuni casi funziona anche meglio, ad esempio come aiuto per la scrittura di codice è molto più preciso nelle descrizioni delle righe generate). Deepseek è disponibile per tuttiattualmente infatti non esiste un revenue model B2C, mentre i guadagni dovrebbero provenire in futuro principalmente da declinazioni corporate e B2B.Il modello protagonista dei dibattiti attuali è, ed è salito agli onori della cronaca per richiedere una potenza di calcolo incredibilmente inferiore rispetto alla concorrenza. L’intelligenza artificiale made in china nasce infatti come risposta alla politica di dazi americani, che avevano reso l’acquisizione dellenecessarie per il training del modello estremamente più costose, con lo scopo di limitare la Cina nella creazione di strumenti AI realmente competitivi. In tutta risposta Liang ha rilasciato un LLM competitivo che è, contro i 100 milioni spesi da OpenAI nel 2023 per GPT 4 (questo sempre stando ai dati rilasciati da Deepseek).Come se non bastasse, gli algoritmi di Deepseek sono sempre stati rilasciati con; questo vuol dire che chiunque possa essere interessato può scaricare da GitHub (il maggior repository al mondo di software) tutto il codice sorgente del modello, per creare un Deepseek eventualmente modificato secondo le proprie esigenze, senza dover pagare nulla alla società (e infatti alcuni ricercatori dellain California hanno realizzato una, utilizzando il core di Deepseek, con un investimento di circa 30 dollari).Prima di continuare su questo punto è necessaria una precisazione: un Large Language Model (abbreviato LLM), al massimo può imparare come interagire al momento, quali argomenti preferiamo e quali linguaggio siamo abituati ad utilizzare, ma queste cose sono limitate alla sessione in corso ed una volta che viene avviata unapraticamente. Questo non vale solo per Deepseek ma anche per GPT, Gemini, Claude e attualmente tutti gli altri LLM.Perché una intelligenza artificiale diventi, abbandonando lo stato di puro codice fine a se stesso, ha bisogno di, quella die quella diDurante la fase di addestramento vienesu cui si baserà ladell’AI. Questi dati devono essere il più numerosi e eterogenei possibile, OpenAI ad esempio ha stretto una partnership conper sfruttare i dati provenienti da Bing, mentre Gemini essendo di proprietà diha accesso ad un dataset estremamente vasto. Nel caso di Deepseek non è stata specificata con precisione la provenienza dei dati, che stando a quanto dichiara la compagnia provengono interamente da fonti libere ed open source.Addestrare un LLM è un processo estremamente complesso che. In questo caso, i dati rilasciati da Deepseek parlano di circa 2000 gpu H800 di Nvidia che hanno impiegato 55 giorni a completare l’addestramento. Per fare un paragone immediato, OpenAI avrebbe impiegato 8000 gpu H100 che hanno richiesto circa 90 giorni per completare l’elaborazione del dataset di GPT 4.in termini di calcolo, ma molto meno della fase di addestramento. Anche in questo caso però i dati rilasciati da Deepseek presenterebbero una ottimizzazione radicale che consentirebbe un risparmio molto importante.Relativamente a quanto abbiamo visto finora,: è disponibile per chiunque voglia usarlo o modificarlo, è gratuito, richiede datacenter minuscoli rispetto a quelli che abbiamo visto fino ad oggi e non ha nulla da invidiare agli LLM più costosi e famosi. Tutto questo ha portato ad una, perché l’associazione che hanno fatto i mercati è stata più o meno questa: le AI possono funzionare con il decimo della potenza di calcolo, quindi le GPU Nvidia venderanno un decimo nel prossimo futuro.Una ottimizzazione così radicale è davvero possibile? In realtà iche si sono aperti sulla vicenda cominciano a diventare sempre più numerosi ed ingombranti. Per cominciare, Deepseek afferma di aver utilizzato(versione depotenziata e destinata al mercato cinese delle più performanti H100 usate da Nvidia), ma è noto che la società ne ha acquistate un numero che oscilla intorno alle; oltre a questo, Bloomberg ha riportato che Washington starebbe indagando sull'acquisizione da parte della società di circaattraverso un tramite di Singapore.Anche sulle performance stanno nascendo non pochi dubbi: secondo l’azienda Deepseek hao1 su benchmark come l’American Invitational Mathematics Examination (AIME). Il Wall Street Journal però ha affermato che quando lo ha utilizzato per risolvere 15 problemi dall'edizione 2024 di AIME,ha raggiunto unaSecondo il Financial Times infine, OpenAI avrebbe delle prove inconfutabili del fatto che la versione; quindi è vero che si è risparmiata una notevole potenza di calcolo, ma solo perchè era già stata utilizzata per un altro addestramento.L’aspetto più particolare della vicenda è però legato alla: Deepseek è una startup fondata da Liang Wenfen nel 2023, che ne è anche l’amministratore delegato. Ildi Deepseek è il, di cui Liang è uno dei co-fondatori dal 2016. High-Flyer è la prosecuzione naturale dei successi nel trading a cui il fondatore di Deepseek si dedica durante la crisi del 2007-2008, ed infatti, seguendo la passione originale, nel 2019, trasforma High-Flyer in un, per arrivare al 2021, in cui High-Flyer comincia ad utilizzare esclusivamente l'intelligenza artificiale nel trading. Se a questo aggiungiamo il fatto che, secondo un report della società di analisi online americana Graphika, alcuni account social legati al governo cinese avrebbero lavorato per spingere il lancio di Deepseek R1 e dei dati relativi che ne hanno accompagnato il rilascio (di cui abbiamo visto ben più di un motivo per dubitarne), si potrebbe pensare che sia stata fatta una mossa dal duplice risultato: da una parteproclamati dal neoeletto presidente Trump, dall'altro High-Flyer potrebbe avere fatto, facendo una manovra che però a questo punto potrebbe diventare legalmente discutibile.In tutta questa situazione particolarmente complessa è giusto scorgere anche: prima di tutto, in Italia Deepseek è ancora accessibile attraverso il sito, l’unica cosa ad esseretemporaneamente è la(potreste però trovarla negli store proprietari di Huawei, Oppo e Xiaomi, o addirittura scaricarla dal sito ufficiale), inoltre, per quanto colpiti direttamente,di OpenAI ha dichiarato che il debutto di Deepseek nello scenario AI mondiale, con un prodotto di questa qualità, non potrà far altro che dare uno, portando quindi ad unaa, in cui, secondo, quest’anno dovrebbero essere raggiunti i