DEEPSEEK R1 dà un calcio al tavolo.

in Italy5 days ago

DEEPSEEK R1 dà un calcio al tavolo.



Souce


Quasi 2 trilioni di dollari di aziende tecnologiche sono scomparse in borsa in poche ore fa, il motivo è la nuova versione dell'intelligenza artificiale cinese chiamata Deepseek R1, che è in grado di superare tutte le intelligenze artificiali con un utilizzo di risorse infinitamente inferiore. rispetto ai suoi concorrenti.


È chiaro che esiste una corsa tra le superpotenze tecnologiche, ma una startup cinese è emersa come un contendente inaspettato Deepseek ha sviluppato un’intelligenza artificiale superiore a quelle occidentali, ma sfida anche le norme stabilite su come questi modelli sono costruiti e su come sono finanziati con un approccio all’insegna dell’efficienza e dell’innovazione.


Deepseek ha dimostrato che è possibile competere con l’élite dell’Intelligenza Artificiale, senza dipendere dalle risorse illimitate che hanno caratterizzato fino ad oggi i Giganti Occidentali.


Il 20 gennaio l'azienda tecnologica cinese ha lanciato il suo modello Deepseek R1, un sistema parzialmente open source che è diventato rapidamente il centro dell'attenzione nella Silicon Valley. La cosa interessante è che Deepseek R1 non è solo un modello di Intelligenza Artificiale.


Deepseek R1 supera modelli leader come OpenAi in vari test di matematica e ragionamento, questo risultato non è solo impressionante per la sua abilità tecnica ma anche per la sua efficacia, efficienza in termini di costi e approccio open source, che lo rende un'alternativa molto attraente per ricercatori e sviluppatori .


Deepseek R1 non solo eguaglia le prestazioni dei modelli occidentali, ma lo fa utilizzando una frazione delle risorse computazionali e questa è la chiave, ad esempio, il modello Deepseek R1 richiedeva un decimo della potenza di calcolo utilizzata per addestrare ad esempio il modello chiamato 3.1 meta.



Souce


E questa efficienza è il risultato di una combinazione di innovazioni tecniche, come l'attenzione latente multi-head che chiama MLA, e l'approccio di mixaggio esperto che consente al modello di ottimizzare l'uso delle risorse senza sacrificare le prestazioni, il programma proprio come il suo la controparte americana richiede l'uso di qualcosa chiamato catene di pensiero che imitano i processi di ragionamento umano con una precisione quasi inquietante.


Questo sistema non è nato dal nulla, è stato addestrato dal funzionamento di chatgpt v3 sviluppato sempre da Deepseek utilizzando tecniche di apprendimento per rinforzo che premiano non solo la risposta corretta, ma anche la capacità del sistema di spiegare il proprio pensiero e lo fa durante la Per risolvere i problemi, ma non è tutto, i ricercatori hanno portato questo modello un ulteriore passo avanti implementando qualcosa chiamato "architettura di mixaggio esperto".


La “expert mix architecture” è un’Innovazione che permette al modello Maqui di decidere con una freddezza quasi guerriera quali reti di elaborazione attivare per ogni specifico compito, il risultato è una macchina che non solo pensa, ma lo fa in maniera strategica e efficiente, inoltre, è in grado di emulare il ragionamento umano in modo abbastanza efficace utilizzando “catene di pensiero” che imitano i processi cognitivi umani


Deepseek R1 costa un trentesimo di quanto significhi utilizzare Open Ai 01, il che non solo democratizza l'uso dell'Intelligenza Artificiale, ma solleva anche una domanda molto scomoda per i colossi occidentali: come è possibile che un modello cinese sviluppato in un contesto di restrizioni e sanzioni ha raggiunto un tale risultato.


Il costo per addestrare questo prodigio tecnologico si aggira intorno ai 6 milioni di dollari, una cifra che rispetto agli oltre 60 milioni di meta investiti in Llama sembra quasi ridicola o ai miliardi che gli altri utilizzano, questo enorme risparmio di risorse informatiche non è solo un risultato tecnico, è un calcio sul tavolo che scuote il mondo fondamenti del settore.


Il costo per addestrare questo prodigio tecnologico si aggira intorno ai 6 milioni di dollari, una cifra che rispetto agli oltre 60 milioni di meta investiti in Llama sembra quasi ridicola o ai miliardi che gli altri utilizzano, questo enorme risparmio di risorse informatiche non è solo un risultato tecnico, è un calcio sul tavolo che scuote il mondo fondamenti del settore.


Siamo in un momento in cui l’efficienza e l’innovazione hanno dimostrato di essere più potenti delle risorse illimitate e del potere finanziario, quello che viene dalla Silicon Valley,


Il bello arriverà nei prossimi mesi, a livello di intelligenza artificiale e politica l’anno non è iniziato per niente noioso.


Rimani libero




Sort:  

Un'altra cosa interessante di tutto questo è che le élite hanno la convinzione di poter mantenere la supremazia tecnologica nel momento in cui hanno riorganizzato gli standard di istruzione, senza dare conto che per avere la tecnologia è il livello degli ingegneri, i fisici o la matematica sono importanti.

saluti

I believe when it comes to the world of business or stock, there is bound to be ups and down, I believe soon that DEEPSEEK will definitely bounce up back in no time. I am so sure of that

L'occidente è così presuntuoso che sottovaluta sempre ciò che è al di fuori dei suoi confini..

interessante riflessione su ia , è proprio vero che l ia non ha bisogno di triliardi di $ ma di bravi sviluppatori che riescano a renderla sempre piu efficente e all avanguardia con i tempi

Coin Marketplace

STEEM 0.20
TRX 0.25
JST 0.039
BTC 101987.32
ETH 3242.23
SBD 3.99