Gemini 1.5: modelul AI de nouă generație al Google este aproape gata

La doar două luni de la lansarea Gemini, modelul de limbă mare pe care Google speră să-l aducă în vârful industriei AI, compania își anunță deja succesorul. Google lansează astăzi Gemini 1.5 și îl pune la dispoziție dezvoltatorilor și utilizatorilor întreprinderilor înainte de lansarea completă pentru consumatori care va veni în curând. Compania a precizat că este totul în Gemeni ca instrument de afaceri, asistent personal și tot ce se află între ele și face eforturi pentru acest plan.

Există o mulțime de îmbunătățiri în Gemini 1.5: Gemini 1.5 Pro, modelul de uz general din sistemul Google, este aparent la egalitate cu Gemini Ultra de ultimă generație pe care compania l-a lansat abia recent și a depășit Gemini 1.0 Pro cu 87 la sută. de teste de referinţă. A fost realizat folosind o tehnică din ce în ce mai comună cunoscută sub numele de „Amestec de experți” sau MoE, ceea ce înseamnă că rulează doar o parte a modelului general atunci când trimiteți o interogare, mai degrabă decât să proceseze tot timpul. (Iată un bun explicator al subiectului.) Această abordare ar trebui să facă modelul mai rapid de utilizat și mai eficient pentru rularea de către Google.

Dar există un lucru nou în Gemini 1.5 care are întreaga companie, începând cu CEO-ul Sundar Pichai, deosebit de entuziasmată: Gemini 1.5 are o fereastră de context enormă, ceea ce înseamnă că poate gestiona interogări mult mai mari și poate analiza mult mai multe informații simultan. Această fereastră reprezintă 1 milion de jetoane, comparativ cu 128.000 pentru GPT-4 de la OpenAI și 32.000 pentru Gemini Pro actual. Tokenurile sunt o măsură dificil de înțeles (iată o defalcare bună), așa că Pichai simplifică totul: „Sunt aproximativ 10 sau 11 ore de videoclip, zeci de mii de linii de cod.” Fereastra de context înseamnă că puteți întreba botul AI despre tot acel conținut simultan.

(Pichai spune, de asemenea, că cercetătorii Google testează o fereastră de context de 10 milioane de simboluri – asta este, de exemplu, întreaga serie de Game of Thrones dintr-o dată.)

În timp ce îmi explică asta, Pichai observă fără îndoială că poți să se potrivească întregul Stapanul Inelelor trilogie în acea fereastră de context. Acest lucru pare prea specific, așa că îl întreb: asta s-a întâmplat deja, nu-i așa? Cineva din Google doar verifică pentru a vedea dacă Gemenii observă erori de continuitate, încercând să înțeleagă descendența complicată a Pământului de Mijloc și văd dacă poate AI poate înțelege în sfârșit un sens lui Tom Bombadil. „Sunt sigur că s-a întâmplat”, spune Pichai râzând, „sau se va întâmpla – unul dintre cei doi”.

Pichai crede, de asemenea, că fereastra de context mai mare va fi extrem de utilă pentru afaceri. „Acest lucru permite cazuri de utilizare în care puteți adăuga o mulțime de context și informații personale în momentul interogării”, spune el. „Gândiți-vă la asta, deoarece am extins dramatic fereastra de interogare.” Își imaginează cineaștii ar putea să-și încarce întregul film și să-i întrebe pe Gemeni ce ar putea spune recenzenții; vede companii care folosesc Gemeni pentru a cerceta mase de înregistrări financiare. „O văd ca una dintre cele mai mari descoperiri pe care le-am făcut”, spune el.

Deocamdată, Gemini 1.5 va fi disponibil doar pentru utilizatorii de afaceri și dezvoltatorii, prin Vertex AI și AI Studio de la Google. În cele din urmă, va înlocui Gemini 1.0 și versiunea standard a Gemini Pro – cea disponibilă pentru toată lumea la gemini.google.com iar în aplicațiile companiei — va fi 1.5 Pro cu o fereastră de context de 128.000 de jetoane. Va trebui să plătiți în plus pentru a ajunge la milion. De asemenea, Google testează limitele etice și de siguranță ale modelului, în special în ceea ce privește noua fereastră de context mai mare.

Google se află într-o cursă vertiginoasă pentru a construi cel mai bun instrument de inteligență artificială chiar acum, în timp ce companiile din întreaga lume încearcă să-și descopere propria strategie de inteligență artificială – și să semneze acordurile de dezvoltare cu OpenAI, Google sau altcineva. Chiar în această săptămână, OpenAI a anunțat „memorie” pentru ChatGPT și se pare că se pregătește pentru un impuls în căutarea pe web. Până acum, Gemenii par să fie impresionanți, mai ales pentru cei aflați deja în ecosistemul Google, dar mai e mult de lucru din toate părțile.

În cele din urmă, îmi spune Pichai, toate aceste 1.0 și 1.5 și pro și ultra și bătăliile corporative nu vor conta cu adevărat pentru utilizatori. „Oamenii vor consuma doar experiențele”, spune el. „Este ca și cum ai folosi un smartphone fără să fii mereu atent la procesorul de dedesubt.” Dar în acest moment, spune el, suntem încă în faza în care toată lumea cunoaște cipul din interiorul telefonului, pentru că contează. „Tehnologia de bază se schimbă atât de repede”, spune el. „Oamenilor le pasă.”

Citeste si articolele de mai jos

Lasa un comentariu