Google aruncă mănușa cu Gemini – motorul său genAI multimodal

Google a anunțat joi că a făcut-o reconstruit și redenumit chatbot-ul său Bard — numit acum zodia Gemeni — pentru a oferi întreprinderilor și consumatorilor prima platformă multimodală generativă AI (genAI) din industrie, care nu se mai bazează doar pe text pentru a oferi răspunsuri asemănătoare oamenilor.

Lansarea Gemini reprezintă o provocare directă pentru Copilot de la Microsoft, care se bazează pe ChatGPT de la OpenAI, și pentru orice alt chatbot bazat doar pe tehnologia modelului de limbă mare (LLM).

„Acesta (Gemeni) este în prezent singurul model nativ multimodal generativ AI disponibil”, a spus Chirag Dekate, analist vicepreședinte la Gartner. „Google nu mai joacă un catch-up. Acum, este invers.”

Dekate i-a numit pe Gemeni „o problemă foarte mare”, deoarece cu un model multimodal, un singur motor genAI îndeplinește sarcini individuale cu mai multă acuratețe, deoarece învață dintr-un corp de cunoștințe mult mai mare. În esență, îl catapultează pe Google în fruntea pachetului genAI.

Google și-a dezvăluit pentru prima dată modelul Gemini AI în decembriepromovând capabilități multimodale care îi permit să combine diferite tipuri de informații – intrări și ieșiri – inclusiv text, cod, audio, imagini și video.

Spre deosebire de motoarele AI numai pentru LLM, cum ar fi GPT de la OpenAI, Llama 2 de la Meta sau chiar PaLM 2 de la Google – toate care alimentează chatboții de astăzi – Gemini nu se bazează pe aceeași tehnologie. În schimb, poate fi antrenat folosind toate tipurile de media și conținut.

Acest lucru contează, deoarece o întreprindere poate acum să creeze un chatbot care nu se mai limitează la încărcarea răspunsurilor la interogări din textul pe care a fost instruit LLM.

„Când mă uit la un film, mă uit la videoclip, citesc textul (subtitrări), ascult audio și totul se întâmplă simultan, creând o experiență hiper-imersivă”, a spus Dekate. „Aceasta este multimodalitate într-un Pe scurt. Comparați acest lucru cu experiența unui film citind singur scenariul acestuia (LLM); aceasta este diferența dintre LLM și multimodalitate.”

Anul trecut, a spus Dekate, a fost un an al ideilor, deoarece întreprinderile și consumatorii au aflat despre genAI și chatboți în urma lansării ChatGPT la sfârșitul anului 2022. Acum, întreprinderile înțeleg mai bine posibilitățile genAI și își deschid portofelele pentru a cheltui o sumă semnificativă pentru infuzați sistemele back-end și front-end cu el.

Dacă sunteți o companie de asistență medicală, de exemplu, care încearcă să proiecteze un chatbot mai captivant pentru medici, un motor multimodal genAI poate ingera fragmentele audio ale unui medic, imagini radiologice și scanări video RMN pentru a crea prognoze și rezultate mult mai precise ale tratamentului.

„Acest lucru creează o experiență personală hiper-imersivă. Nimic din toate acestea nu este posibil folosind o simplă experiență LLM”, a spus Dekate. „Dacă Google poate permite întreprinderilor și consumatorilor să experimenteze această experiență multimodală, atunci Google are șansa de a schimba cota de piață.”

În 2024, cheltuielile pentru soluțiile genAI sunt de așteptat să ajungă 40 de miliarde de dolariîn creștere de la 19,4 miliarde USD în 2023. Până în 2027, cheltuielile genAI sunt de așteptat să atingă 143 miliarde USD, cu o rată de creștere anuală compusă pe cinci ani de 73,3%, conform firmei de cercetare IDC.

„Ceea ce am văzut anul trecut a fost apariția unor modele specifice sarcinilor – text-to-text, text-to-image, text-to-video, image-to-ext etc.”, a spus Dekate. „Fiecare sarcină avea propriul său model. Deci, dacă aveți o sarcină restrânsă de text-to-text, atunci LLM-urile funcționează bine.”

Modelul de abonament Gemini de 20 de dolari pe lună al Google pare, de asemenea, menit să preia cota de piață de la liderul Microsoft.

Clienții din SUA se pot abona pentru 19,99 USD pe lună pentru a accesa Gemini Advanced, care include o versiune mai puternică Model Ultra 1.0 AI. Abonații vor primi doi terabytes de stocare în cloud, care costă de obicei 9,99 USD pe lună și în curând vor avea acces la Gemini în Gmail și suita de productivitate a Google.

Google este nou Un plan AI Premium este răspunsul său pentru Microsoft și partenerul său genAI OpenAI, care a dezvoltat GPT LLM care alimentează ChatGPT.

„O parte din aceasta concurență cu Microsoft și o parte este aceea de a oferi servicii premium (clienților săi), în principal utilizatorilor de birouri de afaceri care plătesc deja”, a declarat analistul principal Jack Gold la J.Gold Associates. „De asemenea, dacă percepeți o taxă, limitați numărul de utilizatori care s-ar fi conectat gratuit. Acest lucru vă oferă posibilitatea de a remedia orice probleme observate de un număr mai limitat de utilizatori și oferă un flux de venituri pentru a menține pasul. inginerie, mai degrabă decât să te bazezi pe reclame pentru a plăti pentru asta”.

Există și problema costului pentru Google, pentru că nu este ieftin să antrenezi un model AI mare în centrele de date.

„Nu sunt sigur cum sunt plătiți dacă rulează toată această inteligență artificială în fundal, ceea ce necesită mult mai multă putere de procesare, iar puterea este una dintre cele mai mari cheltuieli pentru rularea unui cloud/centru de date”, a spus Gold.

„Ceea ce este uimitor la Gemeni este că este atât de bun la atât de multe lucruri”, a spus Dennis Hassabis, CEO-ul Google DeepMind. „Pe măsură ce am început să ajungem la sfârșitul antrenamentului, am început să vedem că Gemenii a fost mai bun decât orice alt model de acolo la aceste repere foarte importante. De exemplu, fiecare dintre cele 50 de domenii diferite pe care le-am testat, este la fel de bun ca cel mai bun om expert în acele domenii.”

ChatGPT Plus de la OpenAI în urmă cu un an a fost pionier pe piață pentru achiziționarea de acces timpuriu la modele AI și alte funcții, în timp ce Microsoft a anunțat recent un abonament concurent pentru AI în programe precum Word și Excel. Ambele abonamente costă 20 USD pe lună în Statele Unite.

Drepturi de autor Cititi mai multe informatii interesante mai jos!


Va invit sa cititi si articolele de mai jos pe langa acestea care sunt cele mai recente

Lasa un comentariu