Competiția companiilor tech în domeniul inteligenței artificiale în special aici în zona Large Language Models parte din categoria mai mare generative AI se întețește. Google după ce a testat o vreme Google Bard în modul „Experimental” și-a îmbunătățit serviciul, i-a dat și o aplicație dedicată numită Gemini, și acum Google Bard se va denumi Google Gemini așa cum anunțau încă de la începutul lunii Decembrie 2023.
Timpul nostru de utilizare al fiecărui produs / serviciu este ceea ce determină în ce investesc marile companii de tehnologie, mai ales atunci când vorbim de inteligență artificială unde computerele trebuie să învețe de undeva cum să recunoască lucruri în imagini, cum să genereze imagini, cum să recunoască sunete, etc. și de unde să învețe mai bine dacă nu de la noi. Dar pentru ușurință, confort, trecem și peste dezavantajele utilizării tehnologiilor AI și uite așa am ajuns aici.
Introducere pentru cei care au trăit departe de tehnologie în ultimii doi ani
Large Language Model – este o tehnologie dezvoltată ca multe dintre cele pe care le folosim astăzi pe o perioadă de zeci de ani.
Cum funcționează ultra-simplificat:
- Dai unor servere conținut text să îl proceseze (de preferat conținutul servit să fie de calitate).
- După ce procesarea este finalizată, poți folosi modelul antrenat într-o interfață grafică care primește ca input text scris de un utilizator.
- Sistemul în baza miliardelor de articole, cărți și texte servite de pe Internet va genera ca răspuns un text care să aibă sens în mod statistic în funcție de ce text ai introdus inițial.
Poate fi o întrebare, o cerință să îți creeze un text, sau poți chiar cere în baza unui text mai mare să îți genereze o alternativă la text, un răspuns și așa mai departe. Sunt multe lucruri pe care le poate face: de la a sintetiza texte, la a le corecta sau a le aranja cum dorești poate cu liniuță sau într-un tabel.
Problema mare cu aceste LLM-uri este că au și o rată de eroare. Se folosește des termenul de „halucinare” pentru că textul cu care răspunde sistemul deși pare corect conține nu de puține ori erori subtile. Spre exemplu dacă ceri date despre evenimente istorice sau textul ca input de analizat este prea lung, sistemul fie nu va putea genera un răspuns corect, complet fie nu va putea dezvolta suficient de mult răspunsul.
Mai multe persoane și companii au adus contribuții importante pentru a ajunge la această tehnologie încă de la primele computere inventate. Scurtă istorie a tehnolgoiei:
- 1950 – Apariția Machine Learning-ului: Arthur Samuel dezvoltă un program pentru jocul de dame, introducând termenul „machine learning” pavând calea pentru modelele predictive viitoare.
- 1966 – ELIZA și NLP-ul: Cercetătorul MIT Joseph Weizenbaum creează ELIZA, primul program NLP care imita conversația umană, demonstrând potențialul interacțiunii om-computer.
- 1989 – World Wide Web: Inventarea WWW de către Tim Berners-Lee oferă LLM-urilor acces la cantități masive de date, alimentând dezvoltarea lor.
- 2014 – Rețele Neural Adversative Generative: Ian Goodfellow introduce GAN, tehnică ce ajută LLM-urile să genereze text mai realist și mai creativ.
- 2020-2023 – Modele Mari de Limbaj de Ultima Generație: Modele precum, GPT, LaMDA, PaLM 2 de la Google și acum Gemini ating performanțe impresionante în traducere, scriere creativă și dialog, popularizând și mai mult domeniul LLM.
Ce înseamnă Gemini pentru Google?
Tendința Google este să integreze aceasta tehnologie în mai multe servicii de succes pe care le deține. Momentan au anunțat că va fi implementat în Gmail, Chrome, Docs, Slides, Sheets și altele anul acesta.
Ușor LLM-urile par să devină o tehnologie foarte importantă în multe servicii digitale. Momentan Google Search nu pare că va fi înlocuit de Gemini însă cred că mulți ne întrebăm dacă nu cumva va veni și ziua în care o versiune superioară Gemini va înlocui parțial sau cu totul mai multe servicii printre care și Google Search. Poate în viitor va putea răspunde la email-uri automat doar tu să-i dai indicații cu ce să conțină emailul și va putea să te ajute cu multe alte automatizări precum rapoarte automate în Google Sheets, statistică, completare de date, etc.
Lucrurile vor evolua rapid ținând cont că poziția de lider îi este deja atacată.
Abonamentele Gemini și Gemini Advanced
Din start Gemini va folosi modelul Pro 1.0 complet gratuit care ar fi similar cu GPT 3.5. Dacă vrei însă sistemul cel mai capabil să analizeze texte, să proceseze volum mai mare de text, mai rapid, și să halucineze mai puțin atunci Google oferă și un pachet plătit Gemini Advanced, care folosește modelul Ultra 1.0 (cu care Google, evident, se laudă că ar fi mai bun comparativ cu GPT 4 cel puțin la anumite teste specifice pe care le menționează pe site).
La fel ca și cu GPT 4, îi vei putea cere cod în limbaje de programare variate, va putea trata probleme de logică, va putea urma instrucțiuni foarte precise din partea utilizatorului și va putea înțelege mai bine contextul pe care i-l dai. Poți citi aici mai multe despre tehnologia dezvoltată de Google.
Varianta plătită Gemini Advanced va face parte dintr-un pachet deja existent de servicii Google One transformat acum în Google One AI Premium Plan pentru 110 lei / lună pentru care primești acces la acest sistem pe lângă deja existentele:
Partea faină este că poți testa timp de 2 luni gratuit pachetul cu tot ce oferă el: 2TB spațiu în cloud: să ții pozele în Google Photos și funcțiile AI cu plată de editare din el, sau în Google Drive, viitoarele funcții premium anunțate pentru Google Docs, Gmail, și alte servicii,
Aplicații disponibile pentru mobil
Google Gemini va fi disponibil pe o aplicație dedicată Android în timp ce pe iOS îl vei putea folosi în aplicația care deja înclude mai multe funcții: Google (momentan la mine nu apare vreo schimbare în aplicație).
Aplicația Android va oferi o integrare aproape invizibilă între servicii precum Google Assistant fiind capabil acum asistentul să îți genereze texte pentru o postare pe care vrei să o faci pe Social Media în funcție de conținutul imaginii, sau dacă ești pe un articol web vei putea să îi ceri asistentului Google să sumarizeze articolul, sau îi vei putea pune întrebari privind conținutul articolului.
Pe aplicația Google de pe iOS funcția va fi disponibilă printr-un buton sus chiar pe prima pagină care schimbă între Google Search și Gemini.
Un comentariu
Interesanta evolutia acestei tehnologii in ultimii ani. Este uimitor cum computerele pot invata sa recunoasca si sa genereze atat de multe lucruri, bazandu-se pe materialele pe care noi, oamenii, le publicam pe internet. Totusi, este important sa fim atenti si la dezavantajele utilizarii inteligentei artificiale, cum ar fi rata de eroare. Insa, nu putem nega ca tehnologia ne aduce si multe beneficii, iar companiile tech concureaza pentru a dezvolta cele mai avansate Large Language Models. Cu siguranta vom vedea imbunatatiri si mai spectaculoase in viitorul apropiat.