Într-o epocă definită de schimbări rapide și inovații tehnologice, inteligența artificială (AI) continuă să ne uimească și să rescrie limitele posibilului. Dacă ni s-a părut că AI a evoluat rapid în 2023 în primele luni din 2024 lucrurile par că evoluează exponențial în domeniul AI.
De la algoritmi care învață mai repede decât credeam că este posibil, la roboți cu abilități cognitive remarcabile și până la aplicații care transformă felul în care interacționam cu PC-urile sau cu lumea în fiecare zi, lucrurile par că se duc rapid în zona science-fiction, evoluând în fiecare zi.
Descoperiți mai departe care au fost pentru mine cele mai marcante prezentări, demo-uri și cum ar putea să redefinească viitorul apropiat.
- 9.01.2024 – Rabbit R1 – Jesse Lyu a avut una dintre cele mai bune prezentări a unui produs din ultimii 5 ani în zona de tehnologie. Rabbit R1 este un dispozitiv mobil cu conexiune la internet cu configurație simplă, o cameră foto, un ecran mic și capabil să execute taskuri destul de complexe prin comenzi vocale.
Dacă tehnologia utilizată de binecunoscuții asistenți AI: Chat GPT, Google Gemini, AI Copilot, Claude, etc este numită LLM (Large Language Model) tehnologia Rabbit OS folosește LAM (Large Action Model).
Ce înțelegem până la livrarea primelor unități către clienți este că acest mic device va fi capabil să învețe ce face un om într-o interfață grafică pe PC și va putea reproduce acele comenzi. Va putea compune un email cu câteva instrucțiuni ale tale. Sau va putea răspunde primind input și verbal și imagini prin camera foto. Vă las sa vă uitați la demo dacă nu l-ați văzut.
Tehnologia din prezent utilizată în aplicațiile de automatizare web / desktop numită RPA (Robotic Process Automation) în momentul de față execută comenzi în Web / Desktop doar cu instrucțiuni precise și puncte de decizie recunoscând butoantele în funcție de cum arată vizual, după coordonate ori în funcție de niște etichete / ID-uri vizibile în spatele interfeței grafice. LAM pare că va revoluția această zonă pentru că LAM-ul v-a putea învăța cum se face un proces. Să vedem dacă va putea lua și decizii în funcție de anumite informații din interfață sau de anumite date înregistrate. Până atunci să urmărim cum este defapt Rabbit R1 în realitate.
P.S. Este sold-out și au relansat de câteva ori precomenzile pentru a vinde mai multe unități. - 9.01.2024 – Un proiect de cercetare între Microsoft și PNNL va încerca să grăbească descoperirile științifice de noi materiale cu ajutorul AI care se estimează că va scurta perioada de la ani în doar câteva săptămâni. Acest lucru poate duce la o multitudine de noi tehnologii sau creșterea performanței în aproape orice obiect / domeniu din viața de zi cu zi, dacă acele materiale se vor dovedi că au caracteristici mai bune decât cele din prezent.
- 9.01.2024 – Kodiak Robotics – se pregătește să dezvolte camioane care se vor conduce complet autonom.
- 17.01.2024 – Companii auto și-au manifestat intenția de a integra ChatGPT în autoturismele lor sub forme variate.
- 29.01.2024 – Arc – Browser-ul caută în locul tău pe Internet și îți poate face și un sumar legat de ceeea ce cauți. L-am folosit. Pentru rețete de exemplu îți face un sumar aparent bun al pașilor pe care trebuie să îi face pentru a găti o anumită mâncare. Este revoluționar în funcții și felul în care este conceput. Încă nu l-am adoptat însă este promițător.
- 15.02.2024 – Google a lansat oficial Gemini Pro și Ultra versiuni care ar fi mai bune decât GPT-4 dar pe anumite aplicații specifice.
- 15.02.2024 – OpenAI face publică tehnologia cu nume de cod „Sora”, capabilă să genereze materiale video doar din instrucțiuni scrise, text-to-video să le numim. Este poate cea mai marcantă dintre tehnologiile noi anunțate. Materialele video generate par înregistrate de o cameră video însă sunt generate de computere. Intră pe link sunt multe demo-uri acolo.
- 13.03.2024 – Apare demo-ul robotului umanoid Figure 01 care într-un demo de 2 minute pe Youtube ne arată cum cu ajutorul large language model-ului construit de OpenAI și a tehnologiei dezvoltate de Figure.ai au putut dezvolta un prototip de robot capabil să vadă ce este împrejurul său, să înțeleagă ce i se spune prin limbaj natural transmis către robot, și să ducă la bun sfârșit cerința lansată de om.
Demo-ul este aparent banal însă asta arată că tehnologia curentă este suficientă pentru a începe să fie construiți roboți umanoizi capabili de muncă de laborator, în depozite sau cine știe ce alte treburi care pot fi învățate de la oameni. - 17.03.2024 – Elon Musk deschide LLM-ul denumit Grok 1 pe GitHub facându-l Open Source.
- 21.03.2024 – O1 de la Open Interpreter – tot un soi de Rabbit R1 însă care nu are ecran, doar buton și microfon. Comunică cu desktop-ul și similar cum dispozitivul din filmul HER comunică cu actorul principal, la fel și acest dispozitiv primește comenzi din partea ta și execută conform demo-ului comenzi destul de complexe. Partea interesantă este că îl poți învăța cum să facă asta în interfața de pe PC, pas cu pas. Apoi cere confirmare dacă a făcut bine. Practic în viitor din multiplele iterații aceste device-uri precum R1 și O1 vor putea să execute taskuri în interfețe grafice fără / cu mai puține probleme decât în prezent pentru că vor avea antrenate modelele AI pe atâtea date de la utilizatori.
Momentan este disponibil doar pentru dezvoltatorii de aplicații. - Claude 2 se laudă că depășește GPT-4 în teste. Volumul de informații pe care le poți oferi ca și context este principalul avantaj fiind mult mai mare comparativ cu GPT-4. Nu am putut testa LLM-ul, dar este promițător și competiția dintre dezvoltatorii acestor tehnologii devine foarte strânsă.
- 28.03.2024 – Elon Musk anunță rapid Grok 1.5 – obține performanțe mai bune din benchmark-uri, dar încă sub Gemini Pro 1.5 și GPT 4.
- 30.03.2024 – OpenAI anunță că au și o tehnologie pentru replicarea vocii unei persoane care are nevoie de doar de o înregistrare de 15 secunde cu vocea ce va fi clonată.
- 01.04.2024 – Apple ReALM – Apple lucrează mai mult sau mai puțin pe ascuns la un LLM propriu. Recent au apărut însă informații că va putea interpreta ce vede userul pe ecran, deci probabil acest proiect explorează și variante de genul: comenzi mai avansate către Siri și telefonul să execute acea comandă și să o execute în interfața grafică iOS.
- 5.04.2024 – Elon Musk anunță că în trimestrul 3 pe 8 August Tesla va prezenta robotaxi-uri (mașini autonome) care mă gândesc că vor fi disponibile pentru companii. Acum, nu știu câți mai cred în ce spune Elon, ținând de istoricul declarațiilor din ultimii ani, dar vom urmări ceva fi în august. FSD este încă în beta, deși la nivel declarativ trebuia să fie aici deja de aproximativ 4 ani.
- 9.04.2024 – Intel anunță un competitor pentru procesorul NVIDIA H100 care este destinat aplicațiilor AI. Gaudi 3 va intra în producție însă din al treilea trimestru al anului și se laudă cu performanțe de până la 1.7x mai bune comparativ cu H100 al lui Nvidia pentru antrenarea LLM-urilor LLAMA2 sau GPT 3.
Sunt multe alte știri care nu se află în listă. Mai poți completa și tu în comentarii cu cele care te-au marcat pe tine. Putem însă spune că avem un prim trimestru cel puțin interesant în domeniul AI. Dacă îți place articolul, lasă un mesaj / comentariu și voi mai agrega în continuare cele mai marcante știri AI.