Cum să falsificați o demonstrație de robotică pentru distracție și profit

În martie 2008, un robot finanțat de DARPA numit Big Dog a devenit viral atunci când a fost filmat împiedicându-se într-o parcare înzăpezită. Revoluționând lumea robotică, videoclipul a adus Boston Dynamics în atenția publicului și a determinat mulți să-și urmeze pasiunea pentru robotică. Cu toate acestea, mulți videoclipuri de genul acesta pot fi trucate, ceea ce poate afecta încrederea publicului în această tehnologie. Cu toate acestea, Boston Dynamics și alte companii și-au făcut o treabă ca videoclipurile lor să fie reale, ceea ce a ajutat la construirea unei imagini pozitive în jurul acestor tehnologii. De aceea, o mai mare conștientizare asupra faptului că multe videoclipuri pot fi trucate este esențială. Textul face trecerea, fără a a crea teama și scepticismul pentru publicul larg.

În martie 2008, un robotist în îmbrăcăminte de iarnă a dat lui Big Dog o lovitură mare pentru cameră. Robotul zgomotos, finanțat de DARPA, s-a împiedicat, dar și-a recăpătat rapid picioarele în mijlocul parcării înzăpezite. „VĂ RUGĂM NU LOCATĂ MECHUL MOARTEI PROTOTIPUL MERCAT”, pledează comentariul de top al videoclipului. „VA REȚINE.”

„Înfricoșător ca naiba”, notează altul. „Imaginați-vă dacă ați face o plimbare prin pădure într-o zi și ați vedea acel lucru venind spre tine.” Blogurile gadget și conturile de rețele sociale au aruncat în mod diferit cuvinte precum „terifiant” și „robopocalipsă”, în acele zile înainte ca Black Mirror să ofere lumii o scurtătură și mai directă. Boston Dynamics a avut un succes. Videoclipul are în prezent 17 milioane de vizualizări. A fost primul dintre nenumăratele hituri virale care continuă până în zilele noastre.

Este greu de exagerat rolul pe care l-a jucat o astfel de viralitate în dezvoltarea ulterioară a Boston Dynamics într-una dintre cele mai identificabile companii de robotică din lume. Big Dog și descendenții săi precum Spot și Atlas au fost sărbătorite, demonizate, parodiate și chiar au apărut într-o reclamă la bere Sam Adams. Pe lângă dezvoltarea unora dintre cele mai avansate mecatronice din lume, echipa Boston Dynamics s-a dovedit a fi foarte pricepuți în marketing.

Sunt multe de spus despre rolul pe care l-au jucat astfel de videoclipuri în răspândirea evangheliei roboticii.

Se pare că videoclipurile de genul acesta au inspirat carierele nenumăraților robotiști care în prezent prosperă în domeniu. Este un model pe care nenumărate startup-uri ulterioare l-au adoptat pentru o gamă largă de succes. Boston Dynamics cu siguranță nu poate fi făcut responsabil pentru niciuna dintre acele companii care ar fi putut lua câteva scurtături pe parcurs.

În ultimele decenii, videoclipurile cu roboți virali au crescut de la obiecte de curiozitate în rândul technorati la hituri care captează titlurile filtrate prin TikTok și YouTube. Pe măsură ce potenţialele recompense au crescut, la fel a crescut şi dorinţa de a înmuia marginile. O complicație suplimentară este starea CGI, care a devenit imposibil de distins de realitate pentru mulți telespectatori. Prejudecățile de confirmare, atracția față de noutate și lipsa de expertiză tehnică joacă un rol cheie în tendința noastră de a crede știri și videoclipuri false.

Puteți ierta spectatorului obișnuit TikTok, de exemplu, pentru că nu înțelege complexitatea generalizării. Mulți robotiști – poate fără intenție – au adăugat combustibil la acel incendiu, sugerând că sistemele pe care le vedem în videoclipuri sunt „de scop general”. Multifuncțional, poate, dar suntem încă departe de roboții care pot îndeplini orice sarcină care nu este împiedicată de limitările hardware.

De cele mai multe ori, videoclipurile pe care le vedeți sunt rezultatul lunilor sau anilor de muncă. Undeva pe un hard disk se află orele de videoclipuri care nu au ajuns în finalul tăierii, prezentând un robot care se poticnește, pulveriza sau se oprește scurt. Acesta este motivul pentru care am încurajat companiile să partajeze câteva dintre aceste videoclipuri cu publicul TechCrunch. Poate deloc surprinzător, puțini m-au acceptat cu oferta. Bănuiesc că o mare parte din acest lucru se rezumă la modul în care oamenii percep astfel de informații. Dintre robotică, orele și zilele de încercare și eșec sunt un indiciu al cât de mult ai muncit pentru a ajunge la produsul final. În rândul publicului larg, totuși, astfel de eșecuri ale roboților pot fi văzute ca un eșec din partea robotiștilor înșiși.

Într-un număr din 2023 al revistei Actuator (RIP), am lăudat Boston Dynamics pentru „booperul” pe care l-au publicat, în care Atlas și-a pierdut picioarele și a căzut între mișcările de parkour de succes. Ca de obicei, mult mai multe au ajuns pe podeaua salii de tăiere decât au făcut tăierea finală. Chiar și atunci când nu ai de-a face cu roboți, așa merg lucrurile.

Cu câteva săptămâni în urmă, am participat la o discuție susținută de regizoarea Kelly Reichardt, după o proiecție a filmului ei minunat, „Apar.” Ea a reiterat faptul că vechiul WC Fields nu lucrează niciodată cu copiii sau animalele. În majoritatea cazurilor, probabil că aș adăuga mecatronică avansată la lista respectivă.

Alături de CG/renduri, editarea creativă este doar una dintre multele modalități potențiale de a îndulci o demonstrație de robotică. De cele mai multe ori, intenția nu este rău intenționată. Un sentiment pe care muzicienii îl împărtășesc frecvent cu mine podcast-ul meu este că odată ce o melodie este lansată în lume, nu mai ai control asupra ei. Într-o anumită măsură, cred că același lucru poate fi adevărat și cu videoclipurile. Se fac alegeri pentru a înăspri lucrurile și pentru a îndulci prezentarea. Acestea sunt o parte esențială a realizării videoclipurilor online consumabile. Cu toate acestea, mai ales în epoca TikTok, contextul este prima victimă.

Nu există un regulament pentru informațiile care trebuie incluse într-o demonstrație de robotică. Cu cât mă gândesc mai mult la asta, cu atât cred că ar trebui să existe – cel puțin – niște linii directoare bine definite. Nu sunt robotic. Sunt doar un tocilar cu o licență în scriere creativă. Cu toate acestea, vorbesc în mod regulat cu oameni mult mai deștepți decât mine despre subiect.

Chiar înainte de CES, a Postare pe LinkedIn mi-a atras atenția (la fel și, se pare, ochii multor comunități de robotică). A fost scris de Brad Porter, the Robotică colaborativă fondator și CEO care a condus anterior eforturile Amazon de robotică industrială. Rareori recomand să urmărească LinkedIn, dar dacă îți pasă deloc de spațiu, el este unul bun.

În articol, Porter observă că CES ar fi probabil prost cu demonstrații interesante de robotică (a fost), dar adaugă: „Există și o mulțime de videoclipuri uimitoare cu filmări trucuri. Separarea realității de scenă este greu.” Executivul nu insinua nimic din bagajele negative pe care un cuvânt precum „stagecraft” l-ar putea avea în acest context. În schimb, el sugera pur și simplu ca spectatorii să abordeze astfel de videoclipuri cu un ochi discernător și – poate – sceptic.

Am acoperit acest spațiu de câțiva ani și mi-am dezvoltat unele dintre abilitățile de a identifica kayfabe robotizat. Dar încă mă bazez adesea pe experți în domeniu, cum ar fi Porter, atunci când o demonstrație pare neplăcută. Desigur, nu fiecare spectator are experiența mea sau acces la acești oameni. Cu toate acestea, ei se pot dota cu cunoștințele despre modul în care astfel de videoclipuri sunt îndulcite – cu răutate sau altfel.

Porter identifică cinci puncte diferite. Primul este „stop-motion”. Aceasta se referă la o succesiune de modificări rapide care fac să pară că robotul se mișcă în moduri de care nu este capabil în viața reală.

„Dacă vedeți un videoclip cu robotică cu multe sărituri de cadre sau tăieturi ale camerei, (fiți) atenți”, scrie el. „Veți observa că videoclipurile Boston Dynamics sunt adesea o singură tăietură, fără tăieturi de cameră, asta este impresionant.”

Al doilea este simularea. Acesta este, în practică, exemplul CG pe care l-am dat mai sus. Simularea a devenit un instrument de bază în implementarea robotică. Le permite oamenilor să ruleze mii de scenarii simultan în câteva secunde. Alături de alte grafice pe computer, simularea robotică a devenit din ce în ce mai fotorealistă în ultimii ani. Crearea și partajarea unei simulări realiste nu este o problemă în sine. Problema, mai degrabă, apare atunci când dai de jos lucruri ca realitate.

Numărul trei are un nume amuzant. Demo-urile Vrăjitorului din Oz sunt numite astfel datorită ridicării grele pe care o face (persoana) din spatele perdelei (nu acordați atenție). Porter citează ca exemplu demonstrația Mobile ALOHA de la Stanford. Cred cu tărie că nu a fost nicio răutate implicată în decizia de a rula demo-ul (încă extrem de impresionant) prin teleop în afara ecranului. De fapt, „operatorul robot”, Tony Zhao, apare atât în ​​videoclip, cât și în creditele finale.

Din păcate, apariția are loc la două minute și jumătate într-o demonstrație de trei minute și jumătate. În aceste zile, totuși, trebuie să presupunem că:

  1. Nimeni nu mai are de fapt capacitatea de a sta prin două minute și jumătate de imagini incredibile cu robot.
  2. Chestia asta va fi tăiată și dezbrăcat de orice context.
  3. Vizionatorul tău mediu TikTok X (Twitter) nu va urmări sursa videoclipului.

Pentru un alt exemplu care a sosit la scurt timp după postarea lui Porter, aruncați o privire la videoclipul X al lui Elon Musk cu robotul umanoid Optimus care pliează rufele. Videoclipul a difuzat textul „Optimus pliază o cămașă”. Privitorii cu ochi de vultur, ca mine, au observat ceva interesant în colțul din dreapta jos: o mână înmănușată care, uneori, pătrundea parțial în cadru care se potrivea cu mișcarea robotului.

„Încadând videoclipul de spălătorie Optimus la doar câțiva centimetri la stânga și ai fi ratat ceea ce pare a fi o mână tele-op care controlează Tesla Bot”, am notat la acea vreme. „Nimic în neregulă cu tele-op, bineînțeles că are niște aplicații excelente, inclusiv instruire, depanare și executarea unor sarcini foarte specializate, cum ar fi operația. Dar este frumos să știm ce vedem (și nu). Mi se pare un caz evident al afișului original care omite informații cheie, înțelegând că publicul/fanii săi vor completa golurile cu ceea ce cred că văd pe baza sentimentelor lor despre mesager.”

Ar putea fi greșit să-l acuzi pe Musk că a obscurcat în mod intenționat adevărul aici. La douăzeci și trei de minute după tweetul inițial, el a adăugat: „Notă importantă: Optimus nu poate face acest lucru în mod autonom, dar cu siguranță va putea face acest lucru în mod complet autonom și într-un mediu arbitrar (nu va necesita o masă fixă ​​cu casetă care are doar o cămașă).”

Ca nu-Mark Twain notat celebru, „o minciună poate călători la jumătatea lumii în timp ce adevărul încă se încălță”. Un principiu similar poate fi aplicat și video-ului online. Tweetul inițial nu este chiar o minciună, desigur, dar poate fi clasificat cu siguranță ca o omisiune. Este vechiul ziar de a-ți ascunde corecturile de la pagina A12. Mult mai mulți oameni vor fi expuși erorii inițiale.

Din nou, nu sunt aici pentru a vă spune dacă acea omisiune inițială a fost sau nu intenționată (dacă ați ales să aplicați beneficiul îndoielii aici, puteți vedea cu siguranță tweet-ul de continuare ca o clarificare autentică a contextului incomplet). În acest caz specific, bănuiesc că majoritatea opiniilor despre această chestiune vor fi direct corelate cu sentimentele personale despre autor.

Următorul exemplu al lui Porter este „Învățare prin consolidare cu o singură sarcină”. Puteți face o scufundare mai profundă a învățării prin întărire Aicidar de dragul conciziei într-un articol deloc scurt, să spunem doar că este o modalitate de a-i învăța pe roboți să îndeplinească sarcini cu încercări și erori repetitive din lumea reală.

„Deschide o ușă, stivuiește un bloc, rotește o manivelă”, scrie Porter. „Învățarea acestor sarcini este impresionantă și arată impresionant și sunt impresionante. Dar un inginer bun RL poate face acest lucru să funcționeze în câteva luni. Un pas mai greu este să-l faceți robust la diferite variații subtile. Dar generalizarea la mai multe sarcini similare este foarte dificilă. Pentru a putea spune dacă se poate generaliza, căutați mai multe sarcini antrenate.”

Ca și teleop, nu este absolut nimic în neregulă cu învățarea prin întărire. Acestea sunt ambele instrumente de neprețuit pentru formarea și operarea roboților. Trebuie doar să le dezvălui cât mai clar posibil.

Sfatul final al lui Porter este monitorizarea mediului și potențialele omisiuni. El citează videoclipul recent cu umanoidul lui Figure care face cafea. „Flidul, cu o singură tăietură, arată robustețe la modurile de defecțiune”, scrie el. „Încă este o singură sarcină, așa că afirmațiile cu privire la momentul ChatGPT al robotului nu sunt dovedite aici. Calitatea producției este grozavă. Dar vei observa că robotul nu ridică nimic mai greu decât o cană Keurig. S-a făcut ridicarea cănilor, dar nu arată asta. Poate robotul nu are acea putere?”

Când am vorbit cu Porter despre subtilitățile postării de astăzi, a fost din nou rapid să sublinieze că aceste observații nu afectează ceea ce este o tehnologie cu adevărat impresionantă. Problema este însă că creierul nostru are tendința de a umple golurile. Antropomorfizăm sau umanizăm roboții și presupunem că aceștia învață așa cum o facem noi, când, în realitate, vizionarea unui robot deschizând o ușă nu garantează absolut că poate deschide alta – sau chiar aceeași ușă sub iluminare diferită. Televizoarele și filmele ne-au oferit, de asemenea, așteptări nerealiste cu privire la ceea ce roboții pot – și nu pot face – în 2024.

Un ultim punct care nu a ajuns în postare este viteza. Tehnologia poate fi dureros de lentă uneori, așa că este obișnuit să accelerezi lucrurile. În cea mai mare parte, universitățile și alte instituții de cercetare fac o treabă bună notând acest lucru printr-o suprapunere de text. Acesta este modul de a face asta. Adăugați informațiile pertinente pe ecran într-un mod care este dificil pentru un influencer avid de clicuri. De fapt, acest fenomen este modul în care și-a primit numele 1X.

Un videoclip recent al companiei care arată utilizarea rețelelor neuronale atrage atenția asupra acestui fapt. „Acest videoclip nu conține nicio teleoperare, nici grafică pe computer, nici tăieturi, nici accelerare video, nici redare a traiectoriei scriptate”, explică compania. „Totul este controlat prin rețele neuronale.” Rezultatul este un videoclip de trei minute care se poate simți aproape dureros de lent în comparație cu alte demonstrații umanoide.

Ca și în cazul videoclipurilor cu blooper, aplaud această formă de transparență și orice altă formă. Pentru roboții care se mișcă cu adevărat încet, nu este nimic rău în a accelera lucrurile, atâta timp cât respectați trei reguli de import:

  1. Dezvăluie
  2. Dezvăluie
  3. Dezvăluie

La fel ca și compozitorul, companiile trebuie să recunoască că nu poți controla ce se întâmplă cu un videoclip odată ce acesta aparține lumii. Dar întreabă-te: am făcut tot ce-mi stătea în putință pentru a opri răspândirea potențialului fals?

Probabil că este prea mult să sperăm că astfel de videoclipuri sunt guvernate de același adevăr în legislația publicitară care guvernează publicitatea televizată. Mi-ar plăcea, totuși, să văd un grup de robotiști care își unesc forțele pentru a standardiza modul în care astfel de dezvăluiri pot – și ar trebui – să funcționeze.

Va invit sa cititi si articolele de mai jos pe langa acestea care sunt cele mai recente
How to fake a robotics demo for fun and profit

Lasa un comentariu