In aceasta vara, Apple a oferit site-urilor web mai mult control cu privire la posibilitatea companiei de a-si antrena modelele AI pe datele lor. Editorii si platformele importante, precum The New York Times si Facebook, au renuntat deja.
La mai putin de trei luni dupa ce Apple a debutat discret cu un instrument prin care editorii pot renunta la instruirea cu inteligenta artificiala, o serie de publicatii de stiri si platforme sociale importante au acceptat propunerea companiei.
WIRED poate confirma ca Facebook, Instagram, Craigslist, Tumblr, The New York Times, The Financial Times, The Atlantic, Vox Media, reteaua USA Today si compania mama a WIRED, Condé Nast, se numara printre numeroasele organizatii care au ales sa isi excluda datele din antrenamentul AI al Apple. Primirea rece reflecta o schimbare semnificativa atat in perceptia, cat si in utilizarea robotilor de tip crawler care au cutreierat internetul timp de decenii. Acum ca acesti roboti joaca un rol-cheie in colectarea datelor de formare a inteligentei artificiale, ei au devenit o zona de conflict privind proprietatea intelectuala si viitorul internetului.
Acest nou instrument, Applebot-Extended, este o extensie a robotului Apple de cautare pe internet care permite in mod specific proprietarilor de site-uri web sa spuna Apple sa nu utilizeze datele lor pentru instruirea AI. (Apple numeste acest lucru „controlul utilizarii datelor” intr-o postare pe blog care explica modul in care functioneaza). Applebot original, anuntat in 2015, a explorat initial internetul pentru a alimenta produsele de cautare ale Apple, precum Siri si Spotlight. Recent, insa, scopul Applebot s-a extins: Datele pe care le colecteaza pot fi, de asemenea, utilizate pentru a antrena modelele fundamentale create de Apple pentru eforturile sale de inteligenta artificiala.
Applebot-Extended este o modalitate de a respecta drepturile editorilor, spune purtatorul de cuvant al Apple, Nadine Haija. De fapt, nu opreste Applebot-ul original sa tarasca site-ul web – ceea ce ar avea apoi un impact asupra modului in care continutul site-ului respectiv apare in produsele de cautare Apple – ci, in schimb, impiedica utilizarea acestor date pentru a antrena modelele lingvistice mari ale Apple si alte proiecte generative AI. Acesta este, in esenta, un robot care personalizeaza modul in care functioneaza un alt robot.
Sursa: https://www.wired.com/story/applebot-extended-apple-ai-scraping/