L'operatore promette di automatizzare varie attività
Secondo Sam Altman, CEO di OpenAI, il 2025 sarà un anno di trasformazione per gli agenti di intelligenza artificiale.
In un post sul blog pubblicato all'inizio dell'anno, Altman aveva previsto un grande balzo in avanti negli strumenti in grado di automatizzare le attività e di intraprendere autonomamente azioni per conto degli utenti.
Ora OpenAI ha compiuto il suo primo coraggioso tentativo di trasformare questa visione in realtà.
Il 23 gennaio 2025, OpenAI ha annunciato un'anteprima della ricerca su Operator, un agente di intelligenza artificiale multiuso in grado di navigare sul web ed eseguire attività in modo autonomo.
Inizialmente disponibile per gli utenti statunitensi con il piano di abbonamento Pro da 200 $ di ChatGPT, Operator punta a espandersi ai livelli Plus, Team ed Enterprise di OpenAI nel prossimo futuro.
Altman ha comunicato che Operator sarà presto disponibile anche in altri Paesi, anche se il lancio in Europa potrebbe richiedere più tempo.
La funzionalità è accessibile tramite operator.chatgpt.com e OpenAI prevede di integrarla in futuro in tutti i client ChatGPT.
Cosa può fare l'operatore

L'operatore promette di automatizzare diverse attività, dalla prenotazione di viaggi a quella di ristoranti e allo shopping online.
La sua interfaccia include categorie di attività quali shopping, consegne, ristorazione e viaggi, ciascuna adattata a diversi tipi di automazione.
Una volta attivato, Operator avvia un browser web dedicato all'interno di una finestra pop-up, consentendo agli utenti di vedere in tempo reale le azioni specifiche che sta eseguendo.
Gli utenti possono subentrare in qualsiasi momento, poiché l'operatore opera tramite il proprio browser anziché tramite quello principale dell'utente.
Il fulcro di Operator è il modello Computer-Using Agent (CUA) di OpenAI, che combina le capacità di ragionamento avanzate del modello GPT-4o di OpenAI con le capacità di visione artificiale.
Ciò consente alla CUA di interagire con i siti Web in modo molto simile a quanto farebbe un essere umano, cliccando sui pulsanti, navigando nei menu e compilando moduli, senza dover ricorrere ad API rivolte agli sviluppatori.
Tutele e limitazioni
OpenAI ha adottato diverse precauzioni per garantire che l'Operatore operi in modo sicuro e responsabile.
Ad esempio, il modello CUA è progettato per chiedere conferma all'utente prima di finalizzare attività con conseguenze esterne, come l'inserimento di un ordine o l'invio di un'e-mail.
OpenAI ha inoltre collaborato con aziende come DoorDash, eBay, Instacart, Priceline, StubHub e Uber per garantire che l'operatore rispetti i termini degli accordi di servizio.
Tuttavia, Operator non è esente da limitazioni.
OpenAI riconosce che la CUA non è ancora in grado di gestire attività complesse, come la creazione di presentazioni dettagliate o la gestione di complessi sistemi di calendario.
Alcune azioni, come le transazioni bancarie, richiedono la supervisione attiva dell'utente e l'operatore non gestirà attività sensibili come l'inserimento dei dati della carta di credito.
Inoltre, ci sono limiti di utilizzo e alcune restrizioni di sicurezza. Ad esempio, Operator non invierà email né cancellerà eventi del calendario nella sua iterazione corrente.
OpenAI ha osservato:
"Attualmente, Operator non è in grado di gestire in modo affidabile molte attività complesse o specializzate."
Ha aggiunto che l'operatore potrebbe "bloccarsi" su interfacce complesse o controlli CAPTCHA, spingendo gli utenti a intervenire.
Nonostante queste limitazioni, Operator rappresenta il tentativo più audace di OpenAI di creare un agente di intelligenza artificiale autonomo.
Sono state implementate misure di sicurezza per rilevare e sospendere l'esecuzione se viene rilevata un'attività sospetta e OpenAI impiega sia pipeline automatizzate che revisionate da esseri umani per aggiornare costantemente queste misure di sicurezza.
Il panorama più ampio dell'intelligenza artificiale
L'uscita di Operator arriva mentre altri giganti della tecnologia, tra cui Google e Anthropic, sperimentano con agenti di intelligenza artificiale.
Questi strumenti promettono di andare oltre i tradizionali assistenti virtuali come Siri o Alexa, non solo elaborando le informazioni ma anche eseguendo azioni in modo autonomo.
Tuttavia, questa maggiore funzionalità comporta anche rischi per la sicurezza, come il rischio di truffe di phishing o attacchi DDoS automatizzati.
Il cauto lancio di Operator da parte di OpenAI riflette l'attenzione rivolta alla riduzione al minimo di questi rischi, esplorando al contempo le possibilità della tecnologia.
Le iniziative di Altman si estendono oltre OpenAI, creando una rete di progetti che sembrano supportare questo futuro incentrato sull'intelligenza artificiale.
Una di queste iniziative è World, un progetto di Altman e Alex Blania, Tools for Humanity.
Precedentemente noto come Worldcoin, World si propone di affrontare la sfida di distinguere gli esseri umani dagli agenti di intelligenza artificiale online.
Scansionando il bulbo oculare di un individuo con una sfera di metallo argentato, World fornisce un identificatore univoco basato su blockchain per verificare che si tratti di un essere umano.
Questo strumento di “prova dell’essere umano” potrebbe anche verificare gli agenti di intelligenza artificiale che agiscono per conto di persone reali.
Tiago Sada, responsabile dei prodotti presso Tools for Humanity, ha affermato:
"L'idea di delegare la tua 'prova di identità' a un agente e di lasciarlo agire per tuo conto è in realtà molto importante."
La tecnologia di identificazione mondiale potrebbe addirittura autorizzare agenti di intelligenza artificiale ad agire per conto degli utenti, consentendo alle aziende di interagire con agenti verificati senza compromettere la sicurezza delle loro piattaforme.
Un futuro costruito attorno all'intelligenza artificiale
Le partnership di OpenAI con piattaforme come Uber e Instacart segnano un cambiamento nel modo in cui le aziende interagiscono con gli utenti.
Man mano che gli agenti di intelligenza artificiale diventano più capaci, le aziende potrebbero dover adattarsi a un futuro in cui molte interazioni saranno facilitate da agenti verificati anziché da singoli individui.
Strumenti come il sistema "Prova di umanità" di World potrebbero svolgere un ruolo fondamentale nel garantire fiducia e sicurezza in queste interazioni.
Per Altman, questa visione dell'intelligenza artificiale è in linea con le sue altre iniziative, tra cui Helion Energy, una startup sulla fusione nucleare che un giorno potrebbe alimentare i data center di OpenAI, e Retro Biosciences, una startup sulla scienza della longevità che sta già sfruttando i modelli di OpenAI.
Con il lancio di Operator, OpenAI compie il suo primo grande passo nel mondo degli agenti di intelligenza artificiale autonomi.
Con il progredire della tecnologia, potrebbe ridefinire il modo in cui utilizziamo Internet, rimodellando i settori industriali e aprendo nuove possibilità.
Il 2025 potrebbe rappresentare l'anno di svolta per gli agenti di intelligenza artificiale, e Operator di OpenAI è in prima linea in questa iniziativa.