Az OpenAI nemrégiben bemutatta legújabb innovációját, az "Operator" névre keresztelt webautomatizációs eszközt. Ez a fejlett megoldás lehetővé teszi a felhasználók számára, hogy egyszerűen és hatékonyan végezzenek el különféle online feladatokat, megkönny
2025. január 18-án az OpenAI egy izgalmas kutatási előzetest mutatott be, amely az Operator névre hallgat. Ez az innovatív rendszer egy új mesterséges intelligencia-modellen, a Computer-Using Agenten (CUA) alapul, amely lehetővé teszi a számítógépek irányítását egy vizuális interfészen keresztül. Az Operator képes az emberi felhasználókhoz hasonlóan interakcióba lépni a képernyőn megjelenő elemekkel, mint például gombok és szövegmezők, így forradalmasítva a gépek és emberek közötti kommunikációt.
Az Operator a ChatGPT Pro előfizetői számára érhető el havi 200 dollárért az operator.chatgpt.com oldalon, de a jövőben várhatóan elérhető lesz a Plus, Team és Enterprise felhasználók számára is. Az OpenAI tervei között szerepel, hogy ezt a funkciót közvetlenül a ChatGPT-be integrálja, valamint API-n keresztül is elérhetővé teszi fejlesztők számára.
Az Operator a számítógép monitorján megjelenő tartalmakat folyamatosan figyelemmel kíséri, és képernyőképeket elemez, hogy meghatározza, milyen lépéseket kell tennie. Az általa végrehajtott műveletek virtuális billentyűzet- és egérvezérlésen keresztül valósulnak meg. A CUA GPT-4o a látásra specializált képességeit használja, és megerősítéses tanulási módszertani keretet alkalmaz, hogy a képernyő pixeleit feldolgozva pontos és hatékony döntéseket hozzon.
Bár a rendszer kiemelkedő teljesítményt nyújt az ismétlődő webes feladatok, például bevásárló- és lejátszási listák összeállításában, az ismeretlen felületekkel, mint például táblázatok és naptárak kezelése terén már nem mutat olyan jó eredményeket. Az OpenAI belső tesztjei alapján az összetett szövegszerkesztési feladatok elvégzése csupán 40%-os sikerességi arányt mutat.
Egy olyan rendszer esetén, amely képes hozzáférni a számítógép képernyőjén megjelenő információkhoz és irányítani azt, elengedhetetlen, hogy kiemelten foglalkozzunk a biztonsággal és az adatvédelemmel. Az OpenAI különféle védelmi intézkedéseket alkalmazott: az Operator mindig kér visszaigazolást a felhasználótól, mielőtt érzékeny műveleteket hajtana végre, mint például online vásárlások lebonyolítása vagy e-mailek küldése. Emellett a rendszer böngészési lehetőségei is korlátozottak, kizárva a potenciálisan kockázatos kategóriákat, például a szerencsejátékot és a felnőtt tartalmakat.
A képernyőképek feldolgozása során az összes információ az OpenAI felhőszolgáltatásába kerül, ami a felhasználók részéről fokozott bizalmat követel meg. Az OpenAI ugyanakkor lehetőséget biztosít az adatok törlésére és a böngészési előzmények eltávolítására, azonban a kritikus vélemények szerint a rendszer továbbra is jelentős kockázatokkal bír.
Az Operator bemutatása egy újabb lépés az ügynökszerű AI-rendszerek fejlődése felé, de az eszköz még gyerekcipőben jár, és számos kihívással kell szembenéznie, mielőtt széles körben elterjedhetne.