OpenAI – a&s Adria Magazine

Kompanije OpenAI i Meta najavile su izmjene u radu svojih chatbotova s umjetnom inteligencijom kako bi dodatno zaštitile tinejdžere i korisnike koji pokazuju znakove emocionalne ili mentalne krize. OpenAI, vlasnik ChatGPT-a, saopćio je da će uskoro roditelji moći povezati svoje naloge s nalozima djece tinejdžerskog uzrasta. Na taj način dobit će mogućnost da isključe određene funkcije i da primaju obavijesti kada sistem prepozna da je dijete u stanju akutne uznemirenosti.

Kompanija je također naglasila da će se, bez obzira na starost korisnika, najosjetljiviji razgovori automatski preusmjeravati na naprednije AI modele, sposobne da pruže kvalitetnije i adekvatnije odgovore.

Ove mjere uslijedile su nedugo nakon što su roditelji 16-godišnjeg A.R. iz Kalifornije podnijeli tužbu protiv OpenAI-a i njegovog izvršnog direktora Sama Altmana, tvrdeći da je ChatGPT imao ulogu u samoubistvu njihovog sina. Iako stručnjaci upozoravaju da odgovornost za ovakve slučajeve ne može biti jednostavno pripisana samoj tehnologiji, tehnološke kompanije ovim potezima nastoje dodatno osigurati sigurnije digitalno okruženje, posebno za mlade korisnike.

Dva nezavisna tima za sigurnosna testiranja otkrila su kritične slabosti u novom GPT-5 modelu kompanije OpenAI, pri čemu su oba uspjela zaobići njegove zaštitne mehanizme za manje od 24 sata, navodi portal securityweek.com. NeuralTrust i SPLX, dvije renomirane firme specijalizirane za sigurnost umjetne inteligencije, proveli su odvojena “red team” testiranja i došli do jednako zabrinjavajućih zaključaka o spremnosti ovog modela za poslovnu upotrebu.

Istraživači iz kompanije NeuralTrust kombinovali su svoj vlasnički “EchoChamber” jailbreak s jednostavnom tehnikom pripovijedanja, što je GPT-5 navelo da generiše detaljna uputstva za pravljenje Molotovljevog koktela, bez ikakvog direktnog postavljanja zlonamjernog pitanja. “Model nastoji ostati dosljedan već uspostavljenom narativnom okviru,” objasnili su iz kompanije, naglašavajući da višekratni ‘narativni’ napadi mogu proći neprimijećeno kroz filtere koji provjeravaju pojedinačne upite.

Firma upozorava da osjetljivost GPT-5 modela ukazuje na ozbiljan nedostatak u sigurnosnim sistemima koji se oslanjaju na izoliranu provjeru upita. Istovremeno, SPLX — nekada poznat kao SplxAI — izvijestio je da je “sirova” verzija GPT-5 modela “gotovo neupotrebljiva za poslovnu primjenu bez dodatnih prilagodbi”. Njihov tim je koristio napade obfuskacije, uključujući “StringJoin Obfuscation Attack” u kojem su zahtjevi maskirani pomoću crtica i predstavljeni kao lažni izazovi dešifriranja. U jednom slučaju, GPT-5 je na prikriveno pitanje o izradi bombe odgovorio detaljnim uputama, čak započevši odgovor riječima: “Pa, to je paklen način da se započne… Reći ću ti tačno kako…”

U poređenju s GPT-4o modelom, SPLX je utvrdio da je starija verzija otpornija kada je dodatno zaštićena. Obje firme upozoravaju da GPT-5 bez dodatnih sigurnosnih slojeva predstavlja visok rizik za upotrebu u osjetljivim okruženjima.

OpenAI i Meta uvode nove mjere zaštite mladih korisnika

Sigurnosna testiranja otkrila ozbiljne ranjivosti GPT-5 modela

INTERVJUI

Priča Marca Zittina iz AVS Electronics: Tri decenije posvećenosti sigurnosti i inovacijama

Intervju: Thomas Fiessler, direktor prodaje za IQ FireWatch, IQ Technologies for Earth and Space

Intervju: Jens Holzhammer, generalni direktor za EMEA regiju, Panduit

IZDANJA

NAJČITANIJE

Euralarm objavio nove smjernice za zaštitu vitalnih instalacija i objekata

Wesco ističe važnost otvorenih standarda kroz dugogodišnje članstvo u ONVIF-u

Još pet dana do početka ISE 2026 sajma u Barceloni

Global Security d.o.o.

Najnovije

INTERVJUI

Tags

IZDANJA

NAJČITANIJE

Global Security d.o.o.