OpenAI GPT-5.4: Bilgisayar Kullanimi ve Finansal Eklentiler
OpenAI, GPT-5.4 modelini bilgisayar kullanim modu, Excel ve Google Sheets entegrasyonu ve yuzde 47 daha az token tuketimi ile piyasaya surdu.
OpenAI, GPT-5.3 Instant'in yalnizca iki gun ardindan yeni amiral gemisi modeli GPT-5.4'u duyurdu. Iki varyant mevcut: tum ucretli ChatGPT abonelerine acilan GPT-5.4 Thinking ve yalnizca Pro ile Enterprise kullanicilarina sunulan GPT-5.4 Pro.
Lansmandaki en buyuk baslik bilgisayar kullanimi. GPT-5.4, OpenAI'in Codex ve API uzerinden yerel bilgisayar kullanim yetenekleriyle gelen ilk genel amacli modeli. Kod yazarak Playwright gibi kutuphaneler uzerinden bilgisayar isletebiliyor, ekran goruntulerine bakarak fare ve klavye komutlari verebiliyor. OSWorld-Verified testinde basari orani yuzde 75.0'a ulasti; GPT-5.2'deki yuzde 47.3 ve insanlarin yuzde 72.4'luk performansini geride birakti.
Token verimliligi icin de yeni bir mekanizma var. Tool Search sistemi, tum arac tanimlarini prompt'a yigmak yerine modelin ihtiyac duydugunda arac tanimlarini cekebilmesini sagliyor. Scale'in MCP Atlas benchmark'inda 36 MCP sunucusuyla calisan testlerde, bu yaklasim ayni dogrulugu koruyarak toplam token tuketimini yuzde 47 azaltti.
Kodlama tarafinda GPT-5.4, SWE-Bench Pro'da GPT-5.3-Codex ile esit veya daha iyi performans gosterirken daha dusuk gecikme sunuyor. Codex'teki yeni /fast modu desteklenen modellerde 1.5 kat hizlanma sagliyor. Deneysel "Playwright Interactive" becerisi ise kodlama ve bilgisayar kullanimini birlestirerek web ve Electron uygulamalarini goruntusel olarak debug etmeye olanak taniyor.
Finans sektoru icin ozel bir hamle de geldi. ChatGPT for Excel ve Google Sheets beta surumu, ChatGPT'yi dogrudan hesap tablolarina gomuyor. FactSet, MSCI, Third Bridge ve Moody's entegrasyonlari piyasa verileriini tek bir is akisinda birlestiriyor. OpenAI'in dahili yatirim bankaciligi benchmark'inda model performansi GPT-5 ile yuzde 43.7'den GPT-5.4 Thinking ile yuzde 88.0'a firladi.
Halusinasyonlarda da ciddi iyilesme var. Kullanicilarin daha once hata bildirdigi sorgularda GPT-5.4'un bireysel iddialari yuzde 33 daha az yanlis, tum yanitlari ise yuzde 18 daha az hatali cikiyor. GDPval testinde 44 meslek grubunda GPT-5.4, profesyonellere yuzde 83.0 oraninda eslesti veya onlari gecti.
API'de 1 milyon tokena kadar baglamm penceresi destekleniyor ancak 272.000 tokeni asan istekler icin fiyat ikiye katlaniyor. Fiyatlandirma: GPT-5.4 icin 1M input tokeni 2.50 dolar, output 15 dolar. GPT-5.4 Pro icin input 30, output 180 dolar. Batch ve Flex secenekleri yarim fiyat sunuyor.
Guvenlikon tarafinda OpenAI, GPT-5.4 Thinking'in dusunce zincirinde aldatma egiliminin dusuk oldugunu gosteren yeni bir degerlendirme yayinladi. "Model, muhakemesini gizleme yeteneginden yoksun" gorunuyor ve dusunce zinciri izleme etkili bir guvenlik araci olmayi surduruyor.
GPT-5.4, "yanit uretme"nin otesine gecip surdurulebilir profesyonel is akislarina gecisi temsil ediyor. Arac duzenleme, bilgisayar etkilesimi, uzun baglam ve gercek is ciktilarini bir arada sunmasi, ajansal sistemlerin uretimde daha uygulanabilir hale geldigi anlamina geliyor.