Amikor pár éve az AI megjelent, sokan érezték úgy, hogy „elveszik a munkát”. Erről, sokat beszéltünk a képzéseimen is. Aztán kiderült, hogy nem elvette, hanem átalakította. Kevesebb manuális feladat, több kreatív dolog. Kevesebb tűzoltás, több tervezés. Már akkor is azt jósolták, hogy hamarosan az AI írja a programokat és alkalmazásokat.
Azóta is ugyanez történik újra, csak gyorsabban.
Az utóbbi hónapokban egyre gyakrabban látom azt, hogy fejlesztők nem azért írnak kevesebb kódot, mert lusták lennének, hanem mert nincs már értelme mindent kézzel megírni. Az AI nem „segít”, hanem konkrét munkarészeket vesz át. És ez most először nem elméleti vita, hanem napi gyakorlat.
Egy friss írásban a Anthropic vezérigazgatója, Dario Amodei egészen konkrét állítást fogalmazott meg: szerinte 6–12 hónapon belül az AI képes lesz elvégezni a szoftverfejlesztők munkájának nagy részét, akár egészét is.
Ez a mondat önmagában félrevezető lenne. A részletek viszont sokkal érdekesebbek.
Amodei szerint az Anthropicnál már most dolgoznak olyan mérnökök, akik egyáltalán nem írnak kódot. Az AI generálja, ők pedig szerkesztik, ellenőrzik és döntéseket hoznak. Ez nem kísérlet, hanem működő munkamodell.
Az állítások szerint ehhez a Claude Opus 4.5 modellt használják, és az Anthropic egyik új terméke, a Cowork, szinte teljes egészében AI által generált kóddal készült el, nagyjából másfél hét alatt. A projekt mögött álló Boris Cherny pedig azt nyilatkozta, hogy az elmúlt hónapban a Cowork-höz való hozzájárulásainak 100%-át AI írta, ő pedig szerkesztett és irányított.
Ez fontos pont: nem arról van szó, hogy „a gép mindent megold”, hanem arról, hogy a fejlesztői munka súlypontja eltolódik.
És itt jön az a kérdés, amit szerintem érdemes feltenni. Nem az a kérdés, hogy eltűnnek-e a fejlesztők. Hanem az, hogy mivé válik a fejlesztői munka, hol lesz az emberi hozzáadott érték, és mit jelent ez cloud, DevOps, architect és platform oldalról.
Amit ma az AI nagyon hatékonyan csinál, az a repetitív, szabályalapú munka. API-k váza, CRUD logika, config fájlok, pipeline-ok első verziói, Terraform sablonok. Ezek eddig is sok időt vittek el, és kevés valódi üzleti döntést igényeltek. Ha ezt átveszi egy eszköz, az nem veszteség, hanem felszabaduló kapacitás.
Viszont vannak határok, és ezt az eredeti cikk is hangsúlyozza.
Több, egymástól független szakember is kritikát fogalmazott meg. David Heinemeier Hansson, a Ruby on Rails megalkotója szerint az AI-alapú kódolási eszközök még nem érik el egy junior fejlesztő megbízhatóságát, különösen akkor, amikor valódi üzleti rendszerekről, nem pedig demókról van szó.
Hasonlóan óvatosan fogalmazott Matt Garman, az Amazon Web Services vezetője is. Szerinte a junior fejlesztők kiszorítása rövid távon hatékonynak tűnhet, de hosszú távon veszélyes, mert ők jelentik a jövő szakmai utánpótlását. Ha nincs tanulási út, nem lesz tapasztalt szakember sem.
Sok fejlesztő gyakorlati tapasztalata is ezt erősíti meg. Az AI gyakran jól működik izolált példákon, de valós rendszereknél rendszeresen hibázik – én is sokszor tapasztalok hasonlókat – , főleg igen speciális esetekben és biztonsági kérdéseknél. Ezeknél a hibáknál pedig nem hivatkozhatunk arra, hogy „ezt az AI írta”.
Cloud és DevOps szemmel nézve számomra egyértelmű a kép. Kevesebb lesz a kézzel írt kód, de nagyobb lesz a felelősség. Több architekturális döntés, több költség- és security kompromisszum, több platform-szintű gondolkodás. Nem az tűnik el, aki ért a rendszerekhez, hanem az a szerep, amely csak végrehajt.
Az eredeti cikk konklúziója szerint a szoftverfejlesztői szakma nem szűnik meg, de példátlan tempóban alakul át. A mérnökök egyre inkább olyan szerepbe kerülnek, amit talán legjobban úgy lehet leírni, hogy AI-t irányító és felügyelő szakemberek lesznek. Kevesebb aktív gépelés, több döntés, több kontroll.
Ha ebből egy dolgot érdemes hazavinni, az szerintem ez:
Nem az a kérdés, hogy az AI tud-e kódot írni. Hanem az, hogy te tudod-e, mit miért íratsz meg vele.
Ha ezek a kérdések benned is felmerülnek, érdemes róla beszélni. Írj nyugodtan, szívesen megosztom a saját tapasztalataimat.
Az előző cikk végén ott hagytuk abba, hogy 2026-ban a cloud már nem cél, hanem eszköz. Egy gondolkodásmód, amire a legtöbb digitális rendszer épül. A következő lépés viszont már nem pusztán erről szól. Az igazi változás ott kezdődik, amikor az AI nem csak használja ezt az alapot, hanem formálni is kezdi a felhőt.
Ez a cikk erről a személetváltásról szól. Nem arról, hogy melyik modell jobb, és nem is technikai útmutató. Sokkal inkább arról, milyen szerepe lett és lesz az AI-nak a cloud működésében, és milyen következményei vannak ennek technológiai, gazdasági és döntési szinten.
Az AI szerepe a Cloud-ban megváltozott
Az AI ma már nem külön projektként jelenik meg a felhőben. Nem egy újabb doboz a sok közül, hanem platformszintű képesség. A cloud szolgáltatók nem egyszerűen futtatási környezetet adnak hozzá, hanem olyan rétegeket építenek köré, amelyek az AI-t beemelik a mindennapi működésbe. Mindehol ott a Co-Pilot jellegű működés, amely arra hivatott, hogy segítse a mindennapjainkat. Bár néha kifejezetten idegesítő.
Ez jól látszik abban, ahogyan a hyperscalerek pozicionálják az AI-t. Nem egyetlen „AI termékről” beszélnek, hanem olyan szolgáltatásokról, amelyek architektúra-tervezést, skálázást, költségoptimalizálást vagy incidensek értelmezését is támogatják. Fontos: Az AI nem helyettesít, hanem döntési teret alakít át.
Azure, AWS és GCP – „minden út Budára vezet”
A Microsoft Azure esetében az AI erősen az LLM-vonal köré szerveződik. Az Azure OpenAI Service és az erre épülő enterprise megoldások azt mutatják, hogy az AI szorosan integrálódik az üzleti folyamatokba. Nem önmagában érdekes, hanem azért, mert ott jelenik meg, ahol a felhasználók dolgoznak. Persze ez csak egy nagyon apró része annak az AI funkcionalitásnak és trendnek, amit ma ismerünk.
Az AWS más irányból érkezett. Régóta erős a machine learning területén, és ezt a tapasztalatot vitte tovább platformlogikába. A Bedrock a generatív AI-t teszi elérhetővé felügyelt módon, míg a SageMaker AI a klasszikus ML-életciklust fedi le. Az üzenet itt nem a modell, hanem az eszköztár és az irányíthatóság.
A Google Cloud Platform pedig azért érdekes, mert az AI nem új irány nála. A Google belső rendszerei évek óta AI-ra épülnek, és ez a szemlélet jelent meg a Vertex AI köré szervezett cloud kínálatban. Itt az adat és az AI szoros összekapcsolása kerül fókuszba.
A közös pont mindhárom esetben az, hogy az AI nem kiegészítő, hanem a platform működésének része lett.
Miért lett a cloud az AI természetes közege?
Sokan még mindig hardveroldalról közelítik meg az AI-t: milyen GPU kell hozzá, mennyi memória, elég-e egy erős otthoni gép. Ez a gondolkodás érthető, de egyre kevésbé írja le a valóságot.
A cloud egyik legnagyobb előnye az AI esetében nem pusztán a teljesítmény, hanem a skálázhatóság és az időbeliség. Olyan erőforrások érhetők el rövid időre is – több terabájt memória, több nagy teljesítményű GPU egy környezetben –, amelyek otthoni vagy kisebb on-prem környezetben nem reálisak.
A valódi szemléletváltás azonban ott történik, hogy az AI jellemzően felügyelt (managed) szolgáltatásként jelenik meg. Nem kell CPU-, RAM- vagy GPU-konfigurációval foglalkozni, nem kell drivereket, frameworköket karbantartani. Ezeket a problémákat a platform kezeli.
Személyes megjegyzésként idekívánkozik, hogy 2026-ban én is szert tettem egy aránylag erős helyi gépre, kifejezetten AI-val való kísérletezésre és fejlesztésre. Egy Ryzen 7 7800X3D, 64 GB RAM és egy RTX 3090 24GB körüli konfiguráció már alkalmas arra, hogy kis- és közepes modellekkel dolgozzak, tanuljak, prototípusokat építsek.
De ez a tapasztalat inkább megerősítette bennem: amit helyben lehet, az tanulás és kísérletezés.Amint skálázni, párhuzamosítani vagy üzemszerűen használni szeretnék, a cloud egyszerűen más ligában játszik.
És itt előtérbe kerül az árazás és az árazási modellek megértése a felhőben. Otthon az a kérdés, hogy elég-e a gép. A felhőben az, hogy mennyibe kerül, ha így használom. Ez az egyik oka annak, hogy az AI a cloud-ban nem hobbi-megoldásként, hanem üzemszerűen terjedt el.
Az AI hatása a hardverpiacra
Az AI és a cloud együtt nem csak szoftveres változást hozott. A hardverpiacon is érezhető a hatása. Az adatközponti AI igény nem csak GPU-kat szív fel, hanem memóriát is – különösen nagy sávszélességű és szerveroldali megoldásokat.
A piaci elemzések és üzleti hírek egyre gyakrabban kötik össze a memóriaárak alakulását az AI-adatközpontok növekvő igényével. A hangsúly eltolódott: a gyártók és beszállítók számára a hyperscalerek váltak a legfontosabb ügyfelekké.
A változás egyik leglátványosabb következménye az árakon látszik. Egyes GPU- és memóriaszegmensekben 2024–2025 során 1,5–3× közötti áremelkedés volt tapasztalható, különösen ott, ahol az adatközponti AI-igény közvetlenül megjelent. Ez nem egységes a teljes piacon, de jól mutatja az irányt: amikor a hyperscalerek és nagyvállalatok tömegesen vásárolnak, a fogyasztói és kisebb üzleti piac háttérbe szorul.
Ezt a folyamatot jól szemlélteti az NVIDIA bevételeit bemutató ábra. A sávok azt mutatják, hogyan vált a Data Center (DC) üzletág – vagyis a Cloud-os, AI-fókuszú infrastruktúra – a domináns bevételi forrássá, miközben a Gaming és az egyéb szegmensek aránya háttérbe szorult. A grafikon nem csak növekedést, hanem súlypont-eltolódást jelez: az AI ma már elsősorban adatközpontokban él.
Adatbiztonság és a félreértések
Az AI + Cloud kapcsán az egyik legtöbb bizonytalanságot az adatkezelés okozza. Sok félelem nem konkrét tapasztalatból, hanem feltételezésekből fakad. Gyakori gondolat, hogy a Cloud-os AI „biztos betanítja az adatokat”.
A valóság ennél árnyaltabb. A nagy cloud szolgáltatók dokumentációja különbséget tesz az alapértelmezett működés és az explicit engedélyezett tréning között. Enterprise környezetben az ügyféladatok jellemzően elkülönítve maradnak, és nem kerülnek más ügyfelekhez vagy alapmodell-tréningbe engedély nélkül.
Ugyanakkor fontos kimondani: a cloud nem varázslat. Az adatbiztonság nem automatikus. A shared responsibility modell itt is érvényes. A platform adja az alapokat, de a jogosultságkezelés, a hozzáférések és az adathasználat kontrollja továbbra is az ügyfél döntése.
A félelmek egy része abból fakad, hogy sokan a mai napig nem értik pontosan, hogyan működik egy AI. A modell, a tréning, az inference és az adatkezelés gyakran egyetlen „fekete dobozzá” mosódik össze a fejekben. Ha nem világos, mi történik egy kérdés elküldésekor, hol fut a feldolgozás, és mi marad meg belőle, akkor természetes reakció a bizalmatlanság. Ez a bizonytalanság nem rosszindulatból fakad, hanem információhiányból.
Ezért a zavar valószínűleg 2026-ban sem fog teljesen eltűnni. Nem azért, mert a szolgáltatók ne lennének egyre transzparensebbek, hanem mert az AI használata gyorsabban terjed, mint ahogy a szervezetek megtanulják helyesen értelmezni a működését.
Mit várhatunk 2026-ban az AI + Cloud területén?
Az AI és a Cloud együtt nem új trend, hanem új működési környezet. Kevesebb manuális döntés látszik, de több döntés történik a háttérben. Kevesebb technikai akadály, de nagyobb felelősség.
Azok járnak jól ebben a világban, akik nem csodát várnak az AI-tól, hanem értik, mire használják, és hajlandók felelősséget vállalni a döntéseikért.
2026-ban az AI nem egy kísérleti technológia lesz, hanem egy stratégiai alapvetés, amely a cloud működésének mindennapi részévé válik. A nagy technológiai szolgáltatók és elemzők szerint több irányban is érdemes felkészülni:
• Az AI szerepe tovább mélyül: A korábbi „AI mint eszköz” fázist teljesen felváltja az „AI mint partner” logika – az AI nem csak kérdésekre válaszol, hanem támogatja a döntéseket, együttműködik munkafolyamatokban és gyorsítja a kutatást. Ez nem csak technikai előny, hanem szervezeti és működési átalakulás is.
• Agentic AI és intelligens automatizálás erősödik: A vállalati környezetben 2026-ra szélesebb körben terjednek az olyan AI-agentek, amelyek nem csak input-output feladatokat végeznek, hanem autonómabban lépnek kölcsönhatásba rendszerekkel és döntési folyamatokkal.
• Adat és AI governance fókuszba kerül: A fogyasztók és szervezetek egyre nagyobb figyelmet fordítanak arra, hogyan használja az AI az adatokat, hogyan magyarázható és kontrollálható a működése. Ez nem csupán technikai kérdés, hanem a bizalom és jogi megfelelés alapja.
• Biztonság és infrastruktúra kiemelt téma: A növekvő AI-használat új támadási felületeket és identitás-vezérelt kihívásokat hoz, ezért a kiberbiztonság nem csak háttérfeladat, hanem stratégiai prioritás lesz az AI + Cloud környezetben.
Ezek az irányok nem csupán az én gondolataim, hanema legfrissebb szakmai előrejelzésekkel egybevágó vélemény is.
Az AI nem külön dolog többé, hanem a Cloud működésének szerves, strukturális része lesz.
2026-ban már nem az a kérdés, használod-e az AI-t a Cloudban, hanem az, hogy jól használod-e. Ha ebben szeretnél biztosabb lenni, iratkozz fel az InfoPack hírlevélre vagy kövesd a cikkeimet.
Az elmúlt években látványosan felgyorsult a mesterséges intelligencia fejlődése. Ami pár éve még kísérleti játéknak tűnt, ma már napi szinten segít fejlesztésben, elemzésben, ügyféltámogatásban vagy akár tartalomkészítésben. Én is végigkövettem ezt az utat az első, még bizonytalan válaszokat adó modellektől egészen a mai, komplex rendszerekig. Ebbe a folyamatba illeszkedik bele a ChatGPT 5.2 megjelenése, ami egyértelműen nem csak egy apró frissítés, hanem egy fontos lépcsőfok lehet.
Ez egy új verziója az 5-ös modellnek, amitől én azt várom, hogy nem lesz olyan mogorva és merev. Habár meg kell jegyezni, hogy nemrég érkezett frissítés, hogy kiválasztható az 5.1-es modellhez a beszédstílusa, sokat javított az 5-ös okozta csalódáson. A 5.2 azonban már alapjaiban próbál reagálni ezekre az észrevételekre, nem csak felszíni finomhangolással.
Kezdjük azzal, hogy mit jelent a ChatGPT 5.2 a gyakorlatban. Ez jelenleg az OpenAI legfejlettebb, úgynevezett „frontier” modellje, amelyet kifejezetten valós feladatokra és agent jellegű működésre optimalizáltak. Ez utóbbi azt jelenti, hogy nem csak válaszol egy kérdésre, hanem képes hosszabb folyamatokban gondolkodni, eszközöket használni, és több lépésen keresztül eljutni egy eredményig.
A frontier modell kifejezés az aktuálisan elérhető legfejlettebb, technológiai élvonalat képviselő AI modelleket jelenti. Ezek a modellek mutatják meg, meddig jutott el adott pillanatban a mesterséges intelligencia képességekben, például gondolkodásban, kódolásban, képfeldolgozásban vagy komplex feladatok megoldásában. Jellemzően nem tömegfelhasználásra optimalizáltak, hanem új határokat feszegetnek, és irányt mutatnak a következő generációs, szélesebb körben elérhető modellek számára.
Kontextus kezelés
Az egyik legfontosabb előrelépés a hosszú kontextus kezelése. Egyszerűen fogalmazva: a modell sokkal jobban megérti a hosszú dokumentumokat, összetett leírásokat vagy „adatgazdag” anyagokat. Ha például egy több oldalas specifikációról, riportokról vagy vegyes, nem teljesen egyértelmű információkról van szó, a 5.2 lényegesen stabilabban tartja a fonalat – Állítja az OpenAI. Nem véletlen, hogy olyan cégek számoltak be erről pozitívan, mint a Notion, a Box vagy a Databricks.
AgenticAI
Szintén komoly előrelépés történt az eszközhívások terén. A ChatGPT 5.2 jobban tud külső rendszerekhez, API-khoz vagy belső funkciókhoz nyúlni, és ezek használatát megbízhatóbban illeszti bele egy hosszabb folyamatba. Ez azoknál a megoldásoknál különösen fontos, ahol az AI nem csak „beszélget”, hanem ténylegesen műveleteket végez, adatot kér le, majd az eredményt tovább dolgozza fel.
Vizuális képességek
A modell jelenleg az OpenAI legerősebb látásalapú megoldása. Diagramok, dashboard-ok, felhasználói felületek értelmezésében több mint 50 százalékkal csökkentek a hibák. Ez nekem azért különösen érdekes, mert egyre több üzleti alkalmazás és belső rendszer vizuális elemekre épül, ahol eddig az AI gyakran félreértelmezett összefüggéseket.
Kódírás
Fejlesztői szemmel a kódolási képességek erősödése sem elhanyagolható. A ChatGPT 5.2 átveheti a vezetést is a komplex programozási feladatokat mérő benchmark-okon. Nem csak új kód generálásában jobb, hanem hibakeresésben, refaktorálásban és meglévő rendszerek javításában is. Ez nem azt jelenti, hogy kivált egy fejlesztőt, de nagyon komoly gyorsító eszközzé válik a mindennapi munkában.
Túlgondolás?
Technikai szempontból fontos újdonság, hogy a modell a feladat bonyolultságához igazítja a gondolkodását – Hurrá! Ez az ahol az 5.1-es modell is megbukott. Jó hír, hogy az API-ban külön beállítható, mennyi „érvelési energiát” használjon: a legegyszerűbb válaszoktól egészen az extra magas szintű, mély elemzésekig. Ez nem csak minőségi, hanem költségszempontból is releváns, mert pontosabban lehet optimalizálni a felhasználást.
Drágább lett, de nem mindenkinek
Az árakról is érdemes őszintén beszélni. A ChatGPT 5.2 körülbelül 40 százalékkal drágább, mint az 5-ös és az 5.1-es verziók. Ugyanakkor a gyorsítótárazott bemenetekre jelentős kedvezmény jár, és elérhető különböző feldolgozási módokban, beleértve a batch feldolgozást is. Ez azt jelzi, hogy a modell elsősorban professzionális, üzleti és fejlesztői felhasználásra lett pozícionálva.
A remény
Összességében én úgy látom, hogy a ChatGPT 5.2 egy érettebb, kiegyensúlyozottabb lépés előre. Nem forradalmi abban az értelemben, hogy mindent újraírna, de nagyon határozottan a „használhatóbb AI” irányába mozdul. Ha az 5-ös modell kicsit hűvös és merev volt, a 5.2 már inkább egy jól képzett, megbízható munkatárs benyomását kelti. Kezdőknek pedig azért különösen érdekes, mert jól mutatja, merre tart az AI: kevesebb látványos ígéret, több valódi, mindennap használható fejlődés.
Remélem hosszútávon sikerül kellemesen csalódnom ebben a modellben, ugyanis, jelenleg szinte teljesen átálltam Claude Sonnet 4.5 és Claude Opus 4.5 modellek pro verzióinak használatára. Nem csupán a mindennapokban, hanem a kódolásban is.
Nem rég fejeztem be egy videós képzési anyagot a Mentor Klub részére, ahol a résztvevők megismerhették az Azure-on belül elérhető OpenAI megoldásokat. Ennek részeként bemutattam az Azure OpenAI Studio felületét is, ami valójában az Azure AI Foundry egyik funkcionális eleme. Mindkettőt elég gyakran használom, különböző projektekben és különböző célokra. Hogy éppen melyik a jobb egy adott feladathoz, azt többnyire az aktuális projekt igényei döntik el.
A Microsoft azonban az elmúlt hónapokban egy olyan változtatást indított el, amely alapjaiban alakítja át azt, ahogyan eddig AI-megoldásokat építettünk Azure-ban. A Foundry platform fokozatosan átveszi az Azure OpenAI Studio szerepét, kiszélesítve annak lehetőségeit és egységesítve az AI-fejlesztés teljes ökoszisztémáját.
Mi volt az Azure OpenAI Studio szerepe
A Microsoft az Azure OpenAI Studio felületet arra hozta létre, hogy egyszerű legyen kipróbálni és tesztelni az Azure által kínált OpenAI modelleket. A felület segítségével lehetett:
modelleket kipróbálni egy játszótérben
finomhangolt modelleket kezelni
API-végpontokat és kulcsokat elérni
kötegelt feldolgozást és tárolt befejezéseket használni
értékeléseket futtatni
és még sok hasznos AI programozást segítő funkciót.
Az Azure OpenAI Studio azonban alapvetően egy modelltípusra, az Azure által értékesített OpenAI modellekre épült. Ez a projektjeim során is érezhető volt: ha más modellgyártó megoldását szerettem volna használni, akkor azt külön kellett integrálni vagy külső szolgáltatásból kellett elérni.
Ez az a pont, ahol a Foundry teljesen más szemléletet hoz.
Mit kínál a Microsoft Foundry?
A Microsoft Foundry egy egységes AI-platform, amely több modellszolgáltatót, több szolgáltatást és teljes életciklus-kezelést egy felületre hoz. A Microsoft Learn dokumentum így fogalmaz: a Foundry egy nagyvállalati szintű platform, amely ügynököket, modelleket és fejlesztői eszközöket egy helyen kezel, kiegészítve beépített felügyeleti, monitorozási és értékelési képességekkel .
A legfontosabb különbségek a következők.
Széles modellkínálat
Az Azure OpenAI-val szemben a Foundry nem korlátozódik egyetlen gyártóra. Elérhetők többek között:
Azure OpenAI modellek
DeepSeek
Meta
Mistral
xAI
Black Forest Labs
Stability, Cohere és más közösségi modellek
És ez még csak a jéghegy csúcsa.
Ügynökszolgáltatás és többügynökös alkalmazások (AgenticAI)
A Foundry API kifejezetten ügynökalapú fejlesztéshez készült, ahol több modell és komponens együttműködésére van szükség.
Egységes API különböző modellekhez
A Foundry egységes API-t biztosít, így a fejlesztőnek nem kell minden gyártó logikáját külön megtanulnia.
Vállalati funkciók beépítve
A Foundry felületén eleve jelen vannak:
nyomkövetés
monitorozás
értékelések
integrált RBAC és szabályzatok
hálózati és biztonsági beállítások
Gyakorlatilag, minden ami a nagyvállalati és biztonságos működéshez elengedhetetlen.
Projektalapú működés
A Foundry projektek olyan elkülönített munkaterületek, amelyekhez külön hozzáférés, külön adatkészletek és külön tároló tartozik. Így egy projektben lehet modelleket, ügynököket, fájlokat és indexeket is kezelni anélkül, hogy más projektekhez keverednének.
Amikor még csak Azure OpenAI-val dolgoztam, előfordult, hogy egy ügyfél Meta vagy Mistral modellt szeretett volna kipróbálni összehasonlításként. Ezt külön rendszerben kellett megoldani. A Foundry megjelenésével ugyanabban a projektben elérhetővé vált:
GPT-típusú modell
Mistral
Meta
DeepSeek
és még sok más
Egy projekten belül egyszerre lehet kísérletezni, mérni és értékelni különböző modellek viselkedését.
Mit jelent ez a felhőben dolgozó szakembereknek
A Foundry nem egyszerűen egy új kezelőfelület. A gyakorlati előnyei:
Egységes platform, kevesebb különálló eszköz
Könnyebb modellválasztás és modellváltás
Átláthatóbb üzemeltetés, biztonság és hálózatkezelés
Bővíthető modellkínálat
Konszolidált fejlesztői élmény és API
A dokumentáció többször hangsúlyozza, hogy a Foundry nemcsak kísérletezésre, hanem üzleti szintű, gyártásra kész alkalmazásokra is alkalmas. Ez a mindennapi munkában is érezhető.
Miért előnyös ez a vállalatoknak
A vállalatok számára a Foundry több szempontból stratégiai előrelépés:
Egységes biztonsági és megfelelőségi keretrendszer
Több modellgyártó támogatása egy platformon
Könnyebb üzemeltetési kontroll
Gyorsabb AI-bevezetési ciklus
Rugalmasabb fejlesztési irányok
A Foundry megjelenésével a cégek már nem csak egyetlen modellre vagy ökoszisztémára építenek, hanem több szolgáltató képességét is bevonhatják anélkül, hogy töredezett lenne a rendszer.
Tulajdonság
Azure OpenAI
Foundry
Közvetlenül az Azure által értékesített modellek
Csak Azure OpenAI
Azure OpenAI, Black Forest Labs, DeepSeek, Meta, xAI, Mistral, Microsoft
Partner és Közösség modellek a Marketplace-en keresztül – Stability, Cohere stb.
✅
Azure OpenAI API (köteg, tárolt befejezések, finomhangolás, értékelés stb.)
Az Azure OpenAI Studio jó kiindulási pont volt az Azure AI-képességeinek megismerésére és modellek kipróbálására.
A Microsoft Foundry azonban túlnő ezen a szerepen: egységes platformot biztosít a teljes AI-fejlesztési életciklushoz, több modellgyártóval és kiterjesztett vállalati funkciókkal.
A Microsoft nem leváltja az Azure OpenAI-t, hanem beépíti egy nagyobb, átfogóbb rendszerbe. Ez a lépés hosszú távon kiszámíthatóbb, hatékonyabb és sokkal rugalmasabb AI-fejlesztést tesz lehetővé.
Aki régóta dolgozik AWS-el, mint én is, jól ismeri azokat az értesítéseket, amelyekben a szolgáltató biztonsági vagy karbantartási okokból módosításokat kér az infrastruktúrán. Október végén ismét érkezett egy ilyen e-mail, ezúttal az Amazon Bedrock felhasználóinak címezve. A levélben az Anthropic Claude 3.7 Sonnetmodell kivezetéséről (deprecation) értesítik az ügyfeleket.
A Claude 3.7 Sonnet modellt az AWS Bedrockon keresztül sok fejlesztő és szervezet használta az elmúlt hónapokban különféle természetes nyelvi feldolgozási (NLP) és generatív AI feladatokra. Az Anthropic most hivatalosan megkezdte ennek a modellnek a kivezetését, amely több lépcsőben történik.
A legfontosabb dátumok
2026. január 27. – a modell az úgynevezettExtended Accessállapotba kerül. Ez a szakasz már nem tartalmaz új kvótanöveléseket, és a támogatás is korlátozott lesz.
2026. április 28. – a modell End-of-Life (EOL) státuszba kerül, vagyis végleg elérhetetlenné válik. Ezt követően minden, a Claude 3.7 Sonnet modell ID-jére küldött kérés automatikusan hibát fog adni.
Érintett régiók
A változás az összes fő Bedrock-régiót érinti, többek között az európai adatközpontokat is (pl. eu-central-1, eu-north-1, eu-west-1, eu-west-3).
US-EAST-1
US-EAST-2
US-WEST-2
AP-NORTHEAST-1
AP-NORTHEAST-2
AP-NORTHEAST-3
AP-SOUTH-1
AP-SOUTH-2
AP-SOUTHEAST-1
AP-SOUTHEAST-2
EU-CENTRAL-1
EU-NORTH-1
EU-WEST-1
EU-WEST-3
Mit kell tenni?
Az AWS azt javasolja, hogy a felhasználók mielőbb váltsanak az Anthropic Claude Sonnet 4.5 modellre. Ez az új verzió fejlettebb teljesítményt és jobb biztonsági támogatást kínál.
Frissítés lépései az AWS Bedrock konzolon:
Lépj be az Amazon Bedrock konzolra.
A bal oldali menüben válaszd a Model catalog menüpontot.
Keresd meg a Claude 3.7 Sonnet modellt, és jegyezd fel a modellazonosítót (Model ID).
Ezután válaszd ki az új Claude 4.5 Sonnet modellt a listából (Model ID).
A fejlesztői környezetedben (például Python SDK-ban vagy API hívásban) cseréld le a régi modellazonosítót az újra.
A dokumentációkban pontos példák is találhatók, hogyan frissíthető a modell az API-hívásokban vagy SDK-ban. Ezek a Bedrock Model IDs és a Bedrock API Reference oldalon érhetők el.
Összefoglalva
A Claude 3.7 Sonnet kivezetése egy tervezett, fokozatos folyamat, amely 2026 tavaszára zárul le. Akik jelenleg is használják a modellt, érdemes minél előbb átállni a Claude Sonnet 4.5 verzióra, hogy az alkalmazások működése zavartalan maradjon.
Többször mutattam már be LLM-eket korábban. A mesterséges intelligencia világában azonban nagyon magas fordulaton pörögnek a dolgok. Ennek megfelelően várható volt, hogy újabb LLM fejlesztés érkezik ezen a nyáron. 2025. augusztus 7-én az OpenAI bemutatta GPT‑5-öt, a legújabb, legfejlettebb mesterséges intelligencia modelljét. Most a GPT‑5 működését, erősségeit, lehetőségeit és korlátait szeretném bemutatni.
Mi az a GPT-5?
A GPT-5 egy olyan mesterséges intelligencia, amely képes automatikusan eldönteni, hogy a gyors válaszokra optimalizált modellt vagy a részletesebb, alaposabb gondolkodást végző („thinking”) modellt használja. A választás valós időben történik, a kérdés bonyolultsága és a felhasználó célja alapján. A GPT-5 mindenki számára elérhető: a Plus és Pro előfizetők nagyobb használati kerettel dolgozhatnak, a Pro csomag előfizetői pedig hozzáférhetnek a fejlettebb „thinking-pro” változathoz is.
Erősségei
Széles körű szakértői teljesítmény: kiváló képességekkel rendelkezik kódolásban, matematikában, írásban, egészségügyben és bonyolult feladatokban is.
Hatékonyság és racionalitás: gyorsabb válaszokat ad, kevesebb téves információt (hallucinációt), és jobb strukturáltságot nyújt.
Fejlett kódolási képességek: a SWE‑bench Verified kódolási teszten 74,9%-os eredményt ért el, szemben az o3 elődjének 69,1%-ával, miközben kevesebb eszközhívást és tokenfogyasztást igényelt OpenAI.
Felhasználóbarát működés: az intelligens router rendszer automatikusan kiválasztja a feladatnak legjobban megfelelő modellt, megkönnyítve ezzel a használatot különösen kezdőknek.
Integrációk és személyre szabás (Ügynökökkel): Gmail és Google Naptár csatlakozással, valamint személyiségtónus‑beállításokkal bővül a felhasználói élmény.
Lehetőségei
Mindenki közelebb az intelligens asszisztenshez: olvasók, értékesítők, pénzügyi szakemberek mind profin kidolgozott tartalmakat generálhatnak, adatokat összefoglalhatnak vagy folyamatokat optimalizálhatnak akár extra előképzettség nélkül.
Fejlesztők hatékonyabb eszköze: komplex hibák felismerésére, több lépéses feladatok kezelése, teljes körű fejlesztési folyamatok támogatása.
Soknyelvű hozzáférés: nyelvi képességek fejlesztése, így globálisan is szélesebb körben alkalmazható. A magyar nyelvet is tovább csiszolták.
Korlátai
Nem általános mesterséges intelligencia (AGI): bár a GPT-5 teljesítménye sok területen egy PhD-szintű szakértőhöz mérhető, nem rendelkezik azzal a képességgel, hogy önállóan, folyamatosan tanuljon és bármilyen feladatot megoldjon, mint egy ember. Ez azt jelenti, hogy a GPT-5 egy rendkívül fejlett eszköz, de nem az a fajta univerzális mesterséges intelligencia, amely minden helyzetben képes emberi szintű gondolkodásra és döntéshozatalra.
Teljesítmény-ingadozás: eddigi tapasztalatok alapján az automatikus modellválasztás néha bizonytalan minőséget eredményez.
Régebbi modellek korlátozott elérhetősége: GPT‑4 és korábbi modellek már nem állnak a legtöbb felhasználó rendelkezésére, ami szerintem prolémás.
Használati korlátok inaktív felhasználóknak: ingyenes felhasználók díjmentes hozzáférést kapnak, de szigorúbb használati korlátokkal kell számolniuk.
Összegzés
A GPT-5 technológiailag kiemelkedően fejlett, mégis időnként meglepően korlátozottnak tűnik, mintha bizonyos helyzetekben gyengébben teljesítene, mint elődei. Tartalmazza a gyors reagálást, a mélyebb gondolkodást, támogat fejlesztőknek és üzleti felhasználóknak egyaránt, miközben a felhasználói élményt helyezi előtérbe. Ugyanakkor fontos szem előtt tartani a jelenlegi korlátokat, mint az AGI hiánya, teljesítmény-ingadozás vagy a régebbi modellek eltűnése.
Érthető az irány, de egyelőre további fejlesztésre szorul az általános mesterséges intelligencia irányába.
Mióta megjelent az AI és berobbant a köztudatba, folyamatosan ezt hallani: „Elveszi a munkánkat! Jajj, mi lesz velünk? Nem kellenek programozók!”. Mivel én folyamatosan figyelemmel követem ezt a területet, úgy gondoltam, bármennyire is fejlődik az AI, ettől még nagyon messzire vagyunk.
Erre 2025. májusában bejelentette az OpenAI legújabb eszközét a ChatGPT Codex-et. Ekkor még csak külön hozzáféréssel tudtam tesztelni, azonban júniustól, már bárki számára elérhető.
Tehát az elmúlt időszakban volt alkalmam testközelből megszemlélni ezt a megoldást és azt kell mondjam, hogy hatalmas segítséget kaptak a kezdő programozók és DevOps szakemberek.
Ebben a cikkben megpróbálom átadni a ChatGPT Codex hozadékát és azt, hogy miért mérföldkő ez a programozás területén.
A programozás világába való belépés vagy új nyelvek felfedezése gyakran tűnhet bonyolultnak. Az OpenAI ChatGPT Codex megoldása ezt a belépési küszöböt csökkenti. A Codex egy olyan fejlesztés, amely lehetővé teszi, hogy természetes nyelvű utasításokból programkódot generáljunk, közvetlenül a böngészőben, telepítés nélkül.
Mostantól nem kell telepíteni semmilyen fejlesztőkörnyezetet ahhoz, hogy kipróbálj vagy létrehozz egy egyszerű szkriptet vagy progrmokat. Csak nyisd meg a chatgpt.com/codex oldalt, és kezdj el írni – a Codex pedig kódra fordítja az elképzelésedet.
Miért hasznos?
Természetes nyelv alapján is tud kódot írni.
Nem szükséges előzetes fejlesztői környezet vagy telepítés.
Egyetlen felület a kódolásra, futtatásra és hibakeresésre.
Tanulási célokra (pl. „Írj egy Python kódot, amely beolvas egy fáljt”)
Webes sablonok vagy HTML/CSS oldalak gyors összeállítására
Egyszerű adatbázis-lekérdezések vagy API-hívások kipróbálására
Kísérletezésre, új ötletek gyors ellenőrzésére
Miért nagy mérföldkő?
A Codex lehetővé teszi, hogy ne kelljen fejlesztői háttérrel rendelkezned ahhoz, hogy működőképes kódot hozz létre. A korábbi eszközökkel ellentétben itt egy interaktív, kétirányú felületen kommunikálhatsz a modellel: írsz egy szöveget, ő kódot ad – vagy elmagyarázza a meglévőt.
Ez különösen fontos kezdők számára, akik gyakran küzdenek a fejlesztői eszközök bonyolultságával.
Jelentkezz be OpenAI fiókoddal (ingyenesen is használható).
Válaszd ki a kívánt nyelvet vagy kérd meg, hogy javasoljon.
Írj egy természetes nyelvű utasítást, pl. „Írj egy Python függvényt, ami megmondja, hogy egy szám prímszám-e.”
A Codex automatikusan kódot javasol, amit módosíthatsz, lefuttathatsz, és kérhetsz magyarázatot is hozzá.
Mennyibe kerül?
Az alapfunkciók elérhetők a ChatGPT Plus előfizetés keretében.
A Codex jelenleg a GPT-4 modellek részeként működik.
A ChatGPT Plus előfizetés ára: 8900 Ft/hó
Nincs külön díj a Codex funkcióért – ha GPT-4-et használsz, automatikusan elérhető.
Mire alkalmas már most is, és mire nem?
Mire alkalmas:
Kód írása természetes nyelvű utasításból
Egyszerű szkriptek, algoritmusok generálása
Oktatás, példák kipróbálása, tanulás támogatása
HTML, CSS, SQL minták készítése
Mire nem ajánlott:
Nagy, komplex projektek önálló generálása
Biztonságkritikus, validált kód írása emberi átnézés nélkül
Teljes alkalmazások generálása tesztelés és kontroll nélkül
GitHub-integráció: automatikus kódmentés Pull Request formájában
És most jön a legjobb rész! A ChatGPT Codex nemcsak arra képes, hogy egy természetes nyelvű utasításból működő kódot hozzon létre – hanem a megírt kódot automatikusan el is tudja küldeni egy GitHub repóba. Ez különösen hasznos azoknak, akik már valamilyen projektet vezetnek, csapatban dolgoznak, vagy szeretnék elmenteni és verziókövetni saját kódgenerálásaikat. Sőt, kezdőknek kimondottan hasznos, hiszen nem csupán a programozást sajátíthatjék el könnyedén, hanem megérthetik, a modern szoftverfejlesztés folyamatait is.
Ehhez a funkcióhoz csak a következőkre van szükséged:
Legyen egy GitHub-fiókod, és hozz létre egy repository-t (vagy használd a meglévőt).
A chatgpt.com/codex felületen a beállításoknál engedélyezd a GitHub-integrációt.
Válaszd ki a célrepo-t és a branchet.
Írj egy természetes nyelvű, szöveges utasítást, például: „Készíts egy Python-függvényt, ami eldönti egy számról, hogy prímszám-e, és add hozzá a repository-hoz”
A Codex megírja a kódot, commitol-ja, majd Pull Request-et (kód összefűzési kérést) hoz létre a megadott repository-ban.
Látogasd meg a chatgpt.com/codex oldalt, és válaszd ki az Új környezet létrehozása lehetőséget, majd válaszd ki a repository-dat a listából.
Majd adjuk ki a chat mezőbe az utasítást: „Írj egy Python függvényt, ami megmondja, hogy egy szám prímszám-e.” Ekkor elkezdődik a kód generálása és amikor kész, el is magyarázza mit csinl a kód.
A kódunk kész és akár ki is próbálhatjuk, vagy módosíthatjuk, kedvünk szerint.
Ha pedig elégedettek vagyunk a végeredménnyel, akkor jöhet a verziókezelt tárolás a GitHub repository-ban. Hogyan? Egyszerűen megkérjük a modelt, hogy: „Add hozzá a repository-hoz a fájlt”
Ugye, hogy semmi külön prompt engineering tudás nem kellett? Mégis ami következik, az szuper. Létrehoz egy új branch-et a módosításokkal, majd létrehoz hozzá egy Pull Request-et is, amit azonnal ellenőrizhetünk a GitHub-on.
Miután ellenőriztük a módosítások helyességét, máris elvégezhetjük a kódbázis összefűzését.
És még a dokumentációt is írathatunk erről a kódról, vagy tetszőlegesen módosíthatjuk a meglévő kódjainkat.
Ez persze csak egy nagyon egyszerű példa volt. A lehetőségeink elég széles spektrumon mozognak. Javaslom, hogy próbáld ki Te is.
Összefoglalás
A ChatGPT Codex új szintre emeli a programozást: szöveges utasításból kódot generál, lefuttatja, megmagyarázza, és ha szeretnéd, automatikusan GitHub repóba menti Pull Request formájában.
Kezdőknek és haladóknak egyaránt hasznos eszköz, akár tanulásra, akár gyors prototípusokra.
Ha még nem próbáltad, itt az ideje kipróbálni!
Látogasd meg a chatgpt.com/codex oldalt, és próbálj ki egy saját példát – vagy keress meg engem, és szívesen megmutatom, hogyan működik ez a gyakorlatban is.
A mesterséges intelligencia (MI) világa folyamatosan látványos fejlődést mutat. Az egyik legérdekesebb irány a VLM, vagyis a Vision Language Model technológia. Ezek a modellek nemcsak szövegeket értenek meg, mint a hagyományos nyelvi modellek (LLM-ek), hanem képeket is képesek értelmezni.
Koncepció – Mit jelent a VLM?
A VLM (Vision Language Model) olyan mesterséges intelligenciát takar, amely egyszerre képes szöveges és képi információt értelmezni. Ez új szintre emeli az MI lehetőségeit, hiszen az eddigi rendszerek vagy csak szöveggel, vagy csak képpel dolgoztak. A VLM viszont multimodális: a kettőt egyszerre kezeli.
Hasonlat – Mintha egy gyerek könyvből tanulna
Képzeljünk el egy kisgyermeket, aki egy képeskönyvet nézeget. Megnézi a képet, majd a szöveg alapján próbálja megérteni, mi történik. A Vision Language Model ugyanezt teszi: képeket lát és szövegeket olvas, majd ezekből közösen von le következtetéseket.
Hol hasznos ez a technológia?
Egészségügy: orvosi képek (pl. röntgen) értelmezése, diagnosztikai támogatás.
Oktatás: multimodális tananyag-elemzés, képekhez kapcsolódó tartalomgenerálás.
Kereskedelem: termékek automatikus leírása képek alapján.
Grafikon- és diagramértelmezés: üzleti jelentések automatikus értelmezése.
Hogyan működik?
A hagyományos LLM (Large Language Model), mint például a GPT, kizárólag szöveggel tud dolgozni. Amikor beírunk egy kérdést vagy dokumentumot, azt a modell token-ekre bontja – ezek a nyelv számszerű leképezései. Az LLM ezeket a token-eket ú.n. figyelmi mechanizmusok segítségével elemzi, feltárja a közöttük lévő összefüggéseket, majd ezek alapján állít elő egy új szöveges választ.
De mi van akkor, ha a dokumentum képeket tartalmaz? Bonyolult grafikon? Szkennelt ábra? Egyhagyományos LLM nem tud mit kezdeni ezekkel. Itt lép be a képbe a VLM.
A VLM úgy működik, hogy egy új modult vezet be: a vision encoder-t. Ez a rész nem szavakat, hanem képeket dolgoz fel. A képből kinyeri a fontos jellemzőket – formákat, textúrákat, éleket, viszonyokat – és ezt egy úgynevezett feature vector-rá alakítja, vagyis egy tömör, számszerű leképezéssé.
Ezek azonban még nem kompatibilisek az LLM szöveges token-jeivel, ezért egy projektor nevű modul átalakítja őket úgynevezett kép-token-ekké. Most már van szöveg-token-ünk és kép-token-ünk, és ezeket együtt tudja kezelni az LLM. A modell ezek után együttesen értelmezi a szöveget és a képet, és ezek összefüggése alapján ad választ.
Például:
VQA (Visual Question Answering): Megmutatunk egy képet egy forgalmas utcáról, és megkérdezzük: „Mi történik itt?” A válasz lehet: „Egy piros lámpánál várakozó autó, gyalogosok átkelnek.”
Képaláírás generálás: Egy kutyát ábrázoló képre a válasz: „Golden retriever labdát kerget egy parkban.”
Számlák vagy bizonylatok feldolgozása: Szkennelt PDF beolvasása után a modell képes kiolvasni a szöveget, struktúrába rendezni, sőt, összefoglalni a lényeget.
Grafikon-elemzés: Egy pénzügyi jelentésben található diagram alapján kérdezhetjük: „Mi a bevételi trend?” – és a modell választ ad rá.
Miért újdonság?
A LLM-ek már régóta képesek értelmes szöveget generálni, de teljesen vakok voltak a képi információkra. A VLM az első valódi megoldás arra, hogy a mesterséges intelligencia ne csak olvasson, hanem „lásson” is. Ez új távlatokat nyit, hiszen az emberi gondolkodás sem csak szavakból áll – képeket, helyzeteket, kontextusokat is értelmezünk.
A technológia azonban nem hibátlan:
A képek feldolgozása sokkal erőforrásigényesebb, mint a szövegé.
A modell hallucinálhat – azaz olyan válaszokat adhat, amelyek jól hangzanak, de nem igazak, mivel statisztikai minták alapján következtet.
Bias (torzítás) is jelen lehet: ha a tanítóadatok túlnyomórészt nyugati kultúrkörből származnak, más régiók képeit félreértelmezheti.
Miért lesz hasznos a jövőben?
A jövő mesterséges intelligenciája egyre inkább hasonlít majd az emberi gondolkodásra. A VLM-ek ezt a folyamatot gyorsítják fel, hiszen már nemcsak beszélnek, hanem látnak is. Ezáltal sokkal hatékonyabban alkalmazhatók például:
összetett döntéshozatalban,
automatizált dokumentumfeldolgozásban,
vagy akár vizuális tanulási rendszerekben.
VLM vs. LLM – Hasonlóságok és különbségek
LLM (Large Language Model)
VLM (Vision Language Model)
Alap
Nagy nyelvi modell
Nagy nyelvi modell + vizuális feldolgozó modulok
Bemenet
Csak szöveg
Szöveg és kép
Képességek
Szövegalapú válaszadás, szövegírás
Szövegalkotás képi információk alapján is
Kontextus
Csak nyelvi összefüggések értelmezése
Nyelvi és vizuális kontextus együttes értelmezése
Felépítés
Tokenizálás → nyelvi feldolgozás
Kép → feature vector → kép-token → közös feldolgozás
Modulok
Csak nyelvi feldolgozás
Vision encoder, projektor, nyelvi feldolgozás együtt
A Vision Language Model nem egy forradalmi újdonság, sokkal inkább a mesterséges intelligencia természetes fejlődési lépése. Az eddigi nyelvi és vizuális modellek ötvözésével a VLM-ek lehetővé teszik, hogy az MI ne csak olvassa, hanem értelmezze is a képi világot.
Ez új lehetőségeket nyit például dokumentumfeldolgozásban, oktatásban vagy egészségügyben – olyan területeken, ahol eddig emberi látásra és megértésre volt szükség. Bár a technológia még fejlődik, az irány egyértelmű: a mesterséges intelligencia egyre közelebb kerül ahhoz, hogy több érzékszervhez hasonlóan működjön – és ezzel valóban új minőséget képviseljen.
Te hogyan hasznosítanád ezt a tudást a saját területeden?
Legutóbb az MCP-ről írtam egy cikket, majd hamar rájöttem, hogy lehet kicsit lőre szaladtunk. Ezért ma egy kicsit visszalépünk és összehasonlítom nektek a 2025-re beharangozott Agentic AI-t és a már jól ismert genratív AI-t.
A generatív AI már sokak számára ismerős: képes szöveget írni, képet alkotni vagy kódot generálni egy adott utasítás alapján. Azonban a legújabb irányzat az úgynevezett Agentic AI, amely nemcsak válaszol, hanem keres, dönt és cselekszik.
Most jöjjön, hogy mit is jelent az Agentic AI, hogyan viszonyul a generatív AI-hoz, mik az előnyei és korlátai, és milyen szerepet játszik ebben az új protokoll, az MCP.
Mit jelent az Agentic AI?
Az Agentic AI olyan mesterséges intelligencia-rendszer, amely képes autonóm (önálló, független) módon döntéseket hozni és hosszabb távú célokat követni. Ez nem csupán egy „okos chatbot”, hanem egy mesterséges ügynök (agent), amely képes:
feladatokat önállóan lépésekre lebontani és megtervezni
több lépésen keresztül végrehajtani folyamatokat
külső eszközökkel vagy rendszerekkel interakcióba lépni (az illesztett külső alkalmazásokon keresztül)
alkalmazkodni a változó feltételekhez vagy felhasználói visszajelzésekhez
Az Agentic AI tehát nemcsak választ ad, hanem proaktívan cselekszik is. Működését legegyszerűbben úgy képzelhetjük el, mint egy digitális asszisztenst, amely nem várja meg, hogy minden utasítást megadjunk neki, hanem felismeri a célunkat, és ennek megfelelően saját maga tervezi meg a szükséges lépéseket.
Például ha azt mondjuk neki, hogy „segíts egy bulit megszervezni”, akkor nem csak naptárbejegyzést hoz létre, hanem utánanéz a szabad időpontoknak, összehangolja a résztvevőkkel, lefoglal helyszínt, és elküldi a meghívókat – mindezt úgy, hogy közben kérdéseket tesz fel, amelyek alapján döntéseket hoz, és ha változás történik (pl. valaki lemondja, vagy esős idő várható), képes újratervezni az egészet.
Ez a működésmód alapjaiban különbözik a klasszikus AI megközelítéstől, ahol minden lépést nekünk kellett megadnunk. Az Agentic AI lényege tehát a „kezdeményezőképesség” és az alkalmazkodóképesség: nemcsak végrehajt, hanem „gondolkodik” is a cél érdekében.
Ez különösen hasznos ott, ahol a feladat nem egyértelműen definiált, vagy ahol sok apró döntés és külső tényező befolyásolja a végeredményt – például projektmenedzsment, személyi asszisztencia, IT-automatizálás vagy ügyfélszolgálati folyamatok terén.
Ezen automatikus működés, természetesen nem önállóan jön létre, hanem a fejlesztőknek a megfelelő ügynököket rendszerbe kell szerveznie, hogy az AI azokat képes legyen használni, mint egy szakember a szerszámait.
Automatizálni kell egy komplex feladatot (pl. heti riportok lekérése, elemzése és továbbítása)
Egy AI-nak döntéseket kell hoznia (pl. melyik ügyfélnek küldjön follow-up üzenetet)
Több rendszer együttműködésére van szükség (pl. CRM + e-mail + naptár integrációja)
Milyen lehetőségeket kínál az Agentic AI?
Skálázhatóság: Egyszerre több folyamatot képes kezelni emberi beavatkozás nélkül.
Rugalmasság: Képes reagálni a váratlan helyzetekre és tanulni a visszajelzésekből.
Produktivitás: Feladatokat vesz le a vállunkról, amiket eddig manuálisan végeztünk.
Milyen korlátai vannak?
Megbízhatóság: Ha rossz adatból tanul, rossz döntéseket hozhat.
Átláthatóság: Nehéz lehet követni, mi alapján dönt egy komplex rendszer.
Etikai kérdések: Ki a felelős, ha az AI hibás döntést hoz?
Mi az MCP, és hogyan kapcsolódik az Agentic AI-hoz?
Az MCP (Model Context Protocol) egy újfajta szabványosított kommunikációs forma, amely lehetővé teszi, hogy különböző AI modellek és rendszerek hatékonyan együttműködjenek. Az Agentic AI gyakran több különálló képességet és modellt kombinál (pl. adatlekérdezés, döntéshozatal, visszacsatolás). Az MCP biztosítja, hogy ezek a részek egységes módon beszéljenek egymással – hasonlóan, mint az USB-C szabvány a különböző eszközök világában.
Ez különösen fontos, mert az Agentic AI rendszer gyakran több specializált modellt használ (pl. egy nyelvi modellt, egy naptárkezelőt, egy keresőt), és ezek koordinációjához elengedhetetlen a szabványos protokoll, amit az MCP kínál.
Összefoglalás
A Generative AI és az Agentic AI nem versenytársai egymásnak, hanem eltérő igényekre adnak választ. Míg a generatív AI akkor hasznos, ha tartalmat szeretnénk gyorsan előállítani, az agentic AI akkor segít, ha automatizálni akarunk összetett, több lépésből álló munkafolyamatokat. Ahogy én látom, a jövőben a két megközelítés egyre gyakrabban dolgozik majd együtt, szabványosított keretek között – épp ebben segít az MCP.
Ha megérted ezt a különbséget, könnyebben dönthetsz arról, mikor melyik technológiát érdemes alkalmazni a saját projektjeidhez.
Ezután pedig megérkezel az AI egy magasabb szintjére. 🎯
Az utóbbi hetekben sokat olvastam az OpenAI új fejlesztéseiről, és úgy gondoltam, érdemes megosztanom a legfrissebb tapasztalataimat veletek. Azt tudjuk, hogy a jelenlegi világunkban nincs megállás. Folyamatosan rohanunk, ha kell, ha nem. A mesterséges intelligencia területén pedig ez hatványozottan igaz. A nemrég az OpenAI három vadonatúj modellt mutatott be, amelyek jelentős előrelépést hoznak a mesterséges intelligencia terén, különösen azok számára, akik fejlesztői feladatokhoz keresnek megbízható megoldásokat.
A legfontosabb újdonság a GPT-4.1 család: a GPT-4.1, a 4.1 mini és a 4.1 nano modellek. Ezeket kifejezetten fejlesztőknek szánták, és rengeteget fejlődtek a kódolás, utasításkövetés és funkcióhívások terén. Ami engem a legjobban lenyűgözött, az a kontextuskezelés: akár 1 millió tokenes szöveget is képesek átlátni és értelmezni. Ez a valós projektekben hatalmas segítség, mert végre nem kell trükközni az adatok darabolásával.
Miért kiemelkedő ez a szám? Nekem eddig is a GPT-4o volt a kedvencem, mert valódi programozói társam volt. Azonban voltak korlátai. Sok esetben kellett egy-egy komplex gondolatmenet közepén úgy beszélgetést indítanom, ami lelassította munkát és több esetben frusztrált engem. Az új modelltől azt várom, hogy még jobban segíti a munkám és nem ütközöm a korábban említett korlátokba.
Külön öröm számomra, hogy a GPT-4.1 modellek ismét olcsóbbak lettek (26%-al) az elődjüknél, a GPT-4o-nál. A nano verzió pedig minden eddiginél gyorsabb és költséghatékonyabb – ez például tökéletes, ha kisebb, de sokszor ismétlődő feladatokat automatizálok. Itt Te is kipróbálhatod: GPT-4.1
Nem csak a GPT-4.1 újdonságairól érdemes beszélni. Az OpenAI bemutatta az o3 és o4-mini modelleket is. Ezek az érvelési, logikai feladatokban jeleskednek: kódolás, matematika, tudományos problémák és képfeldolgozás terén is kiemelkedőek. Egyik kedvencem az új válaszfolyamat megjelenítés, amely lépésről lépésre mutatja, hogyan gondolkodik a modell a végső válasz előtt. Ez fejlesztőként hatalmas előnyt jelent, hiszen átlátom az AI döntési logikáját. Eddig is voltak eszközök, amelyekkel figyelemmel lehetett kísérni, de most már ezt beépítettem megkapjuk.
Az elmúlt hetekben egyre több fejlesztőtől olvastam véleményeket, akik már most ezeket a modelleket használják a munkájukhoz. Nem véletlenül: gyorsak, pontosak, olcsóbbak és megbízhatóbbak, mint a korábbi verziók. Én is elkezdtem őket tesztelni a saját projektjeimen, és eddig nagyon pozitív tapasztalataim vannak.
Ha te is érdeklődsz a mesterséges intelligencia gyakorlati alkalmazása iránt, mindenképp érdemes kipróbálnod ezeket az új modelleket. A hivatalos dokumentációban minden szükséges információt megtalálsz. Ha elakadsz, akkor pedig szívesen segítek neked.
Én már alig várom, hogy mit hoz a következő OpenAI fejlesztés, mert hamarosan itt az újabb. 🙂
Te melyik modellt használod vagy próbáltad már ki?