A ChatGPT matekérettségije egy erős 4-es lett

7 min readMay 9, 2023

A ChatGPT hármasra magyarérettségizett tegnap, olvasható a Telexen:

Otthon nem büszkélkedne vele, gyenge hármassal ment át a ChatGPT a mai magyarérettségin

Elkezdődött az érettségi, diákok ezrei stresszelnek legjobb ballagóruháikban. Bár fontos, hogy a hétfői…

telex.hu

A cikkből kiderül, hogy a ChatGPT képes kreatív gondolkodásra, de a műelemzés már túl nehéznek bizonyult, viszont mindez még így is elegendő volt a hármashoz.

A problémám ezzel a teszttel az volt, hogy a telex újságírói valószínűleg a ChatGPT ingyenesen elérhető 3.5-ös verzióját használták, nem pedig a fizetős 4-est, ami egy generációval fejlettebb.

Arról nem is beszélve, hogy angolból valószínűleg sokkal jobban teljesített volna, ami azt jelenti, hogy:

a hibás válaszok ebben az esetben nem a ChatGPT intelligenciáját mutatják, hanem a rávilágítanak arra a problémára, hogy magyar nyelven korlátozott mennyiségű információ halmazon lett betanítva.

Ezért találtam ki azt, még mielőtt megjelenik a Telexen a mai ChatGPT matek érettségi, hogy levizsgáztatom én is a fizetős GPT-4-el, ami a me elérhető legfejlettebb LLM vagyis nagy nyelvi modell.

Spoiler Alert: Végeredmények

Az érettségi két részből állt: az első 12 rövid és egyszerűbb feladatból. Ezt a ChatGPT hiba nélkül, maximálisan pontszámmal teljesítette! Ez 30 pontot ért.

A második, nehezebb részben, 3 kötelező feladat volt, ezekre 11, 6 és 3 pontot szerzett.

A második rész, második felében pedig a 16, 17, és 18 feladatokból elég volt kettő szabadon választott feladatot megoldani. Ezekre ChatGPT 17, 6 és 10 pontokat kapott, így értelemszerűen a 16 és 18-as feladatok pontszámati vesszük figyelembe.

Ez összesen 77 pont vagyis egy nagyon erős 4-es

Meg lehet, hogy egy barátságosabb pontozással becsúsztunk volna az 5-ösbe :)

A középszintű érettségi első része

A 12 rövid, egyszerűbb feladatokból álló első vizsgarész megoldására a diákoknak összesen 45 percük volt. Ebben többek között kaptak gráfot, kétismeretes egyenletet, függvényt és százalékszámítást is.

Olvasható a Eduline-on a nem hivatalos megoldásokkal együtt.

Nézzük is, hogyan teljesített a ChatGPT 4.0:

Hibátlan megoldás, tökéletes levezetéssel:

2. Maximális pontszám a második feladatra is:

3. Ennél a feladatnál kicsit trükkösen kellett megfogalmazni a jelöléseket, amiket nem lehet egy az egyben bemásolni a feladatból (B és vonal a B felett), de itt is mindent értett a ChatGPT és a válasz tökéletes mind a két részre:

4. A negyedik feladat függvény ábrázolás volt, amire érdekes szöveges választ kaptunk:

A válasz nem rossz annak figyelembevételével, hogy a ChatGPT nem tud rajzolni, mindenesetre megkértem, hogy írjon program kódot, a grafikon kirajzolására, hogy a választ ellenőrizni tudjuk:

És a végeredmény, amit akkor kapunk ha lefuttatjuk a kódot egy böngészőben, ami pedig nem más, mint a tökéletes megoldás:

5. A legnagyobb közös osztó megtalálása szintén nem okozott problémát, sőt két külön megoldást is kaptunk, amit különböző szituációkra javasol nekünk a chat bot:

6. Újabb maximális pontszám:

7. Ennél a feladatnál állítottam a ChatGPT “fantázia” nevű skáláján, hogy a válasz pontos legyen, így sikerült is megoldani a feladatot probléma nélkül:

8. A nyolcas feladat tökéletes megoldása a 60:

9. Megítéljük a 2 pont a kilencedik feladatra is:

10. Még egy tökéletes megoldás:

11. Tökéletes válasz és levezetés az utolsó előtti feladatra is:

12. És vügül az utolsó, 4 pontos feladat is tökéletesen sikerült:

Az érettségi első felét hiba nélkül, maximális pontszámmal végeztük! 30 pont.

A neheze viszont csak most következik!

A középszintű érettségi második része

A középszintű matekérettségi második feladatlapján összesen öt feladatot kell megoldani, ebből három kötelező és kettő választható.

Írja az Eduline a nem hivatalos megoldásokkal együtt.

13. Ez a feladat kötelező volt, úgyhogy kezdjük is.

Az a) feladatot probléma nélkül értelmezte, az értéket behelyettesítette és megkaptuk a tökéletes megoldást, vagyis a 13,75-öt

A zérushely kiszámolása sem okozott különösebb gondot a b) feladatrészben…

A hosszú és kimerítő válaszokra a c) és d) részekben is megadhatjuk a maximális pontszámot!!

14. Ez a feladat volt az első, ami komoly gondot okozott a ChatGPT-nek vélhetően azért, mert az ábrát nem tudjuk neki megmutatni, a kérdésnek és a válasznak is szöveges alapúnak kell lennie. Úgy döntöttem tehát, hogy az a fer, ha szövegesen leírom, hogy mi is látható az ábrán és úgy kérjük, hogy oldja meg a feladatot:

Az a) rész válasza ugyan helyes, de a levezetésben én találtam logikai hibákat és úgy tűnik, hogy az ábrát is rosszul értelmezte kissé. 2 pontot ítélek meg az 5-ből.

A b) résznél a szög számítás teljesen rossz és kissé komikus is úgyhogy erre 0 pont jár.

A c) megoldás viszont tökéletes és helyes, jár a 4 pont.

15. A világnépességes kérdés szintén okozott némi problémát, viszont bajban voltam, hogy itt hogyan pontozzak, hisz a válaszok nem egyértelműen rosszak…

Az a) részben például tökéletes a szöveges értelmezés és a levezetés is viszont látszik, hogy a 78. hatványra emelés hibás eredményével számol. Én erre megadok 1 pontot a háromból.

A b) részben is hasonló a helyzet> látszik, hogy eljutottunk odáig, hogy ki kell számolni a log(12/8)/log(1+0.01) értéket, amire a megoldás 40.75, de a ChatGPT-nek 49.66 jön ki… én erre is 1 pontot ítélek meg.

Végül a c) résznél is láthatjuk a tökéletes egyenletet: (10.35/8)^(1/78) amelyre sajnos rossz megoldás érkezett. 1 pont.

Érthető, hogy hibás válaszra nem jár pont, de ennek ellenére látható, hogy a ChatGPT intelligens és képes tökéletesen értelmezni a feladatot, számológép nélkül viszont nem boldogul ilyen bonyolult számításoknál.

Végülis az érettséginél is lehet számológépet használni, és a részeredmények megadásával a ChatGPT is maximális pontszámot kapott volna!

16. Ez a feladat, mivel szöveges értelmezésről volt szó, megint csak jól sikerült:

Itt az a) b) és c) feladatok is teljesen tökéletesek voltak!

A kördiagram rajzolását is megoldotta a ChatGPT szög definíciókkal amibe nehéz lenne belekötni, ahogyan a 11340-es válaszba sem az utolsó részben:

Maximális pontszám!

17. Még egy feladat, ami egy geometria formával kapcsolatos. A feladatban látható ábrát itt sem tudjuk megmutatnia a ChatGPT-nek.

Az A csúcsnál lévő szög valóban 60 fokos, a megoldás jó, ahogyan a BD átló hossza is 20,8 cm volt.

A csonkakúp számítása teljsen rossz, az eredmény 2742,46 köbcenti, ahogyan a d) feladat is rossz lett. Ezek nulla pontot érnek.

18. Az utolsó feladat ábrázolása megint kihívást jelentett, hisz a ChatGPT nem látja az ábrákat. Azt találtam ki, hogy Excel táblázat szerűen reprezentálom a területi viszonyokat és ez alapján kell, hogy minden értsen:

Az a) részben az volt a feladat, hogy rajzoljuk meg a gráfot, amit a ChatGPT szövegesen vitt véghez. Az általam definiált cellák alapján a megoldás tökéletes. Az eredeti feladatban a cellák kissé el voltak csúszva úgy, hogy a C és D cellák is szomszédosak, ezt nem tudtam szövegesen reprezentálni, de ha tudtuk volna a megoldás is jó lett volna. Én megítélem a maximálisan pontszámot itt.

A b) rész egyszerű volt, és a megoldás is jó.

A c) rész is könnyen ment, jár a maximum pont.

Az utolsó d) feladat viszont problémát okozott és az egyenleteket rosszul írta fel ChatGPT. Lehetséges, hogy itt is problémát okozott az excel cellák értelmezése…, sajnos erre nem tudunk pontot adni.

Konklúzió

Szerintem elképesztő, hogy már ezen a szinten tartunk és hogy a ChatGPT 4-es verziója képes ilyen szintű feladatok értelmezésére és megoldására.

Arról nem is beszélve, hogy a legtöbb gondot a vizuális ábrák átadása okozta, viszont néhány hónapon belül érkezik a GPT azon verziója, aim képes bármilyen képet értelmezni, úgy, mint egy ember, legyen az egy fénykép, ábra vagy infógrafika. Ennek fényében szinte biztos vagyok benne, hogy a középszintű érettségi jövőre csillagos ötös lesz!