A ChatGPT V4 átveszi a lécet, a SAT-okat, és képes azonosítani a kihasználásokat az ETH-szerződésekben

A GPT-4, a mesterséges intelligencia (AI) chatbot, a ChatGPT legújabb verziója, a középiskolai teszteken és a jogi egyetemi vizsgákon a 90. percentilisbe sorolható, és olyan új feldolgozási képességekkel rendelkezik, amelyek az előző verzióval nem voltak lehetségesek.

A GPT-4 teszteredményeinek adatait március 14-én osztotta meg a GPT-XNUMX készítője, az OpenAI, amely bemutatta, hogy képes a kép-, hang- és videobemeneteket szöveggé konvertálni, amellett, hogy kreatívabban és megbízhatóbban kezeli a „sokkal árnyaltabb utasításokat”.

„Szimulált ügyvédi vizsgán sikeres, a tesztet teljesítők felső 10%-a körüli pontszámmal” – tette hozzá az OpenAI. Ezzel szemben a GPT-3.5 pontszáma az alsó 10% körül volt.

A számok azt mutatják, hogy a GPT-4 163 pontot ért el a 88. percentilisben az LSAT vizsgán – a tesztfőiskolai hallgatóknak le kell tenniük az Egyesült Államokban, hogy felvételt nyerjenek a jogi egyetemre.

*A GPT-4 és GPT-3.5 vizsgaeredményei egy sor legutóbbi amerikai vizsgán. Forrás:* *OpenAI*

A GPT4 pontszáma jó pozícióba helyezné a 20 legjobb jogi egyetemre való felvételt, és csak néhány ponttal marad el az olyan rangos iskolákba való felvételhez szükséges pontszámoktól, mint a Harvard, a Stanford, a Princeton vagy a Yale.

A ChatGPT korábbi verziója csak 149 pontot ért el az LSAT-on, ezzel az alsó 40%-ba került.

A GPT-4 298-ból 400 pontot ért el az egységes ügyvédi vizsgán is – a nemrég végzett joghallgatók által elvégzett teszten, amely lehetővé tette számukra, hogy ügyvédként gyakoroljanak az Egyesült Államok bármely joghatóságában.

*Az egyesült államokbeli joghatóságokban az UBE-pontszámokat fel kell venni az ügyvédi gyakorlatra. Forrás:* *Ügyvédi Vizsgálók Országos Konferenciája*

A ChatGPT régi verziója nehézségekbe ütközött ebben a tesztben, az alsó 10%-ban végzett 213 ponttal a 400-ból.

Ami a SAT bizonyítékokon alapuló olvasás és írás és a SAT matematika vizsgákat illeti, amelyeket az amerikai középiskolás diákok egyetemi felkészültségük mérésére tettek le, a GPT-4 a 93., illetve a 89. percentilisben ért el.

A GPT-4 a „kemény” tudományokban is jeleskedett, jóval átlag feletti percentilis pontszámot ért el AP biológiában (85-100%), kémiában (71-88%) és fizika 2-ben (66-84%).

Az AP Calculus pontszáma azonban meglehetősen átlagos volt, a 43-59. percentilis közé sorolható.

Egy másik terület, ahol a GPT-4 hiányzott, az angol irodalom vizsgáiban volt, ahol a pontszámokat a 8-tól 44-ig terjedő százalékos tartományban írták ki két külön teszten.

Az OpenAI szerint a GPT-4 és a GPT-3.5 ezeket a teszteket a 2022-2023-as gyakorlati vizsgákon vette át, és a nyelvi feldolgozó eszközök „nincs speciális képzés”:

„Nem végeztünk speciális képzést ezekre a vizsgákra. A vizsgákon fellépő problémák egy kisebb részét a modell látta a képzés során, de az eredményeket reprezentatívnak tartjuk.”

Az eredmények a Twitter közösségben is félelmet keltettek.

Kapcsolódó: Hogyan befolyásolja a ChatGPT a Web3-teret? Iparág válaszol

Nick Almond, a FactoryDAO alapítója mondta március 14,300-én 14 4 Twitter-követőjének azt mondta, hogy a GPTXNUMX „megijeszti az embereket”, és „összeomolja” a globális oktatási rendszert.

Az értékelési elmélet évekig az életem nagy részét képezte. Sok évvel ezelőtt ezen a napon dühöngtem. Szó szerint úgy hangoztam, mint a rezidens hajtókar akkoriban.
De… ez valójában azt jelenti, hogy innentől kezdve mindennek vége, kivéve a felügyelt értékelést.
— drnick ️² (@DrNickA) Március 14, 2023

A Coinbase korábbi igazgatója, Conor Grogan elmondta, hogy egy élő Ethereum intelligens szerződést illesztett a GPT-4-be, és azonnal rámutatott több „biztonsági sebezhetőségre”, és felvázolta, hogyan lehet kihasználni a kódot:

Beírtam egy élő Ethereum szerződést a GPT-4-be.
Egy pillanat alatt rávilágított számos biztonsági sérülékenységre, és rámutatott azokra a felületekre, ahol a szerződés kihasználható. Ezután ellenőrizte, hogy milyen konkrét módon tudom kihasználni a szerződést pic.twitter.com/its5puakUW
- Conor (@jconorrogan) Március 14, 2023

A ChatGPT korábbi intelligens szerződés-auditjai azt találták, hogy az első verzió is képes volt megfelelő mértékben kiszűrni a kódhibákat.

Rowan Cheung, a „The Rundown” mesterséges intelligencia hírlevél alapítója megosztott egy videót, amelyen a GPT egy kézzel rajzolt hamis weboldalt ír át egy papírra kódba.

Most néztem, ahogy a GPT-4 egy kézzel rajzolt vázlatból működőképes weboldalt csinál.
Ez őrültség. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Március 14, 2023