A GPT-4, a mesterséges intelligencia (AI) chatbot, a ChatGPT legújabb verziója, a középiskolai teszteken és a jogi egyetemi vizsgákon a 90. percentilisbe sorolható, és olyan új feldolgozási képességekkel rendelkezik, amelyek az előző verzióval nem voltak lehetségesek.
A GPT-4 teszteredményeinek adatait március 14-én osztotta meg a GPT-XNUMX készítője, az OpenAI, amely bemutatta, hogy képes a kép-, hang- és videobemeneteket szöveggé konvertálni, amellett, hogy kreatívabban és megbízhatóbban kezeli a „sokkal árnyaltabb utasításokat”.
„Szimulált ügyvédi vizsgán sikeres, a tesztet teljesítők felső 10%-a körüli pontszámmal” – tette hozzá az OpenAI. Ezzel szemben a GPT-3.5 pontszáma az alsó 10% körül volt.
A számok azt mutatják, hogy a GPT-4 163 pontot ért el a 88. percentilisben az LSAT vizsgán – a tesztfőiskolai hallgatóknak le kell tenniük az Egyesült Államokban, hogy felvételt nyerjenek a jogi egyetemre.
A GPT4 pontszáma jó pozícióba helyezné a 20 legjobb jogi egyetemre való felvételt, és csak néhány ponttal marad el az olyan rangos iskolákba való felvételhez szükséges pontszámoktól, mint a Harvard, a Stanford, a Princeton vagy a Yale.
A ChatGPT korábbi verziója csak 149 pontot ért el az LSAT-on, ezzel az alsó 40%-ba került.
A GPT-4 298-ból 400 pontot ért el az egységes ügyvédi vizsgán is – a nemrég végzett joghallgatók által elvégzett teszten, amely lehetővé tette számukra, hogy ügyvédként gyakoroljanak az Egyesült Államok bármely joghatóságában.
A ChatGPT régi verziója nehézségekbe ütközött ebben a tesztben, az alsó 10%-ban végzett 213 ponttal a 400-ból.
Ami a SAT bizonyítékokon alapuló olvasás és írás és a SAT matematika vizsgákat illeti, amelyeket az amerikai középiskolás diákok egyetemi felkészültségük mérésére tettek le, a GPT-4 a 93., illetve a 89. percentilisben ért el.
A GPT-4 a „kemény” tudományokban is jeleskedett, jóval átlag feletti percentilis pontszámot ért el AP biológiában (85-100%), kémiában (71-88%) és fizika 2-ben (66-84%).
Az AP Calculus pontszáma azonban meglehetősen átlagos volt, a 43-59. percentilis közé sorolható.
Egy másik terület, ahol a GPT-4 hiányzott, az angol irodalom vizsgáiban volt, ahol a pontszámokat a 8-tól 44-ig terjedő százalékos tartományban írták ki két külön teszten.
Az OpenAI szerint a GPT-4 és a GPT-3.5 ezeket a teszteket a 2022-2023-as gyakorlati vizsgákon vette át, és a nyelvi feldolgozó eszközök „nincs speciális képzés”:
„Nem végeztünk speciális képzést ezekre a vizsgákra. A vizsgákon fellépő problémák egy kisebb részét a modell látta a képzés során, de az eredményeket reprezentatívnak tartjuk.”
Az eredmények a Twitter közösségben is félelmet keltettek.
Kapcsolódó: Hogyan befolyásolja a ChatGPT a Web3-teret? Iparág válaszol
Nick Almond, a FactoryDAO alapítója mondta március 14,300-én 14 4 Twitter-követőjének azt mondta, hogy a GPTXNUMX „megijeszti az embereket”, és „összeomolja” a globális oktatási rendszert.
Az értékelési elmélet évekig az életem nagy részét képezte. Sok évvel ezelőtt ezen a napon dühöngtem. Szó szerint úgy hangoztam, mint a rezidens hajtókar akkoriban.
De… ez valójában azt jelenti, hogy innentől kezdve mindennek vége, kivéve a felügyelt értékelést.
— drnick ️² (@DrNickA) Március 14, 2023
A Coinbase korábbi igazgatója, Conor Grogan elmondta, hogy egy élő Ethereum intelligens szerződést illesztett a GPT-4-be, és azonnal rámutatott több „biztonsági sebezhetőségre”, és felvázolta, hogyan lehet kihasználni a kódot:
Beírtam egy élő Ethereum szerződést a GPT-4-be.
Egy pillanat alatt rávilágított számos biztonsági sérülékenységre, és rámutatott azokra a felületekre, ahol a szerződés kihasználható. Ezután ellenőrizte, hogy milyen konkrét módon tudom kihasználni a szerződést pic.twitter.com/its5puakUW
- Conor (@jconorrogan) Március 14, 2023
A ChatGPT korábbi intelligens szerződés-auditjai azt találták, hogy az első verzió is képes volt megfelelő mértékben kiszűrni a kódhibákat.
Rowan Cheung, a „The Rundown” mesterséges intelligencia hírlevél alapítója megosztott egy videót, amelyen a GPT egy kézzel rajzolt hamis weboldalt ír át egy papírra kódba.
Most néztem, ahogy a GPT-4 egy kézzel rajzolt vázlatból működőképes weboldalt csinál.
Ez őrültség. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Március 14, 2023
Forrás: https://cointelegraph.com/news/chatgpt-v4-aces-the-bar-sats-and-can-identify-exploits-in-eth-contracts