Amit tudnod kell a GPT-4-ről, a generatív AI ChatGPT nemrégiben kiadott utódjáról, valamint a mesterséges intelligencia etikájával és a mesterséges intelligencia törvényeivel

Íme, amit a ChatGPT utódjáról, nevezetesen a nemrég megjelent GPT-4-ről tudni kell.

getty

Mi a szokásos reakciód, amikor megjelent egy nagy címlapokat megragadó kasszasikerfilm folytatása?

Vannak, akik megnézik a folytatást, és kijelentik, hogy az ugyanolyan jó, ha nem még jobb, mint az eredeti. Másoknak rendkívül nagy elvárásaik lehetnek, és miután megnézték az újabb filmet, azt mondják, hogy jó, bár nincs mit üvölteni. Vannak, akik kétségtelenül rendkívül csalódottak lesznek, függetlenül attól, hogy mit tartalmaz a legújabb film, és összefoglalóan kijelentik, hogy az első film gátlástalanul a folytatás felett volt.

Ugyanezek a reakciók és érzelmek kerültek előtérbe az AI-gyártó, az OpenAI GPT-4 tegnapi kiadásában, amely a Pi napján, azaz 3.14. március 14-én vagy március 2023-én kerül megrendezésre. Valószínűleg véletlen egybeesés a matematikus kedvenc tortáján. Az étkezés napján a GPT-4 bemutatása nagy sajtófigyelmet és terjedelmes csevegést keltett a közösségi médiában.

Itt leírom a GPT-4 főbb jellemzőit és képességeit, valamint összehasonlítom elődjével, a ChatGPT-vel (a hasonlatomban a kezdeti „blockbuster”). Ezen túlmenően rengeteg igazán létfontosságú mesterségesintelligencia-etikai és mesterséges intelligenciajogi megfontolás kapcsolódik a generatív MI-hez, beleértve, és talán különösen a GPT-4 és a ChatGPT esetében, azok kétségtelenül széles körben elterjedt és őrjöngő média és közfigyelem miatt. jelen és jövő AI.

Röviden, csakúgy, mint egy film folytatása, a GPT-4 bizonyos szempontból jobb, mint a ChatGPT, például nagyobb, gyorsabb és látszólag gördülékenyebb, míg más szempontból további és kifejezett aggályokat vet fel (ezekre fogok kitérni rövidesen itt). Kicsit zavaros reakció. A folytatás nem egy slam-dunk, amire sokan számítottak. Kiderült, hogy a dolgok ennél árnyaltabbak. Úgy tűnik, ez az igazi világ, amelyben mindannyian élünk.

Talán az OpenAI vezérigazgatója, Sam Altman mondta ezt a legjobban 14. március 2023-i tweeteiben a GPT-4 bevezetéséről:

„Itt van a GPT-4, az eddigi legjobb és legmegfelelőbb modellünk. Ma már elérhető az API-nkban (várólistával) és a ChatGPT+-ban.”
"Még mindig hibás, még mindig korlátozott, és még mindig lenyűgözőbbnek tűnik első használatkor, mint azután, hogy több időt töltesz vele."

Javaslataim arra vonatkozóan, hogy mit tehet a GPT-4 kiadása miatt, és a fennálló helyzetétől vagy körülményeitől függően, a következő lehetséges műveletekből áll:

Meglévő ChatGPT-felhasználók. Ha már használja a ChatGPT-t, alaposan meg kell vizsgálnia a GPT-4-et, hogy megtudja, érdemes-e használni helyette (vagy használhatja a GPT-4-et a ChatGPT mellett, tehát a ChatGPT vagy a GPT valamelyikét használja -4, a felmerülő igényektől függően). Játszhat a GPT-4-gyel, ha előfizet a ChatGPT Plus-ra, amely a ChatGPT használatának havi 20 dolláros előfizetési módja, különben jelenleg nem igazán van könnyű hozzáférése a GPT-4-hez (a figyelmeztetés vagy a csavar az, hogy A Microsoft Bing keresőmotor a GPT-4 egy változatát használja, amelyet az itt található linken tárgyaltam).
Soha nem használt generatív AI-t. Ha nem használ ChatGPT-t, és soha nem használt generatív AI-t, érdemes először a ChatGPT-vel kezdenie, mivel az ingyenesen elérhető (vagy természetesen fontolja meg a számtalan más generatív AI alkalmazás használatát az utazás megkezdéséhez ebbe a mesterséges intelligencia birodalmába). A GPT-4 jelenleg nem ingyenes, amint azt a fenti, a meglévő ChatGPT-felhasználókra vonatkozó pontokban említettük. Miután megtette a lábát a ChatGPT-vel, eldöntheti, hogy megéri-e előfizetni a ChatGPT Plus szolgáltatásra, hogy további előnyökhöz jusson, beleértve a GPT-4 hozzáférését.
Más generatív AI használata. Ha a ChatGPT-től eltérő generatív mesterségesintelligencia-alkalmazást használ, előfordulhat, hogy a GPT-4 nagy érdeklődésre tarthat számot, mivel a ChatGPT által kínált fejlesztéseken túlmenően is rendelkezik. Ezt azért említem meg, mert néhány hozzáértő AI-felhasználó úgy döntött, hogy a ChatGPT nem olyan jó számukra, mint más lehetőségek. Azt javaslom, hogy tájékozódjon a GPT-4-ről, hogy eldönthesse, a jelenlegi választása továbbra is a legjobb-e az Ön számára. Lehet, hogy. Így nem azt javaslom, hogy mindenképpen válts GPT-4-re, és csak azt mondom, hogy mindig megfontolandó a többi elérhető autó abroncsát rúgni.
Egyéb szoftver, amely az API-n keresztül éri el a ChatGPT-t. Azok számára, akik olyan szoftvereket készítenek, amelyek az API-n (alkalmazásprogramozási felületen) keresztül csatlakoznak a ChatGPT-hez, amelyet az itt található linken tárgyaltam, bölcs dolog, ha alaposan megvizsgálják a GPT-4 használatát az API-n keresztül. Az egyik nagy kérdés, hogy a GPT-4 API használatának költsége sokkal magasabb, mint a ChatGPT használatának. Érdemes lenne egy kompromisszumos elemzést végezni a GPT-4 hozzáadott előnyeiről a ChatGPT-hez való ragaszkodás alacsonyabb költségű alternatívájához képest. Ez egy kissé bonyolult döntés. Tedd ezt tudatosan, és ne ész nélkül.

Sokak számára sokkolónak tűnik, hogy a hírérték nem egészen a korábban várt szintre emelkedett.

Engedjék meg, hogy elmagyarázzam, miért.

Az eredeti kasszasiker és most a folytatása

Valószínűleg tudja, hogy tavaly november végén elérhetővé tették a ChatGPT néven ismert generatív AI alkalmazást.

Ez meglepő nagy siker volt.

Addig a generatív mesterségesintelligencia-alkalmazások nagyközönség számára történő közzétételére irányuló korábbi erőfeszítéseket általában megvetéssel és felháborodással fogadták. Az aggodalmak alapja az volt, hogy a generatív mesterséges intelligencia képes olyan kimeneteket produkálni, amelyek mindenféle rosszindulatú kimenetet tartalmaznak, beleértve a trágár nyelvezetet, az ízléstelen torzításokat, a hazugságokat, hibákat, sőt kitalált tényeket vagy ún. AI hallucinációk (Nem szeretem ezt a „hallucinációk” terminológiát, mivel hajlamos az MI antropomorfizálására, lásd a vitámat az itt található linken).

A generatív mesterséges intelligencia egy olyan típusú mesterséges intelligencia, amely a felhasználó által beírt szöveges promptokból kimeneteket generál, például képes szöveges esszéket készíteni vagy generálni, képeket vagy grafikákat, hangot vagy videót stb. a továbbiakban: szöveg-szöveg, szöveg-esszé, szöveg-művészet, szöveg-kép, szöveg-hang, szöveg-videó és hasonlók. A generatív mesterséges intelligencia figyelemre méltó oldala, hogy a generált művek látszólag egyenrangúak az ember által generált kimenetekkel. Nehéz dolga lenne megkülönböztetni a generatív mesterséges intelligencia kimenetet egy összehasonlítható kompozíciótól, amelyet kizárólag az emberi elme és az emberi kéz állít elő.

Ha többet szeretne megtudni a generatív mesterséges intelligenciáról, tekintse meg a folyamatban lévő sorozatomat, például ezt a linket, amely a ChatGPT és a generatív AI alapjairól szól, valamint a ChatGPT hallgatói általi lefedettségéről és az esszékkel kapcsolatos esetleges csalás problémáiról (használja az itt található linket), ami nagyon megkérdőjelezhető használat ChatGPT mentálhigiénés tanácsokkal (lásd a linket itt), a lehetséges plágiummal és a generatív mesterséges intelligencia szerzői jogainak megsértésével kapcsolatos aggodalmakat (a link itt), és még sok más kiemelkedő témát az itt található linken.

Az ok, amiért úgy tűnik, hogy a ChatGPT nem kapta meg a szokásos ostorcsapást, részben az AI-gyártó, az OpenAI színfalak mögötti munkája volt a ChatGPT kiadása előtt. Különféle technikákkal és technológiákkal próbáltak visszaszorítani a különösen gyűlöletkeltő és gyalázatos esszéket. Ne feledje, hogy a ChatGPT kizárólag a generatív AI szöveg-szöveg vagy szöveg-esszé stílusa. Így a különös és dühítő kimenetek megakadályozására tett kísérletek a szavakkal való foglalkozásból állnak. Hasonló problémák merülnek fel, ha a kimenet művészet vagy képek, bár ezt ugyanolyan vagy még nehezebb elkapni, hogy megakadályozzuk az ilyen vagy olyan sértő képalkotások létrejöttét.

Egy figyelemre méltó technika, amelyet a mesterséges intelligencia-készítők egyre inkább magukévá tesznek, a használat RLHF (tanulás megerősítése emberi visszacsatoláson keresztül). Íme, hogyan működik ez általában. Miután egy generatív mesterségesintelligencia-alkalmazást kezdetben adatok betanítottak, például szövegeket szkenneltek az interneten, az emberi felülvizsgálókat felhasználják, hogy segítsenek eligazodni vagy bemutatni a mesterséges intelligencia számára, mit érdemes mondani, és mit botrányos mondani. A jóváhagyások és elutasítások ezen sorozata alapján a generatív mesterséges intelligencia hozzávetőlegesen képes összeegyeztetni azt, ami megfelelőnek tűnik a kibocsátáshoz, és mi az, ami nem megengedett.

Szeretnék még egy rendkívül fontos pontot megemlíteni.

Az AI nem érző.

Nem számít, mit állítanak a bolondos címek, biztos lehetsz benne, hogy a mai mesterséges intelligencia nem érző. A generatív mesterséges intelligencia számára az alkalmazás egy kiterjedt számítási mintaillesztő szoftver és adatmodellező berendezés. Az internetről származó szavak millióinak vizsgálata után a szavakra és statisztikai összefüggéseikre vonatkozó minták származnak. Az eredmény az emberi nyelv mimikájának csodálatos formája (néhány MI bennfentes ezt a sztochasztikus papagáj, ami kimondja a lényeget, bár sajnálatos módon egy egyébként érző elemet visz be a vitába).

Szövegszerkesztő csomag használatakor a generatív mesterséges intelligencia az automatikus kiegészítési funkcióra gondolhat, bár ez sokkal átfogóbb és fejlettebb képesség. Biztos vagyok benne, hogy elkezdett írni egy mondatot, és van egy automatikus kiegészítése, amely a mondat hátralévő részére javasolt megfogalmazást. Az olyan generatív mesterséges intelligencia esetén, mint a ChatGPT, be kell írnia egy promptot, és az AI-alkalmazás megpróbálja nem egyszerűen befejezni a szavait, hanem meg akarja válaszolni a kérdéseket, és megírja a teljes válaszokat.

Ezen túlmenően egy újonc hiba, amelyet sokan elkövetnek a ChatGPT vagy bármely más hasonló generatív mesterséges intelligencia alkalmazás használatakor, azzal jár, hogy nem használják ki a dicsért interaktív társalgási képességeket. Vannak, akik beírnak egy felszólítást, majd várnak a válaszra. Úgy tűnik, azt hiszik, ez minden. Egy és kész. De ebből hiányzik a generatív mesterséges intelligencia lényege. A hasznosabb megközelítés abból áll, hogy egy sor felszólítást hajtunk végre a generatív MI-vel folytatott párbeszédhez. Itt ragyog igazán a generatív AI, lásd a példáimat az itt található linken.

A ChatGPT-t a média és a nagyközönség elképesztő áttörésként hirdette az AI-ban.

A valóság az, hogy sok más hasonló AI-alkalmazást is kidolgoztak, gyakran kutatólaboratóriumokban vagy agytrösztökben, és néhány esetben óvatosan elérhetővé tették a nyilvánosság számára. Ahogy fentebb is mondtam, az eredmény általában nem volt szép. Az emberek bökdösték és piszkálták a generatív MI-t, és szörnyű természetű esszéket sikerült szerezniük, lásd a tudósításomat az itt található linken. Az AI-gyártók ezekben az esetekben általában kénytelenek voltak kivonni a mesterséges intelligenciát a nyílt piacról, és visszatérni a laboratóriumi felhasználásra vagy a gondosan kiválasztott mesterséges intelligencia bétatesztelőire és fejlesztőire.

A mesterségesintelligencia-ipar többi részének nagy része meg volt döbbenve, hogy a ChatGPT-nek sikerült megkerülnie a továbbra is rossz eredményeket produkáló kötelet, mégsem olyan mértékben, ahogyan a közvélemény arra kényszerítette volna az OpenAI-t, hogy távolítsa el az AI-alkalmazást a teljes hozzáférésből.

Ez volt a ChatGPT igazi sokkja.

A legtöbben azt feltételezték, hogy a sokk a megismerő képesség volt. Nem az AI-ban élőknek. Az a meglepetés, amely szinte az összes mesterséges intelligencia bennfentesét lenyűgözte, az volt, hogy ki lehetett szabadítani egy generatív mesterséges intelligenciát, amely gyűlöletkeltő beszédet szórhat ki, és a visszahatás nem volt elég heves ahhoz, hogy gyors visszavonulást kényszerítsen ki. Aki tudta? Valójában a ChatGPT megjelenése előtt a pletyka azt jósolta, hogy néhány napon vagy legfeljebb héten belül az OpenAI megbánja, hogy az AI alkalmazást minden felhasználó számára elérhetővé teszi. Korlátozniuk kellene a hozzáférést, vagy esetleg hazamenniük, és levegőt venniük.

A ChatGPT bevezetésének hihetetlen sikere óvatosan megnyitotta az ajtót más generatív AI-alkalmazások előtt is, hogy találkozzanak az utcán. Például beszéltem arról, hogy a Google bemutatta Bard-ot, és hogyan hevülnek az internetes keresőmotorok háborúi a generatív mesterséges intelligencia hagyományos webes keresésbe való beillesztésének vágya miatt, lásd a linket itt.

A ChatGPT ésszerűen kasszasikerként jellemezhető. Ez is a semmiből jött, hogy úgy mondjam. Előfordul, hogy egy kasszasiker filmről előre tudjuk, hogy valószínűleg kasszasiker lesz a megjelenés után. Más esetekben a film egy alvó, amely meglepi a közvéleményt, és még a filmkészítőt is. Ez történt a ChatGPT-vel és az OpenAI-val.

Oké, megvan a kasszasiker, a ChatGPT.

A ChatGPT alapvetően a GPT GPT-3.5 néven ismert verzióján alapul. Korábban volt GPT-3, GPT-2 és hasonlók. A mesterséges intelligencia világa és a mesterséges intelligencia által érintettek mind tudták, hogy az OpenAI a következő verzión, a GPT-4-en dolgozik.

A GPT-4 a ChatGPT utódjának vagy folytatásának tekinthető.

Ez visszavezet minket a filmekkel kapcsolatos hasonlatomhoz. A ChatGPT, a meglepetés kasszasiker hatalmas népszerűségnek örvendett. A várakozások azzal kapcsolatban, hogy mi lesz a GPT-4, és hogyan reagál a közvélemény, tele voltak vad találgatásokkal. A GPT-4 vízen járna! A GPT-4 gyorsabb lesz, mint egy száguldó golyó! A GPT-4 az érző mesterséges intelligencia vagy a mesterséges általános intelligencia (AGI) elérése lesz!

Ez ment tovább és tovább.

Talán homályosan tudja, hogy az OpenAI vezérigazgatója, Sam Altman ezt mondta a YouTube-on közzétett interjúban (17. január 2023-én): „A GPT-4 pletyka egy nevetséges dolog. Nem tudom, honnan jön ez az egész. Az emberek könyörögnek, hogy csalódjanak, és az is lesz. A hírverés olyan, mint… Nincs tényleges AGI-nk, és nagyjából ez az, amit elvárnak tőlünk.”

Nos, itt van a GPT-4.

Kijött a film.

A saját szemünkkel láthatjuk. Nincs több megszelídíthetetlen spekuláció. A valóság beköszöntött.

Csomagoljuk ki a csillogó új játékot.

A GPT-4 alapjai

Kétségtelenül tudni szeretné, mit nyújt a GPT-4.

Beszélgetésem során az OpenAI által a GPT-4-ről elérhetővé tett különféle dokumentumokra és videókra fogok hivatkozni, valamint megjegyzéseket teszek a GPT-4 használata alapján. A megbeszélés megkönnyítése érdekében kérjük, vegye figyelembe, hogy van két praktikus dokumentum, amelyeket szívesen idézek, az egyik az OpenAI hivatalos címe. GPT-4 műszaki jelentés a másik pedig az OpenAI hivatalos GPT-4 rendszerkártya dokumentum (mindkettő elérhető az OpenAI webhelyén). A rövidítésekkel idézem őket TR az GPT-4 műszaki jelentés és a SC az GPT-4 rendszerkártya.

Kezdjük azzal, hogy idézzük a TR absztraktjának legelső mondatát:

"Beszámolunk a GPT-4 fejlesztéséről, egy nagyszabású, multimodális modellről, amely képes kép- és szövegbevitelt fogadni, valamint szöveges kimeneteket készíteni."

Akár hiszi, akár nem, sok minden benne van ebben az egy mondatban.

Ülj le, és igyál egy kényelmes italt a kezedben.

Az egyik általánosan elfogadott ökölszabály a generatív mesterséges intelligencia kapcsán az, hogy minél nagyobb a rendszer, annál valószínűbb a folyékonyság és az általános képesség. Ezt viszonylag jól megalapozottnak tűnik a generatív mesterséges intelligencia rendszerek történelmileg növekvő mérete, valamint az interaktív beszélgetések lefolytatásának egyre figyelemreméltóbb folyékonysága. Nem mindenki hiszi el, hogy ennek így kell lennie, és vannak kutatók, akik aktívan keresnek kisebb méretű rendszereket, amelyek különféle optimalizálásokat alkalmaznak, hogy potenciálisan annyit érjenek el, mint nagyobb testvéreik.

A TR GPT-4-ről szóló fent idézett mondatában megfigyelhette azt a megfogalmazást, hogy ez egy „nagy léptékű” generatív mesterséges intelligencia. A mai generatív AI-rendszerek relatív méretei alapján valószínűleg mindenki csereként egyetértene.

Az MI bennfenteseinek nyilvánvaló kérdése az, hogy mekkora az nagyarányú ha a GPT-4-ről van szó?

A mesterséges intelligencia gyártója általában büszkén deklarálja generatív mesterséges intelligencia különböző méretezési mutatóit. Ezt megteheti, hogy tájékoztassa a mesterséges intelligencia világ többi részét arról, hogy a méret és a lépték mennyire számít. Megteheti, hogy dicsekedjen. Megteheti ezt egyszerűen azért, mert olyan, mint egy autó, amelyben természetes kíváncsiság, hogy mekkora motor van benne, és milyen gyorsan megy.

A TR szerint a következőket jelzik:

„Tekintettel a versenykörnyezetre és a nagyméretű modellek, például a GPT-4 biztonsági vonatkozásaira, ez a jelentés nem tartalmaz további részleteket az architektúráról (beleértve a modell méretét), a hardverről, a képzési számításokról, az adatkészlet felépítéséről, a képzési módszerről vagy hasonlókról.”

Az MI bennfentesei ezt hajlamosak elbűvölőnek találni. Egyrészt zavaró szakításnak tűnik a diplomáciával, ha nem beszélünk ezekről a döntő jellemzőkről. Ennek ellenére az a logika, amely szerint ez felfedhet saját titkokat, vagy esetleg ajtót nyithat a kiberbiztonsági páncélök előtt, nos, ennek is logikusnak tűnik.

Arra kell-e kényszeríteni a mesterséges intelligencia készítőit, hogy felfedjék a generatív mesterséges intelligencia egyes jellemzőit, olyan mértékben és módon, hogy véletlenül ne adjanak ki semmilyen létfontosságú árulkodó nyomot?

Hagyom, hogy vegye fel az AI etikai kalapját, hogy elgondolkozzon ezen a megfontoláson.

Egyesek úgy vélik, hogy új mesterséges intelligencia-törvényeket is létrehozhatunk, amelyek kifejezett közzétételt igényelnek.

Úgy gondolják, hogy a közvéleménynek tudnia kell, mi történik az MI-vel, különösen akkor, ha az AI egyre nagyobb lesz, és feltehetően megvan a lehetősége arra, hogy végül az egzisztenciális kockázatok szörnyű zónájába kerüljön, lásd elemzésemet az itt található linken.

Továbbhaladva azt sem tudjuk, hogy milyen adatokat használtak a GPT-4 betanításához.

Az adatok előidézik vagy megszakítják a generatív AI megjelenését. Vannak, akik tévesen azt feltételezik, hogy az Internet egészét átvizsgálták, hogy kidolgozzák ezeket a generatív AI-képességeket. Dehogy. Valójában, amint azt az itt található linken tárgyalom, az internetnek csak egy pici részét vizsgálják.

Ehhez kapcsolódó szempont, hogy a generatív AI valós időben szkenneli-e az internetet, és menet közben módosítja-e a számítási mintaillesztést. A ChatGPT azokra a vizsgálatokra korlátozódott, amelyekre legkésőbb 2021-ben került sor. Ez azt jelenti, hogy a ChatGPT használatakor gyakorlatilag nincs adat arról, hogy mi történt 2022-ben és 2023-ban.

A pletykák arról szóltak, hogy a GPT-4 naprakész és valós idejű internetkapcsolatot fog tartalmazni a menet közbeni beállításhoz.

A TR ezt írja:

„A GPT-4 általában nem ismeri azokat az eseményeket, amelyek azután történtek, hogy a képzés előtti adatok túlnyomó többsége 2021 szeptemberében leállt, és nem tanul a tapasztalataiból. Néha egyszerű érvelési hibákat követhet el, amelyek úgy tűnik, hogy nem felelnek meg a kompetenciának oly sok területen, vagy túlságosan hiszékenyen fogadja el a nyilvánvalóan hamis állításokat a felhasználóktól.

Talán akkor láthatja, hogy egyesek miért csalódtak egy kicsit a GPT-4-ben. A pletykák azt sugallták, hogy valós időben fog működni, miközben menet közben alkalmazkodik az internethez. Nagy előrelépés a ChatGPT-hez képest. A valóság az, hogy a GPT-4 még mindig kelt adatokkal foglalkozik. És nem történik valós idejű kiigazítás a számítási mintaillesztéshez önmagában az internetről érkező frissítések alapján.

Még több hírem van számodra.

Az a mondat, amelyet korábban a GPT-4-ről mint nagyszabásúról idéztem, szintén azt mondta, hogy a GPT-4 az kombinált.

Engedjék meg, hogy némi hátteret adjak a fogalmához kombinált generatív AI.

A vita elején említettem, hogy a generatív mesterséges intelligencia különböző típusai léteznek, mint például a szöveg-szöveg vagy a szöveg-esszé, a szöveg-művészet vagy a szöveg-kép, a szöveg-hang, a szöveg -videóba stb. Ezek mindegyike a tartalom kezelésének egyedi módja. Például beírhat szöveget, és generált esszét kaphat. Egy másik példa az, hogy szöveget ír be, és egy generált grafikát kap.

Tavaly év végén elkészítettem az éves előrejelzéseimet arról, hogy mit fogunk látni a mesterséges intelligencia fejlődésében 2023-ban (lásd a linket itt). Kijelentettem, hogy a multimodális generatív AI forró lesz. Az ötlet az, hogy például beírhat szöveget és képet (két mód a bevitelnél), ezeket promptként használva a generatív AI-ba, és kimenetként egy esszét kaphat, valamint egy generált videót és egy hangsávot (három mód Kimenet).

Így sokféle mód létezhet egymás mellett. Előfordulhat, hogy a felszólításnál vagy a bevitelnél számos mód van. Előfordulhat, hogy a generált válaszon vagy kimeneten számos mód van. Mind a bemeneteken, mind a kimeneteken lehet keverés és egyezés. Erre irányulnak a dolgok. A multimodális funkcionalitás miatt az izgalmas és a generatív AI-val megvalósítható lehetőségek óriásiak.

A ChatGPT-nek csak egyetlen módja van. Szöveget ír be, kimenetként generált szöveget kap.

A pletykák szerint a GPT-4 áttörné a hanggátat, és mindenre teljes multimodális képességet biztosítana. Mindenki tudta, hogy a szöveg benne lesz. Az volt a várakozás, hogy képeket vagy grafikákat adnak hozzá hanggal és esetleg videóval együtt. Ez mindenki számára ingyenes lenne. Bármilyen mód a bemeneten, beleértve a kívánt módot. Plusz bármilyen mód a kimeneten, beleértve annyi kevert módot, amennyit csak szeretne.

A módok valóságos gyűjteménye.

Mit nyújt a GPT-4?

Térj vissza ehhez a mondathoz a TR-ből:

"Beszámolunk a GPT-4 fejlesztéséről, egy nagyszabású, multimodális modellről, amely képes kép- és szövegbevitelt fogadni, valamint szöveges kimeneteket készíteni."

Beírhat szöveget és kiírt szöveget fog kapni, plusz a bevitelnél esetleg képet is beírhat.

A bevitt képek kép- vagy látásfeldolgozását bemutató bemutatók azt mutatták, hogy például a képen szereplő elemeket a generatív mesterséges intelligencia azonosíthatja, majd a képet magyarázó írásos narratívává alakíthatja. Megkérheti a generatív MI-t, hogy magyarázza el, mit ábrázol a kép. Összességében a látás feldolgozása figyelemre méltó kiegészítés lesz.

A látásfeldolgozó vagy képelemző képesség még nem elérhető nyilvánosan (az OpenAI weboldal blogja szerint):

„A képbeviteli képesség szélesebb körű elérhetővé tételére való felkészítése érdekében szorosan együttműködünk egyetlen partnerrel.

Mindennek az a lényege, hogy szívmelengető felismerni, hogy a GPT-4 láthatóan képes képbevitelre és -elemzésre. Sokan kíváncsian várják ennek a funkciónak a nyilvános megjelenését. Köszönet az OpenAI-nak, amiért belépett a multimodális arénába.

Tehát van szövegünk bemenetként, plusz kép bemenetként (ha nyilvános használatra elérhető), és szöveg kimenetként.

Vannak azonban olyanok az AI-közösségben, amelyekről ez aligha felel meg az elképzelésnek kombinált. Igen, van még egy mód, a kép bemenetként. De nem kép kimenetként. Úgy tűnik, nincs hang bemenetként, sem hang kimenetként. Úgy tűnik, nincs videó bemenetként, és nem is videó kimenetként. Azok, akik hajlékonyak, ezt „multimodálisnak” találják a legminimalistabb módon.

Az ellenérv az, hogy séta előtt kúszni kell, és futás előtt járni.

Úgy gondolom, hogy ez lefedi a TR első mondatát, és áttérhetünk további témákra.

A GPT-4 további alapjai

Most felgyorsítok, mivel összességében több háttérrel rendelkezik ebben az ügyben.

A GPT-4-ről szóló OpenAI blogbejegyzésben a következőket találjuk:

„Az elmúlt két évben újjáépítettük a teljes mély tanulási rendszerünket, és az Azure-ral közösen egy szuperszámítógépet terveztünk az alapoktól kezdve a munkaterhelésünkhöz.”

Két gyors megjegyzés ezzel kapcsolatban.

Először is, minden bizonnyal figyelemre méltó megjegyzés és teljesítmény az a jelzés, hogy újjáépítették a teljes mély tanulási készletüket (ez azt jelenti, hogy újraírták a számítási mintaillesztési modelleket, és úgy döntöttek, hogy átstrukturálják a dolgok működését a motorháztető alatt). Jó nekik. A könyörgő kérdés, amelyet egyesek kifejeznek, az az, hogy jó lenne tudni, hogy pontosan mit csináltak ebben az újjáépítésben. A TR és az SC valamennyire megemlíti a történteket, de nem egészen mélyrehatóan.

Persze lehet meggyőzően érvelni amellett, hogy nem szabadna felfedniük titkos szószukat. Nem kötelezik őket erre. Miért nyújtanak szükségtelenül támogatást versenytársaiknak? Az érem másik oldala azzal érvel, hogy a mesterséges intelligencia és a társadalom javulása érdekében feltehetően elősegítené a generatív mesterséges intelligencia fejlődését, ami látszólag jót tesz az emberiségnek (reméljük).

Visszatértünk a mesterséges intelligencia etika és a mesterséges intelligencia törvénye választóvonalához.

Másodszor, az idézett megjegyzés azt jelzi, hogy az alapoktól kezdve terveztek egy szuperszámítógépet. Amellett, hogy érdekli, hogy mit csinál ez a szuperszámítógép, és pontosan hogyan működik, amelyek közül néhányat már elmagyaráztunk, ez egy egészen más kérdést vet fel.

Vannak, akik attól tartanak, hogy a generatív mesterséges intelligencia nagy pénzes játékká válik. Csak a legnagyobb pénzekkel és a legnagyobb erőforrásokkal rendelkező technológiai cégek képesek generatív mesterséges intelligencia kidolgozására és alkalmazására. Ennek az az oka, hogy ez megkérdőjelezhető, hogy talán olyan generatív mesterséges intelligencia lesz, amelyet csak néhány technológiai cég ellenőriz szigorúan. Lehet, hogy erősen függünk ezektől a cégektől és áruiktól.

Felhasználnunk kell-e a meglévő törvényeket, vagy új AI-törvényeket kell kidolgoznunk, hogy megakadályozzuk, hogy a generatív mesterséges intelligencia koncentrációja csak kevesek irányítása alatt álljon?

Valami okoskodni való.

Ha arra vár, hogy csökkenjen a cipő a ChatGPT és a GPT-4 közötti hihetetlenül hatalmas különbség miatt, nézze meg ezt a GPT-4-ről szóló OpenAI blogbejegyzésből:

„Egy kötetlen beszélgetés során a GPT-3.5 és a GPT-4 közötti különbség finom lehet. A különbség akkor derül ki, amikor a feladat összetettsége elér egy megfelelő küszöböt – a GPT-4 megbízhatóbb, kreatívabb és sokkal árnyaltabb utasításokat képes kezelni, mint a GPT-3.5.”

Azt tapasztaltam, hogy ez a jellegzetes különbség hiánya valamelyest így van, nevezetesen, hogy ha mindennapi tétlen csevegést folytat a ChatGPT-vel, és hasonlót tesz a GPT-4-gyel, akkor talán nem veszi észre, hogy a GPT-4 összességében erősebbnek tekinthető. .

Az egyik kiemelkedőnek tűnő szempont az, hogy kontextust hozzon létre a két generatív AI-alkalmazással folytatott beszélgetéseihez.

Ezt értem.

Ha generatív AI-alkalmazást használ, időnként csak beleugrik egy beszélgetésbe, amelyet elkezd, és folytat az AI-val. Más esetekben először elmondja az AI-nak a beszélgetés kontextusát. Például kezdhetném azzal, hogy elmondom a generatív MI-nek, hogy az autómotorokról szeretnék beszélni az MI-vel, és azt akarom, hogy az AI úgy tegyen, mintha autószerelő lenne. Ez beállítja azt a szakaszt vagy beállítást, ahol az AI megfelelően reagál.

Sok ChatGPT-t használó ember nem veszi észre a kontextus beállításának fontosságát, amikor először párbeszédet folytat az AI alkalmazással. Hatalmas különbség lehet abban, hogy milyen választ kap. Gyakran azt tapasztalom, hogy a ChatGPT önmagában nem nagyon igazodik bizonyos kontextusokhoz. Megpróbálja, de gyakran nem sikerül. Eddig úgy tűnik, hogy a GPT-4 valóban a kontextuális létrehozás révén ragyog.

Ha generatív AI-t fog használni, és kontextusokat szeretne létrehozni, akkor határozottan a GPT-4-nek adnám előnyt a ChatGPT-vel szemben.

Egy kapcsolódó elemen van egy olyan szempont is, amely ún kormányozhatóság az jön szóba.

A ChatGPT néhány felhasználója meglepődött azon, hogy az AI alkalmazás néha túlságosan humorosnak vagy túl szűkszavúnak tűnő válaszokat ad. Ez akkor fordulhat elő, ha a generatív AI olyasmit észlel a beviteli promptban, amely úgy tűnik, hogy ilyen választ vált ki. Lehet, hogy tréfásan kérdez valamiről, és nem veszi észre, hogy ez a ChatGPT-t a viccek és a könnyed hangnem felé tereli.

A GPT-4-ről és a kormányozhatóságról szóló OpenAI blogbejegyzés szerint:

„A klasszikus ChatGPT-személyiség, rögzített bőbeszédű, hangnem és stílus helyett a fejlesztők (és hamarosan a ChatGPT-felhasználók) mostantól előírhatják mesterséges intelligencia stílusát és feladatát úgy, hogy ezeket az irányokat a „rendszer” üzenetben leírják. A rendszerüzenetek lehetővé teszik az API-felhasználók számára, hogy a határokon belül jelentősen személyre szabják felhasználói élményüket.”

Ez ismét javítja a felhasználói élményt a generatív AI-alkalmazásokkal. Más generatív mesterséges intelligencia-gyártók is hasonlóképpen járnak el, és elkerülhetetlenül szinte az összes ilyen AI-alkalmazásunk lesz valamilyen irányíthatósággal és kontextus szerinti beállítási funkcióval.

A durva út még előtte

A generatív mesterséges intelligencia alapját képező folyamatos és nyugtalanító probléma általában az, hogy mindenféle kellemetlen és kifejezetten zavaró kimenet előállítható.

Rovatbeli bejegyzéseimben ezekkel a különféle és kijózanító aggályokkal foglalkoztam:

Generatív mesterséges intelligencia által okozott hibák
Generatív mesterséges intelligencia által előállított hamisságok
Generatív AI beágyazott torzítások
AI hallucinációk
Adatvédelmi behatolások
Az adatok bizalmas kezelésének gyengeségei
Dezinformáció terjesztője
Tévinformáció-terjesztő
Kettős felhasználású fegyverekhez
Emberek túlzott támaszkodása
Gazdasági hatások az emberekre
A kiberbűnözés erősítése
Stb.

Egyes pletykák szerint a GPT-4 varázsütésre és csodával határos módon meg fogja tisztítani és megoldani az összes generatív AI-betegséget.

Senki sem gondolta, akinek rendes feje a vállán, hogy egy ilyen pletyka képes megbirkózni vele. Ezek nagyon nehéz AI-problémák. Nem könnyen megoldhatók. Sokat kell még tenni, hogy megküzdjünk ezekkel a tartós és elkeserítő nehézségekkel. Valószínűleg egy falura lesz szükség ahhoz, hogy meghódítsa a mesterséges intelligencia etikai kérdéseinek litániáját, amely a generatív mesterséges intelligencia közegébe szövődött.

Annak érdekében, hogy hitelt adjon ott, ahol a hitel esedékes, az OpenAI megpróbálta elmagyarázni, hogyan kezeli ezeket a sokféle kihívást. Azoknak, akiket érdekel a mesterséges intelligencia etika, érdemes alaposan átolvasni a TR-t és az SC-t.

Íme például néhány egyszerű megjegyzés a GPT-4-ről, ahogy az OpenAI a TR-ben kifejti:

„A GPT-4 potenciálisan káros tartalmat generálhat, például tanácsokat a támadások tervezésére vagy a gyűlöletbeszédre. Különféle társadalmi elfogultságokat és világnézeteket képviselhet, amelyek esetleg nem reprezentálják a felhasználói szándékot vagy a széles körben megosztott értékeket. Olyan kódot is generálhat, amely feltört vagy sebezhető. A GPT-4 további képességei új kockázati felületekhez is vezetnek.”

Továbbá ezt mondják a TR-ben:

„Ezzel az elemzéssel azt találtuk, hogy a GPT-4-ben megvan a lehetőség arra, hogy megpróbálják azonosítani a magánszemélyeket külső adatokkal kiegészítve. Azt is megállapítottuk, hogy bár a GPT-4 kiberbiztonsági képességei nem haladják meg jelentősen az LLM-ek korábbi generációit, továbbra is folytatja azt a tendenciát, hogy potenciálisan csökkenti a sikeres kibertámadás egyes lépéseinek költségeit, például szociális tervezés vagy meglévő biztonsági eszközök javítása révén. . Biztonsági intézkedések nélkül a GPT-4 részletesebb útmutatást is tud adni a káros vagy illegális tevékenységek végrehajtásához.”

Itt nincs elegendő helyem az ezekkel a nehézségekkel kapcsolatos számos elemre. Keressen további rovatokat a generatív mesterséges intelligencia folyamatban lévő elemzésében a mesterséges intelligencia etika és a mesterséges intelligencia törvénye szempontjából.

Érdemesnek tűnik szánni egy pillanatot, és elismerni, hogy az OpenAI elérhetővé tette az azonosításukat arról, hogyan közelítik meg ezeket a nehéz kihívásokat. Mondhatni semmi okuk nem volt rá. Úgy tehetnek, mintha nem lenne ott semmi látnivaló. Vagy egyszerűen hadonászhatnak egy kicsit, és kijelenthetik, hogy sok okos dolgot csinálnak, hogy kezeljék ezeket a problémákat.

Szerencsére azt az ésszerű megközelítést választották, hogy megpróbálják megelőzni a visszacsapásokat és a szemöldökverést, ami általában a generatív AI-kiadásokkal jár. Feltehetően arra törekszenek, hogy határozottan megmutassák komolyságukat és elkötelezettségüket e problémák gyökeres felszámolása és enyhítése vagy megoldása iránt.

Felajánlom azt a további gondolatot, hogy a mesterséges intelligencia területe kemény verést fog kapni, ha nem történik folyamatos és megerőltető erőfeszítés ezeknek az ügyeknek a közvetlen és jövőbeli követésére. A rejtett fekete doboz megközelítése minden bizonnyal feldühödik a nagyközönség körében. Arra is számíthat, hogy ha a mesterséges intelligencia cégek nem próbálnak megbirkózni ezekkel a problémákkal, akkor nagy az esélye annak, hogy a törvényhozókat és a szabályozó hatóságokat bevonják ezekbe az ügyekbe, és az új AI-törvények szökőárja borzolja majd az összes mesterségesintelligencia-gyártót és az érintetteket. AI.

Egyesek azt hiszik, hogy már ezen a ponton vagyunk.

Ragaszkodnak ahhoz, hogy bár úgy tűnik, hogy sok mesterséges intelligencia-készítő megosztja, amit csinál, ez a valószínű tagadhatóság némileg alattomos formája. Röviden: tedd ki a szörnyű és nyilvánvalóan helytelen mesterséges intelligenciát, ahelyett, hogy megvárnád, amíg a dolgok jobban kitalálnak, és hárítsd el a mesterséges intelligencia etikájában és a mesterséges intelligencia törvényében foglaltakat azzal, hogy kijelented, hogy mindent megtesz a dolgok kijavítása érdekében. Ezt a „várj, amíg készen áll” folyamatban lévő vitát gyakran tárgyaltam rovatomban.

A TR szerint:

„Az OpenAI augusztus eleje óta ismétlődik a GPT-4-en és a telepítési tervünkön, hogy felkészüljön a biztonságosabb indításra. Úgy gondoljuk, hogy ez csökkentette a kockázati felületet, bár nem szüntette meg teljesen. A mai telepítés egyensúlyt képvisel a telepítésből eredő kockázatok minimalizálása, a pozitív használati esetek lehetővé tétele és a telepítésből való tanulás között.”

Visszatérve a szóban forgó témához, korábban említettem, hogy a mesterséges intelligencia hallucinációi az uralkodó probléma a generatív mesterséges intelligencia esetében.

Ismétlem, nem szeretem a hívószót, de úgy tűnik, megfogott. A mesterséges intelligencia hallucinációival kapcsolatos probléma fő pillére az, hogy képesek olyan kimeneteket produkálni, amelyek nagyon őrült dolgokat tartalmaznak. Lehet, hogy azt gondolja, hogy a felhasználónak kell eldöntenie, hogy a kimenetek helyesek vagy rosszak. Aggodalomra ad okot, hogy a kimenetek olyan kitalált dolgokat tartalmazhatnak, amelyekről a felhasználónak nem könnyű megállapítani, hogy készek-e. Lehet, hogy elhiszik az egész disznót, bármit is mond a kimenet.

Van egy finom tendencia is, hogy belenyugodjunk abba, hogy elhiggyük a generatív mesterséges intelligencia eredményeit. Általában a kimenetet olyan hangnemben és módon írják, amely a magabiztosság biztos látszatát sugallja. Feltéve, hogy rendszeresen használ generatív mesterséges intelligenciát, könnyű belenyugodni abba, hogy az idő nagy részében igaz anyagokat lát. Könnyen megtévesztheti magát, ha valami kitalált dolog belekerül az egyébként teljesen értelmesnek és tényekkel teli generált esszébe.

Íme, amit a TR mond a GPT-4-ről:

„A GPT-4 hajlamos a „hallucinációra”, azaz „bizonyos forrásokkal kapcsolatban értelmetlen vagy valótlan tartalmat előállítani”. Ez a tendencia különösen káros lehet, mivel a modellek egyre meggyőzőbbek és hihetőbbé válnak, ami ahhoz vezet, hogy a felhasználók túlzottan támaszkodnak rájuk. Az intuitív módon a hallucinációk veszélyesebbé válhatnak, ahogy a modellek igazabbá válnak, mivel a felhasználók bizalmat ébresztenek a modellben, amikor az valós információkat szolgáltat azokon a területeken, ahol ismerik őket.”

A jó hír az, hogy erőfeszítéseket tettek és úgy tűnik, hogy folyamatban vannak, hogy megpróbálják csökkenteni a mesterséges intelligencia hallucinációinak esélyét a GPT-4-ben. Azt is állítják, hogy a GPT-4 felülmúlja a GPT-3.5-öt a mesterséges intelligencia hallucinációinak elhárítása terén, bár egyértelművé teszi, hogy ezek továbbra is előfordulnak.

Itt a TR erről:

„A belső értékelések alapján a GPT-4-indító 19 százalékponttal magasabb pontszámot ért el, mint a legújabb GPT-3.5 modellünk a nyílt tartományú hallucinációk elkerülésében, és 29 százalékponttal magasabb a zárt tartományú hallucinációk elkerülésében.”

A vita e részének lezárásaként az összes mesterségesintelligencia-készítő generatív mesterséges intelligencia ezekkel a kérdésekkel szembesül. Senki sem gyógyította meg ezt valahogy. Ha nehéz mesterséges intelligencia-problémákat keres, arra biztatlak, hogy ugorjon be ezekre a vizekre és segítsen. Rengeteg munka van még.

Következtetés

Amikor egy nagysikerű film már egy ideje megjelent, és a mozikból az otthoni közvetítésbe került, valószínűleg sokan látták a filmet, vagy tudnak róla valamit másoktól, akik látták. Ezt követően, amikor a folytatást bejelentik és forgatják, a várakozás csillagászati szintre emelkedhet.

JJ Abrams, a Star Wars sorozat egyes részeinek és a Star Trek újraindításának legendás filmrendezője a következőképpen nyilatkozott a folytatásokról: "Nincs semmi baj a folytatásokkal, egyszerűen könnyebb eladni."

Edwin Catmull, a Pixar társalapítója ezt hangsúlyozta a folytatásokkal kapcsolatban: „Higgye el, a folytatásokat ugyanolyan nehéz elkészíteni, mint az eredeti filmeket.”

Ha érdekli a kasszasiker ChatGPT, azonnal regisztrálhat. A GPT-4 folytatását egy kicsit bonyolultabb elérni. Ne feledje azt is, hogy sok más film is elérhető, nos, más generatív AI-alkalmazások is elérhetők, ezért érdemes megbizonyosodnia arról, hogy a filmezés (más néven generatív AI) élménye változatos és kielégítő.

Egy utolsó kijózanító megjegyzés. Figyelmeztetés, hogy a tartalom, amellyel találkozhat, lehet PG13, R vagy akár NC-17. Tartsd észben.

Forrás: https://www.forbes.com/sites/lanceeliot/2023/03/15/what-you-need-to-know-about-gpt-4-the-just-released-successor-to-generative- ai-chatgpt-plus-ai-ethics-and-ai-law-considerations/