Az autóaudio új mesterséges intelligenciája többet javíthat, mint a dallamokat

Hollywood örökké úgy ábrázolja a mesterséges intelligenciát (AI), mint a disztópikus robotok működési rétegét, amelyek helyettesítik a gyanútlan embereket, és létrehozzák az eszkalálódó, központi konfliktust. Legjobb esetben elképzelhető, hogy egy fiatal Hailey Joel Osment játssza Davidet, az öntudatos, mesterséges kölyköt Spielberg sarki sapkákkal felolvadt és elárasztott tengerparti városainak világában (ismerősen hangzik?). AI: Mesterséges intelligencia aki (spoiler alert) csak önmagát öli meg. Vagy talán emlékszel Robin Williams hangjára A kétszáz éves ember aki ismét egy öntudatos, boldogulni igyekvő robot, aki (ismét a spoiler figyelmeztetésben) végül az egyetlen áldozata lesz. És persze ott van a szinte klisés utalás is Terminator és poszt-apokaliptikus világa, az embereket elpusztítani próbáló gépekkel, és nos, (nem túl spoiler riasztás) rengeteg áldozattal pár évtized alatt. E forgatókönyvek egyikében sem élnek együtt az emberek a jobb élettel, nem beszélve a jobb szórakoztatásról és biztonságról.

Ez azonban az új valóság. A mesterséges intelligencia algoritmusai beépíthetők az audiotervekbe, és az éteren keresztüli frissítésekkel folyamatosan fejleszthetők a vezetési élmény javítása érdekében. És ezekkel a hollywoodi példákkal egyenesen ellentmondva, az ilyen mesterséges intelligencia valóban növelheti az ember túlélési esélyét.

Csak az örömért

Egészen a közelmúltig az összes felhasználói felület (UI), beleértve az audiofejlesztést is, komplex programozást igényelt szakértő kódolóktól a járműprogramok szabványos harminchat (36) hónapja alatt. A fémlemez-stílusú és elektronikus dobozokat párhuzamosan határozták meg, szerzik be és fejlesztik csak az egyes elemek kalibrálására a fejlesztés késői szakaszában. Márkás hangok. Akusztikus aláírások. Minden különálló kezdeményezés ugyanazon a vérszegény rendszertervezésen belül milliárdokba kerül a gyártóknak.

A mesterséges intelligencia azonban sokkal rugalmasabb és hatékonyabb módszert tesz lehetővé a hangélmény-tervezés megközelítésében. „Amit látunk, az a trendek konvergenciája” – mondja Josh Morris, a DSP Concept gépi tanulási mérnöki menedzsere. „A hang egyre dominánsabb jellemzővé válik az autóiparban, ugyanakkor azt látjuk, hogy a modern processzorok egyre erősebbek, nagyobb memóriával és képességekkel rendelkeznek.”

És ebben a rendszerközpontú fejlesztési platform, a mesterséges intelligencia és ezek az erősebb processzorok az adaptív, valós idejű reakcióképesség új szintjét biztosítják a vezetők és az utasok számára. . Steve Ernst, a DSP Concept autóipari üzletfejlesztési vezetője, ahelyett, hogy minden elképzelhető forgatókönyvhöz kódhalmazokat kellett volna írni, a mesterséges intelligencia a környezeti feltételek és események tanult ismerete alapján irányítja a rendszer reakciókészségét.

Az ilyen tanulási rendszer használatának nagyon kézenfekvő módja a jármű „zajmentesítése”, hogy a prémium hangzás testre szabható és javítható legyen, annak ellenére, hogy téli gumikra cserélték vagy más hasonló környezeti változásokat használtak. De Az LG Electronics a DSP Concept Audio Weaverben futó algoritmusokat fejlesztett ki platform, amely lehetővé teszi a film párbeszédének hangjavítását a hátsó ülések szórakoztatása közben, hogy kiemelje azt a filmen belüli robbanásokkal szemben, ezáltal lehetővé téve az utas számára, hogy jobban hallja a kritikus tartalmat

Egy másik nem nyilvánvaló szempont az lenne, hogy a márkás hanghangokat hogyan hangszerelik más zajok közepette. Ennek a konkrét járműnek szüksége van a fokozódó rendszerindítási szekvencia lejátszására, miközben a többi hang, például a rádió és a csengőhangok automatikusan elhalnak? Minden élmény módosítható.

Valószínűbb, hogy boldogul

Ahogy a világ versenyt fut az elektromos járművek és az autonóm vezetés irányába, a hangos figyelmeztetések gyakorisága és igényei valószínűleg drasztikusan megváltoznak. Például egy autonóm taxi biztonsági mérnöke nem feltételezheti, hogy az utasok bárhol a vizuális kijelző közelében vannak, amikor időben riasztásra van szükség. És mennyire hallható ez a figyelmeztetés a közel 25 millió amerikai fogyatékos kik számára nyithatnak új mobilitási lehetőségeket az autonóm járművek? „A hang most már nem csak arra való, hogy kedvenc dalunkat hallgathassa” – mondja Ernst. „Az autonóm vezetésnél mindenféle figyelmeztetés szükséges ahhoz, hogy a vezető aktív maradjon, vagy figyelmeztesse a nem aktív vezetőt a körülöttük zajló dolgokra.”

„És ami még nagyobb kihívást jelent” – fújja be Adam Levenson, a DSP Concepts marketingvezetője –, hogy az összes dolgot egyszerre kezelik az autóban: telefonálás, magával ragadó vagy térbeli hangzás, motorzaj, útzaj, jármű akusztikus riasztórendszerei, hangrendszerek stb. Szeretjük azt mondani, hogy a legösszetettebb audiotermék az autó.”

Képzeljük el például azt a forgatókönyvet, amikor a sofőr bekapcsolta az autonóm vezetési módot az autópályán, felhangosította a dallamait, és kellemesen nem tud a közeledő mentőjárműről. Milyen pontossággal (és távolsággal) riasztja az autó a jármű mikrofonjait használó szirénaérzékelést kvázi zavart vezetőjére? Hogyan kell ezt a figyelmeztetést bemutatni a környezeti zaj leküzdése, kellő figyelem biztosítása, de a vezető szükségtelen megijesztése érdekében? Mindez előre kifejlesztett modellekkel, különböző szirénákkal végzett előzetes betanítással és ezt követő felhő alapú hangolással hangolható. „Itt válik igazán fontossá az általános hangszerelés” – magyarázza Morris. „Az [AI-detektáló] modell kimenetét átvehetjük, és az autó különböző helyeire irányíthatjuk. Lehet, hogy lehalkítja a hangot, elindít valamilyen figyelmeztető hangjelzést, és felvillant valamit a műszerfalon, hogy a vezető felfigyeljen.”

Ugyanez igaz a külső riasztásokra is. Például a csendes elektromos járművek riasztóval rendelkeznek a gyalogosok számára. Így új kalibrációk hozhatók létre offline, és szoftverfrissítésként tölthetők le a járművekre az engedélyezett innováció alapján.

Innováció mindenhol. És a mesterséges intelligencia táplálja az utópisztikus élményt, nem pedig Hollywood disztópikus világát.

A szerző jóslata

Íme, a hét jóslata (és még csak kedd van, emberek): a hangzás következő fejlesztése egy teljes, azonnali visszacsatolási hurkot tartalmaz, beleértve a felhasználók finom, valós idejű örömét. Igen, a jelenlegi kialakítás nagy része valószínűleg javítja az élményt, de a felhasználóközpontú tervezés (UCD) folyamatban lévő kalibrálása továbbfejleszthető az utasok arckifejezése, testbeszéde és megjegyzései alapján, így egyénileg, valós időben hangolható az elégedettség. Az összes engedélyező eszköz mind rendelkezésre áll: kamera, mesterséges intelligencia, processzorok és adaptív platform.

Igen, már hallottunk róla adaptív hangulatvilágítás és az unalom, a stressz stb. távoli észlelése a biztonság növelése érdekében, de semmi sem javítja a kombinált élményt az összes felhasználó által irányított érzékelő valós idejű tanulási algoritmusai alapján.

Lehet, hogy túl sokat extrapolálok. De akárcsak Robin Williams karaktere, én is két évszázadot íveltem át… szóval talán én is csak érzékeny vagyok arra, hogy mit akarhatnak az emberek.

Forrás: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/