A MacWhisper az ingyenes átírási szoftver, amelyre vártam

Olyan Mac szoftvert keres, amellyel hangfájlokat írott szövegfájlokká írhat át? Rengeteg fizetős eszköz létezik, például az Otter.ai és a Trint, amelyek valódi pénzbe kerülhetnek, ha túl sokat kezdi használni őket. De MacWhisper az az ingyenes megoldás, amelyre az internet várt. Vagy legalábbis az, akire vártam.

Az OpenAI 2022 szeptemberében kiadott egy hihetetlenül hatékony ingyenes programot, amely lehetővé tette a technológiában jártas emberek számára, hogy hang- és videofájljaikat hihetetlenül pontos átiratokká alakítsák. A probléma az volt, hogy az átlagos felhasználó számára nem nagyon volt elérhető, mivel ismernie kellett a parancsok használatát a Terminal alkalmazásban.

De a MacWhisperrel, amelyre először figyelt fel 9to5Mac, valaki végre kifejlesztett egy grafikus felhasználói felületet, amely az OpenAI Whisperre épül, és minden zavarba ejtő technikai dolgot a motorháztető alatt hagy, lehetővé téve, hogy egyszerűen húzza az audiofájlt, és nagyon gyorsan megkapja az átírást. A MacWhisper pedig rendkívül pontos, mert az OpenAI Whisper-jét kiképezték 680,000 óra hangadatokat az interneten.

Az egyik jó dolog a MacWhisperrel kapcsolatban, hogy nem azt a hang- vagy videofájlt tölti fel az internetre, amelyet át szeretne írni. Ez fontos azoknak az újságíróknak, akik kényes történeten dolgoznak, vagy mindenki számára, aki csak általában óvakodik attól, hogy személyes fájljait a felhőbe töltse fel. A fájl az asztalon marad, ami azt jelenti, hogy nincs esély arra, hogy bárki elkapja a hangját.

A MacWhisper ismét csak egy új felhasználói felület egy ingyenes programhoz, amelyet az OpenAI tavaly év végén mutatott be, de valójában bárki számára egyszerűvé teszi a hangátírást. Mert a Whispert használom, és rendkívül hasznosnak találtam a megjelenése óta. És most még én is MacWhsiper-t fogok használni, mert az biztosan felgyorsítja a munkafolyamatomat.

Csak egy példa, az FTX kriptográfiai vállalat összeomlásának híre után a Whisper segítségével írtam át több tucat órányi régi YouTube-interjút, amelyet Sam Bankman-Fried cégalapítóval készítettem. Innentől kezdve tudtam keresni az átiratokban, és furcsa és érdekes ötleteket találtam cikkekhez, például amikor az SBF azt mondta 2021 júniusában, hogy A blokklánc javította volna az Enront. Az SBF és az Enron összehasonlítása furcsa egybeesés volt, tekintve mindazt, amit most tudunk az FTX összeomlásáról. De soha nem találtam volna meg azt a pillanatot egy régi, homályos interjúban anélkül, hogy több tucat átiratban tudnék keresni. És ez a folyamat, bár könnyebb, mint órákon át tartó kazettákat hallgatni, még mindig nehézkes és nem túl automatizált.

Miután telepítettem a Whispert a gépemre, bármikor beírtam a „whisper audiofilename.mp3 —model tiny.en” kifejezést a Mac Terminal alkalmazásába, amikor át akartam írni egy fájlt. A WhisperMac segítségével egyszerűen áthúzhatom az audiofájlomat, és minden extra gépelés nélkül teszi a varázslatot.

Kipróbáltam a MacWhispert az NBC Nightly News egy epizódjával, amelyet a YouTube-ról töltöttem le. És eltekintve néhány hibától, mint például a „windchills” szó „windshills”-ként való értelmezése és Lester Holt „Lester Hold”-ként való hallása, az átirat nagyon pontos volt. A MacWhisper ingyenes, de a szoftvernek van egy fizetős szintje, amely valamivel pontosabb lehet, mert az OpenAI intenzívebb képzési modelljeit használja, de az ingyenes verzió a legtöbb ember számára nagyszerűen működik.

A MacWhisper lehetővé teszi az átírt szó exportálását néhány különböző formátumban, beleértve az egyszerű szöveget, CSV-t vagy akár feliratfájlformátumot, például SRT-t és VTT-t.

A MacWhisper pedig nem csak angol nyelvre való. A hangot 100 különböző nyelvre írhatja át, ami hihetetlenül praktikus. Az egyetlen olyan funkció, amivel a MacWhisper nem rendelkezik, és amivel szívesen játszottam a Whisperen a Terminal alkalmazásban, az a nyelvi fordítás. Vírusvideókat fordítottam orosz és kínai nyelvre, és a Twitteren a nyelvet beszélő emberek azt mondták nekem, hogy a fordítások pontos.

A másik funkció, amivel a MacWhisper nem rendelkezik, bár az OpenAI Whisperből sem érhető el, az a hangszórók megkülönböztetésének képessége. Például, ha egy interjút ír át két előadóval, akkor nincs egyértelmű jelölés, amely azt mutatja, hogy az egyik előadó abbahagyta, és a másik elkezdődött. De gyanítom, hogy valaki végül kiépíti ezt a képességet. A fizetős szolgáltatások, mint például a Trint, ezt automatikusan megteszik, és jó lenne, ha végül ingyenesek lennének, de azt kapod, amiért fizetsz.

A MacWhispernek van egy olyan funkciója is, amellyel a számítógép mikrofonjából származó beszédet szöveggé alakíthatja, ami hasznos lehet, ha menet közben szeretne átírni valamit.

Hónapokig töprengtem azon, hogy mikor fejleszt valaki végre egy grafikus felhasználói felületet a Whisperhez, mivel néhányan próbálkoztak vele, de nem alkottak semmi felhasználóbarátot. De a MacWhisper, amelyet Jordi Bruin fejlesztett, az a szoftver, amelyre vártam. A Bruin olyan szoftvereket is kifejlesztett, mint a MacGPT, amely lehetővé teszi a felhasználók számára a ChatGPT elérését a menüsorukról.

Letöltheti a MacWhispert ingyen, e-mail regisztrációval, a Bruin honlapján.

Forrás: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/