Trasformare l’audio in testo è un compito che richiede molta attenzione e tempo. Fortunatamente, questa attività viene gradualmente rilevata dalle macchine: all’inizio, i programmi automatici, come Closed Captions di YouTube, rendevano già possibile una trascrizione limitata. Al giorno d’oggi, l’Intelligenza Artificiale avanzata è in grado di svolgere questo compito in modo più efficiente e preciso.
Come trascrivere l’audio in testo direttamente dal browser (gratuitamente) con AI
In questo tutorial ti insegneremo come utilizzare il Sussurro AIun’intelligenza artificiale creata da IA aperta, lo stesso gruppo che ha sviluppato il popolare Chat GPT. Tutti i file video o audio inviati verranno automaticamente convertiti in testo con un clic, assolutamente gratis e senza programmi. Ottime notizie per chiunque abbia bisogno di trascrivere l’audio in testo ogni giorno.
WhisperAI è estremamente potente e può persino trascrivere audio di bassa qualità come pubblico, lezioni di apprendimento a distanza, presentazioni registrate dal pubblico, ecc.
📝 Di cosa avrai bisogno?
- Un account Gmail per accedere a Google Drive;
- 15 minuti del tuo tempo.
Tempo necessario: 15 minuti
Segui attentamente tutti i passaggi e impariamo come trascrivere l’audio utilizzando l’intelligenza artificiale.
-
Accedi a Google Drive. Se non hai un account Gmail, creane uno gratuitamente.
In Google Drive, fai clic su « Nuovo” nell’angolo in alto a sinistra dello schermo;
-
In fondo, clicca su « Di più” e poi su “collegare più app« ;
-
Nella scheda di ricerca, digita « Collaborazione Google”. clicca dentro « Installare » e l’app verrà installata all’interno del tuo Google Drive;
-
Ora andiamo al pulsante « Nuovo » di nuovo, ora fai clic su « Di più« , e fare clic su « Google Collaborazione »applicazione che abbiamo appena installato;
-
Ok, siamo arrivati all’applicazione Google Colab. Prima di tutto, dobbiamo fare una piccola configurazione per assicurarci che tutto funzioni. clicca dentro Tempo di esecuzionee poi via Cambia il tipo di runtime;
-
Nel acceleratore hardwareseleziona l’opzione GPU. Ora clicca su Mantenere;
-
Ora installiamo Whisper AI su Google Colab. Fare clic sulla barra di testo per inserire il testo per il passaggio successivo. Se non vedi questa barra di testo, fai clic su + Codice;
-
Copia e incolla il seguente codice, quindi fai clic sul pulsante per installare Whisper AI:
!pip installa git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
-
L’installazione richiede circa 30 secondi. Ora, sul lato sinistro, fai clic sull’icona della cartella per aprire i file;
-
Qui dentro possiamo cliccare e trascinare tutti i file audio che vogliamo trascrivere. In questo caso, userò l’audio della nostra analisi di un telefono cellulare Samsung come esempio. Trascina file audio;
-
Ora basta fare clic su +Codice e digitare il seguente codice nella barra di testo per avviare il processo di trascrizione:
!sussurro « nome file qui.mp3 » –model medium
Premi il pulsante di avvio, attendi qualche minuto e voilà! Il tuo file è stato trascritto correttamente.(Nel « nome file qui », non dimenticare di includere il formato nel nome, come .mp3, .FLAC, .WAV, ecc.).
-
Sul lato destro abbiamo i tempi e la trascrizione. Sul lato sinistro, accanto al file audio che abbiamo trascinato in precedenza, abbiamo i file « .srt« e ».vtt« , che può essere utilizzato per sottotitolare i video utilizzando un lettore compatibile come Supporto VLC. Ora il file « .TXT » è la trascrizione completa e può essere aperta nel Blocco note di Windows.
Sono rimaste delle domande? Qualche passaggio è stato confuso? Lascia un commento qui sotto e ti risponderemo il prima possibile.
Come correggere l’errore « No such file or directory » in Whisper AI
Se hai riscontrato questo errore nel passaggio 11, significa che il file audio è corrotto OPPURE hai inserito il nome sbagliato. Ricordando che, oltre al nome del file, è necessario aggiungere il suo formato, come .mp3, WAV, FLAC…
Per scoprire il formato del file, procedi come segue:
1.Fare clic destro sul file e quindi fare clic su proprietà;
Il desktop fa Windows 11
2. Nel caso del file che usiamo per testare qui nel tutorial, è un .mp3, cioè dobbiamo mettere « .mp3 » alla fine del nome del file, assomiglia a questo:
!sussurro « Recensione Samsung Galaxy A34_ Il BEST Hit di Samsung del 2023.mp3 » –modello medio
Proprietà del file audio.