Àmbit
Informàtic

6 eines de transcripció automàtica

Entitat redactora
Colectic - Informàtic
Autor/a
Alejandra Sanchez

Fem un recull de plataformes que pots utilitzar per estalviar temps transcrivint qualsevol mena d'àudio o vídeo.

Moltes vegades, quan fem una entrevista, anem a una xerrada o fem una formació, és molt més fàcil i ràpid gravar-la en àudio o vídeo, que no pas transcriure-la en temps real.

Darrerament, gràcies a la intel·ligència artificial, han sorgit moltes eines que fan més fàcil convertir un àudio o vídeo en text per estalviar temps, guanyar en autonomia i fer el contingut més accessible, per exemple, a persones amb sordesa o qualsevol altra dificultat. A més, com a entitats, la transcripció ens pot ser útil per a tenir recollides en text les nostres activitats, formacions o d’altres materials que generem i, d'aquesta manera, tenir-ne un accés i consulta més fàcil.

A continuació, destaquem sis eines de diferents entitats, empreses i plataformes que permeten transcriure àudios i vídeos de manera fàcil i ràpida. Algunes de les eines fan les transcripcions amb l'àudio dictat i altres permeten carregar arxius d'àudio, sigui a pàgines web o aplicacions mòbils.

Índex

Softcatalà

Des de fa pocs més de dos mesos, l'associació Softcatalà va posar en marxa el seu servei de transcripció de textos en català a través d'intel·ligència artificial. Per tal d'usar aquesta funcionalitat, només s'ha de pujar al servidor un fitxer d'àudio o vídeo en els formats mp3, wav,avi, mp4 o mov.

El fitxer es processa als servidors de Softcatalà i, quan es finalitza la transcripció, la usuària rep un correu electrònic a l'adreça que ella mateixa ha indicat amb un enllaç on accedir a la transcripció i descarregar el text resultant.

El temps d'espera de la transcripció depèn del nombre de transcripcions que estiguin pendents de processar.

Google Docs

Totes les usuàries que tenen un compte de Google, tenen accés al servei de Google Drive, amb emmagatzematge i aplicacions ofimàtiques gratuïtes. Una d'aquestes aplicacions és Google Docs, l'editor de textos de la companyia, que té una funció de dictat i transcripció. Aquesta plataforma és òptima per a transcripcions curtes i sol donar problemes en les que són més extenses.

L'opció de transcripció de Google Docs és gratuïta i funciona gairebé en qualsevol idioma, tot i que no té la funcionalitat de pujar arxius d'àudio, de manera que l'àudio que es vulgui transcriure s'ha de reproduir en temps real al dispositiu.

Per activar aquesta funcionalitat només cal obrir un document amb Google Docs i buscar l'opció 'Dictat per Veu' que hi ha dintre del menú d'eines, situat a la part superior del document. Quan activem aquesta opció, s'obre una petita finestra amb un micròfon i amb una pestanya que ens permet seleccionar l'idioma. Per començar la transcripció, només hem de pitjar la icona del micròfon.

Microsoft Text to Speech

Microsoft també té un servei de transcripció de textos dins del marc d'Azure, el seu catàleg de productes per a empreses i desenvolupadores. Tot i aquesta particularitat, la versió de prova gratuïta de Microsoft Text to Speech es pot utilitzar per a traduccions curtes, sense necessitat de registrar-se a cap plataforma per fer-la servir.

Per tal de fer servir aquesta eina, s'ha de prémer el botó 'Parlar' i usar el micròfon. També es poden carregar arxius d'àudio per poder provar el servei, triar l'idioma i escollir si volem que el sistema posi signes de puntuació automàtics depenent de les pauses. És molt útil per petites proves o transcripcions breus.

ListenAll

Es tracta d'una aplicació bastant coneguda i amb origen al nostre país. ListenAll és una eina per a mòbils disponible tant per a Android com per a iOS. La seva interfície és molt neta i intuïtiva, i va actualitzant-se amb opcions com la d'importar missatges d'àudio d'altres aplicacions per transcriure'ls.

El seu funcionament és senzill, i consisteix simplement a parlar al dispositiu i, el que el mòbil escolti, s'anirà transcrivint a la pantalla. De tot plegat, en resultarà una nota que es podrà modificar a gust de les usuàries, canviant el seu color, el tipus de lletra o la grandària d'aquesta.

Les notes que genera l'aplicació es poden guardar com a àudio, com a document o exportar-la a altres aplicacions.

Otter

Es tracta d'una de les aplicacions més útils per a la transcripció, ja que té versió web i també mòbil. Es tracta d'una aplicació de notes de veu que també transcriu el contingut d'aquestes perquè es pugui tenir en format de text.

La versió gratuïta d'aquesta aplicació té una autonomia de 600 minuts mensuals, el que suposa deu hores de transcripcions. Otter permet gravar àudio, rebre transcripcions en viu i pujar arxius des del nostre dispositiu.

Descript

Descript és una eina que combina capacitats d'edició amb funcions avançades de transcripció automàtica. Aquesta plataforma permet a les usuàries carregar arxius d'àudio i obtenir-ne transcripcions precises i detallades del seu contingut en temps real.

L'aplicació té una interfície intuïtiva que permet editar l'àudio i el text simultàniament, el que significa que pots poden fer edicions directament en la transcripció i veure com es reflecteixen en l'àudio i viceversa. A més, Descript ofereix funcions de col·laboració, la qual cosa facilita l'edició i revisió de projectes d'àudio en equip.

La plataforma ofereix opcions d'exportació per a una varietat de formats tant d'àudio com de vídeo.

Comparteix i difon