Conformer-2: Un modello di riconoscimento vocale all'avanguardia
Conformer-2 è il nuovo modello di intelligenza artificiale per il riconoscimento vocale automatico di AssemblyAI. È stato addestrato su 1,1 milioni di ore di dati audio in inglese e rappresenta un notevole miglioramento rispetto a Conformer-1. Offre miglioramenti in gestione dei nomi propri, degli alfanumerici e nella robustezza al rumore.
Ha le seguenti caratteristiche principali: migliora del 31,7% nella trascrizione di dati alfanumerici, riduce il tasso di errore sui nomi propri del 6,8% e ha una robustezza al rumore migliorata del 12%. È disponibile tramite l'API e può essere provato nel Playground. È adatto per applicazioni come call center, podcast e trasmissioni.
Conformer-2 migliora anche la velocità di trascrizione, riducendo il tempo per trascrivere un file audio di un'ora. Inoltre, introduce un nuovo parametro API, il speech_threshold
, per gestire i costi. È diventato il modello predefinito, offrendo prestazioni migliorate senza richiedere modifiche agli utenti attuali.