Deze is in staat om op basis van een audiofragment van 15 seconden aan ingesproken tekst, een stem volledig na te bootsen.
De nieuwe technologie wordt ondergebracht in de tool ‘Voice Engine’. Deze kun je teksten voeren, waarna deze worden uitgesproken. Daarbij kan Voice Engine hier een natuurlijke intonatie aan geven en de audio van emotie voorzien. Welke trainingsdata is gebruikt, is nog onbekend. Wanneer de tool openbaar wordt gemaakt is onbekend, maar wie nieuwsgierig is, kan de eerste audiosamples bij OpenAI beluisteren.