Artikel

heise.deheise.de am 2023-01-10 16:52

Drei Sekunden Input reichen: Microsofts KI Vall-E imitiert menschliche Sprache

Die KI Vall-E braucht für die Sprachsynthese nur drei Sekunden Audioinput des Sprechers. Ihr großes Missbrauchspotenzial haben auch die Entwickler erkannt.

Verwandte Nachrichten

Experimentelle, automatisiserte Zusammenfassung

Diese Schlagzeile nennt Jonas Volkert und darüber hinaus Ground Truth, veröffentlicht auf heise.de