AquaSoft stellt neues Transkriptionstool vor

Mit dem AquaSoft Transcriptor bringt das Potsdamer Unternehmen ein frei nutzbares Programm mit vielen Einsatzmöglichkeiten auf den Markt

AquaSoft stellt neues Transkriptionstool vor

Mit dem AquaSoft Transcriptor schnell und einfach Transkipte und Videountertitel erstellen. (Bildquelle: AquaSoft)

Softwareentwickler AquaSoft veröffentlicht mit dem AquaSoft Transcriptor (https://www.aquasoft.de/transcriptor) ein neues, kostenloses Tool: eine Vereinigung aus Sprachmodell Whisper von Open AI mit den Videobearbeitungsfunktionen der hauseigenen Programme. Aus diesem Zusammenschluss entsteht ein vielseitig einsetzbarer Helfer, der sprachliche Inhalte aus Audio- und Videodateien filtert und aufbereitet.

Audio rein – Text raus

Per Drag-and-Drop ziehen Nutzer Audio- oder Videodateien in die Benutzeroberfläche. Dort wählen Ersteller je nach Anwendungsfall die Transkriptions- und Ausgabevorlage sowie die Zieldatei. Unsichere Uploads in die Cloud vermeidet das Programm: Vom Bearbeiten bis zum fertigen Produkt bleibt alles lokal auf dem eigenen Computer. Verschiedene Kombinationen der Funktionen ermöglichen zum Beispiel ein schnelles Transkript einer Aufnahme, Untertitel direkt im Video oder auf Wunsch als Textdatei, visuelle Aufbereitung für Podcast-Folgen oder zur Weiterverarbeitung in den AquaSoft-Programmen. Egal ob YouTube-Channel oder Werbefilm, je zugänglicher ein Video, desto höher die Reichweite. Ein Untertitel vergrößert die Zielgruppe um ein Vielfaches: moderne Konsumenten, die ihre Medien ohne Ton ansehen, Menschen, die gesprochene Sprache schlecht verstehen und dank automatischer Übersetzung auch globale Zuschauer. Zudem sind audiovisuelle Inhalte mit textlicher Begleitung barrierefrei. Mit der KI Whisper springen im Nu die Worte über den Bildschirm. Aufnahme rein und mit einem Klick auf den Startknopf zaubert das Tool ein Video mit Untertitel. In der frei nutzbaren Standard-Version des AquaSoft Transcriptor wählen Nutzer das Erscheinungsbild ihres Videos aus fünf vorgegebenen Vorlagen. Für mehr Gestaltungsfreiraum greifen Kreative auf die Pro Version zurück.

Bildlich gesprochen

Im Bereich der Transkription performt das Sprachmodell Whisper von OpenAI bereits in der Standard Version. Integriert in die Software, bedarf es für dessen Nutzung keines Uploads in eine externe Cloud. Alle Daten bleiben auf dem heimischen Rechner. So hält das Tool Audio- und Videoaufnahmen schriftlich fest und wirft einen Text aus, der nach Wunsch im Ganzen, in Blöcken oder nach einzelnen Wörtern angeordnet ist. Ein Limit für die Länge des Inputs gibt es nicht. Eingabesprachen in Deutsch, Englisch, Französisch, Spanisch, Chinesisch und weiteren Sprachen lassen den Transcriptor auch auf internationalem Parkett glänzen. Neben Transkripten von Gesprächen, Interviews oder Lesungen fungiert eine Abschrift auch als Untertitel-Datei für YouTube-Videos. Das jüngste Programm aus dem Hause AquaSoft überträgt nicht nur Ton zu Text, sondern bereitet auch Audioaufnahmen visuell auf. Podcast-Hosts, die neue Kanäle bespielen wollen, richten ihre Aufmerksamkeit auf YouTube. Auf der Plattform rangieren Formate mit Bewegtbild höher im Ansehen, als jene mit statischen Bildern. Die Funktion Spektrum unterlegt Erzählungen mit einer visuellen Illustration des Gesprochenen. Ein Episoden-Bild hinter der Anzeige schafft Wiedererkennungswert.

Transcriptor Pro

Wer sein eigenes Flair mit einbringen möchte, lässt die Regler tanzen. Mit dem Transcriptor Pro für 29,90 EUR im Jahr erhalten Nutzer die vollen Gestaltungsmöglichkeiten im Programm. Damit beschleunigen sich Verarbeitungsvorgänge, zudem kommt eine Übersetzungsfunktion hinzu und eigene Vorlagen lassen sich erstellen und speichern. Über Drop-Down Menüs wählen Nutzer aus vorgefertigten Hintergründen von natürlichen Mustern bis hin zu abstrakten Werken eine passendeUntermalung des Geschehens. Innerhalb der Kulissen passen Kreative Farben, Ausrichtung, Deckstärke und mehr dem eigenen Geschmack an. Eine Vorschau gibt die Änderungen wieder – bei Gefallen stehen alle gängigen Formate, Auflösungen und Seitenverhältnisse zur Ausgabe bereit. Fertige Transkriptionen können entweder direkt als Video ausgegeben werden, oder als AquaSoft Stages-Projekt detailliert weiterbearbeitet werden.

Systemanforderungen

– Betriebssystem: Windows 11 und 10 mit 64-bit
– Arbeitsspeicher: je nach verwendetem Sprachmodell 2-8 GB freiem RAM
– CPU: Multicore CPU wird voll ausgeschöpft.
– Grafikkarte: Es werden nur geringfügige Anforderungen an die Grafikkarte gestellt, wenn die CPU zur Transkription verwendet wird. Zur optionalen KI-Beschleunigung ist eine CUDA-fähige Grafikkarte mit 8 GB Videospeicher von Vorteil und kann den Vorgang deutlich beschleunigen. Auch bei der Videoausgabe ist eine bessere Grafikkarte von Vorteil, aber nicht Voraussetzung.
– Internetverbindung zum Download der Sprachmodelle
– Festplattenspeicher: 6-10 GB

Die AquaSoft GmbH entstand 2003 aus dem Start-up-Unternehmen AquaSoftware des Software-Ingenieurs Steffen Binas. Die Kernkompetenz des Entwicklerstudios liegt in Tools zur Bearbeitung und Komposition digitaler Fotos und Videos. Das Unternehmen bietet die Softwares Photo Vision, Video Vision und Stages sowie viele Erweiterungen für die jeweiligen Programme an. In den Versionen Photo Vision für Einsteiger und Video Vision für Fortgeschrittene ermöglicht AquaSoft PC-Anwendern effektvolle Bilder- und Videokreationen; die Profi-Version Stages wendet sich an Erfahrene, wie Fotografen und Medienschaffende. Mit der YouDesign-Produktlinie von AquaSoft lassen sich eigene Buchlayouts und Kalender erstellen. Am Unternehmenssitz in Potsdam beschäftigen sich die Mitarbeiter mit der Programmierung von Produkt-Erweiterungen, -Updates, -Upgrades sowie neuen Software-Produkten rund um die Foto- und Videowelt und leisten persönlich Kundensupport. Mehr Informationen auf www.aquasoft.de.

Firmenkontakt
AquaSoft GmbH
Steffen Binas
Ribbeckstraße 10
14469 Potsdam
0331 505743642
https://www.aquasoft.de

Pressekontakt
Borgmeier Public Relations
Jörg Wiedebusch
Rothenbaumchaussee 5
20148 Hamburg
040/4130 96 27

Home

German Wahnsinn unterstützt ab sofort die Deutsche Bahn

Audio-Pitchgewinn

German Wahnsinn unterstützt ab sofort die Deutsche Bahn

German Wahnsinn Logo (Bildquelle: German Wahnsinn)

Hamburg, den 07. Februar 2024: German Wahnsinn setzt sich im Audio-Post-Produktion-Pitch der Deutschen Bahn durch. Die Hamburger Audio-Agentur ist damit ab sofort als Audio-Haus für den Mobilitäts- und Transportkonzern tätig und neben dem bisherigen Rahmenvertragspartner FunDeMental Studios für die Service-Leistungen aus dem Bereich der Audio-Post-Produktion verantwortlich.

Das Aufgabengebiet von German Wahnsinn als neuer Rahmenvertragspartner umfasst die ganzheitliche Audio-Umsetzung und Produktion der akustischen Marketing-Kommunikation der Deutschen Bahn. Das beinhaltet unter anderem die Audio-Post-Produktion und Musik-Komposition uber alle Medienarten wie TV, Funk, Film, Digital, Social Media, Podcasts und eLearning sowie Infotainment Content. All das jeweils in enger Zusammenarbeit mit den Fachbereichen der Deutschen Bahn sowie der jeweils für die Kampagne oder das Projekt zuständigen Kreativagentur.

Die Deutsche Bahn hat sich für German Wahnsinn entschieden, da die Agentur über langjährige Erfahrung und Expertise sowie ein hohes Maß an Beratungskompetenz verfügt. Auch die Innovationskraft im Bereich Audio-Kreation im Zusammenspiel mit dem Media-Mix einer Kampagne war ausschlaggebend für die Wahl.

Als Full-Service Audio-Agentur mit zugehörigem Tonstudio-Komplex begleiten die Sound- und Branding-Expert:innen von German Wahnsinn seit vielen Jahren innovative Marken und Agenturen partnerschaftlich durch alle Phasen der auditiven Markenführung und -kommunikation. Von der Strategiefindung und Beratung über die Konzeption und Kreation bis hin zur Produktion oder sogar Entwicklung innovativer Audio-Technologien übernehmen sie dabei alle Arbeiten selbst.

Zu ihren Kunden gehören unter anderem Automobilhersteller wie Audi, VW, Mercedes und BMW, Unternehmen wie Google, VISA, About You und EnBW, Lebensmittelhändler wie Lidl, Netto und Edeka, Brands wie Ferrero, Gustavo Gusto, Pringles und Diesel, Versicherungsanbieter wie AOK, VHV und DEVK, Musik-Label wie Universal Music und Sony sowie die Agenturen JvM, Accenture, Serviceplan, Publicis, Fischer-Appelt und Scholz & Friends.

Auch technologisch ist German Wahnsinn im Bereich Audio am Zahn der Zeit. So haben sie 2023 mit der App Reckless Air ein immersives Audio-Erlebnis geschaffen, das die Grenzen zwischen Hörbuch und Gaming-Experience verwischt. Ihre eigene Sprach-KI Lösung „Human Touch AI“, eine Kombination aus Voice Cloning, Synthetic Voices, Übersetzungen und Text to Speech, wird bereits für einige Kunden eingesetzt und verfolgt ein nachhaltiges KI-Konzept im Einklang zwischen Sprecher:innen und der hiesigen Industrie.

Die Meldung steht als .DOCX, .PDF und .TXT hier mitsamt Bildmaterial zum Download bereit: https://t1p.de/mug4n

Über German Wahnsinn

German Wahnsinn ist eine 360° Audio-Agentur mit zugehörigem Tonstudio-Komplex in Hamburg St. Pauli. Als Deutschlands kreativste Audio Agency begleiten die Sound- und Branding-Experten innovative Marken und Agenturen partnerschaftlich durch alle Phasen und Fallstricke der auditiven Markenführung und -kommunikation, von der Strategiefindung und Beratung über die Konzeption und Kreation bis hin zur Produktion. Zum ganzheitlichen Leistungsspektrum gehört neben der einzigartig fundierten Audio Beratung und allen Services klassischer Ton- und Aufnahmestudios auch die Realisation immersiver Hörerlebnisse in XR (Extended Reality) und dem Metaverse. Weitere Impulse setzt German Wahnsinn mit dynamischem Storytelling und dem Einsatz neuester Technologien, darunter Gaming-Engines und eigenentwickelte Apps sowie Software und Tools für neuartige Audio Kreationen. So unterstützt das 15-köpfige Team rund um die Geschäftsführer Philipp Feit und Eduardo García andere Kreative mit ihrer spezialisierten Audio Expertise bei der Umsetzung preisgekrönter Kampagnen u.a. für Kunden wie Allianz, Audi, Migros, Peta und haucht mit wegweisenden Hörerlebnissen wie Joyns „Ultrasonic Maffia Call“ und „TKKGs verfluchtes Osterei“ echte Emotionen ein. German Wahnsinn betreibt zudem das Musiklabel German Wahnsinn Records sowie, gemeinsam mit der Bestseller-Autorin Cornelia Funke, den Boutique Hörbuchverlag Atmende Bücher.

Weitere Informationen gibt es hier: GermanWahnsinn.de und auf LinkedIn.

German Wahnsinn – The Immersive Audio Agency

Firmenkontakt
German Wahnsinn
Janette Hoefer
Kastanienallee 9
20359 Hamburg
040 32536244
www.germanwahnsinn.de

Pressekontakt
Hoefer Communications
Janette Hoefer
Fuhlsbüttler Straße 292
22307 Hamburg
+4915172878708
hoefercommunications.com