OpenAI представила голосовые модели нового поколения — можно бесплатно озвучить текст на русском

Система позволяет настраивать интонацию, стиль и эмоциональность.

OpenAI представила обновлённые голосовые модели для преобразования текста в речь и обратно. Они уже доступны разработчикам через API, также есть возможность протестировать их на специальном сайте. Можно ввести любой текст и выбрать стиль озвучки — от профессионального до повествовательного или даже средневекового. Поддерживается русский язык.

Новая система позволяет не только конвертировать текст в речь, но и настраивать интонацию, стиль и эмоциональность. Например, можно заставить модель говорить как вежливый оператор колл-центра или рассказчик детских сказок. Доступны пресеты, но есть и возможность вводить инструкции вручную.

Кроме того, OpenAI улучшила свою технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe обеспечивают более точную расшифровку аудиофайлов, снижая количество ошибок даже в сложных условиях — при наличии акцента, шуме или высокой скорости речи. Они превосходят предыдущие версии Whisper и другие популярные решения.

Новости технологий🤔XP-Pen представила Magic Note Pad — Android-планшет с имитацией E-Ink и стилусомZagg представила док-станцию для планшетов с большими кнопками для управления музыкой и видеоПоиск в Gmail научился показывать самые подходящие письма — с помощью ИИ

intro

Вам также может понравиться

Три четверти суши на Земле высыхают: ООН предупредила о глобальной угрозе

Xiaomi выпустила недорогой игровой монитор с 240-герцовым 2K-экраном

В мире животных: победители Fine Art Photography Awards 2024 в категории «Дикая природа»