Posted 17 мая, 08:44
Published 17 мая, 08:44
Modified 1 июля, 06:39
Updated 1 июля, 06:39
GPT-4o — новая, усовершенствованная версия искусственного интеллекта генеративного типа. Как отмечает разработчик OpenAI, GPT4 Omni будет использоваться в качестве основы для функционирования ChatGPT. Кстати, omni — это означает «всесторонний», что в полной мере раскрывает способности новой версии.
GPT-4o позволяет эффективно работать как с текстами, так и с изображениями, с аудиозаписями. Разработчики отмечают, что скорость реакции GPT-4o на голос человека составляет около 300 миллисекунд, это сопоставимо с той реакцией, которую сам человек демонстрирует на голос живого собеседника.
GPT-4o быстро распознает аудио, изображения. Также внедрен новый голосовой режим, который состоит из нескольких моделей. Одна из них переводит в текст аудио, другая обеспечивает вывод текста, а третья может преобразовать его в аудио, если появится необходимость. Модель умеет анализировать файлы по сквозному типу, то есть вся информация обрабатывается в рамках одной нейронной сети.
Как уточняют разработчики, GPT4 Omni доступна на нескольких десятках языков, в частности и на русском языке.
Релиз GPT4 Omni состоялся 13 мая, с этой же даты программа стала доступна потенциальным пользователям. Впрочем, как подчеркивают разработчики, доступ непосредственно к голосовым функциям получат только некоторые пользователи из числа доверенных партнеров. В июне 2024 года всеми возможностями GPT4 Omni смогут пользоваться те, кто оформил платную подписку.