В ноябре 2023 года я уже рассказывал о том, как подход Zoom с объединением моделей ИИ позволил достичь качества практически того же уровня, что и у OpenAI GPT-4, пи этом затраты на логический вывод составили всего 6%. Насколько бы впечатляющими ни были эти результаты, теперь мы можем еще больше улучшить качество выводов ИИ по сравнению с GPT-4 от OpenAI для наших самых популярных функций конференций. Благодаря решению Zoom AI Companion относительные ошибки сократились более чем на 20% (в случае с итогами конференций Zoom) и на 60% (в случае выведения следующих шагов) по сравнению с GPT-4 в рамках нашего слепого эталонного тестирования с человеческой проверкой.
В поддержку наших мероприятий по обучению с целью повышения качества выполняемых задач наш уникальный подход с объединением ИИ позволяет воспользоваться всеми преимуществами многих расширенных БЯМ с закрытым и открытым исходным кодом, которые в комбинации дают лучшие результаты. В этом и заключается отличие от других поставщиков, которые привязаны к конкретным БЯМ. Например, Microsoft Copilot опирается на GPT-4, а Google — на Gemini.
Этот подход к наборам ИИ выделяет Zoom AI Companion на фоне других, обеспечивая клиентам высококачественную работу наших самых популярных функций. Как я уже упоминал в своей последней публикации, мы используем нашу собственную систему оценки Z-scorer, чтобы определять качество результатов, сгенерированных ИИ. Сначала мы используем менее дорогостоящую БЯМ, которая лучше всего подходит для каждой задачи. Затем с помощью Z-scorer определяем качество первоначального выполнения задачи. При необходимости можем использовать другую дополнительную БЯМ, чтобы уточнить задачу. Благодаря такому процессу мы получаем более качественный результат аналогично тому, как люди в команде могут достичь больших результатов вместе, чем по отдельности.
С тех пор мы улучшили нашу систему оценки Z-scorer, внедрив дополнительные сигналы качества от различных БЯМ. Кроме того, чтобы улучшить соответствие предпочтениям человека, мы улучшили объединенное стимулированное обучение. Когда мы объединяем БЯМ Zoom с набором дополнительных БЯМ, популярная функция создания сводки конференции Zoom обеспечивает высококачественные результаты и, согласно нашему недавнему эталонному тестированию, теперь может превзойти модель GPT-4, на базе которой работает Copilot в Microsoft Teams.
Что касается безопасности ИИ, мы также уменьшили предвзятость, присущую большинству БЯМ, сформировав группу из нескольких БЯМ, таких как Claude-3, Gemini и GPT-4, чтобы сократить случаи создания ложной информации и улучшить нашу БЯМ Zoom. Например, разные БЯМ вряд ли сформируют одну и ту же ложную информацию, поэтому мы можем получить более последовательные ответы и сократить случаи получения посторонних значений.