AI Companion Spotkanie i czat

Zintegrowane podejście Zoom do sztucznej inteligencji zapewnia najwyższej jakości wyniki dla naszych najpopularniejszych funkcji

Dyrektor ds. technicznych Zoom, Xuedong Huang, omawia nasze podejście do sztucznej inteligencji i sposób, w jaki zapewnia ona wysokiej jakości wydajność podsumowań spotkań, streszczeń i kolejnych kroków.

8 min czytania

Aktualizacja: July 18, 2024

Opublikowano March 26, 2024

Zintegrowane podejście Zoom do sztucznej inteligencji zapewnia doskonałą jakość wyników dla najpopularniejszych funkcji asystenta AI Companion

W listopadzie 2023 r. opowiedziałem o tym, jak zintegrowane podejście Zoom do sztucznej inteligencji doprowadziło do osiągnięcia jakości prawie równej GPT-4 OpenAI przy zaledwie 6% kosztu wnioskowania. Choć wyniki te były imponujące, możemy teraz zapewnić jeszcze lepszą jakość sztucznej inteligencji w porównaniu z GPT-4 firmy OpenAI dla naszych najpopularniejszych funkcji spotkań. Zoom AI Companion zmniejszył względne błędy o ponad 20% (w przypadku streszczeń podsumowań spotkań Zoom) i 60% (w przypadku „kolejnych kroków”) w porównaniu z GPT-4 w naszym wewnętrznym, ocenianym przez człowieka ślepym teście porównawczym. 

Na poparcie naszych wysiłków treningowych mających na celu udoskonalenie jakości wykonywania zadań, nasze unikalne zintegrowane podejście do sztucznej inteligencji wykorzystuje wiele zaawansowanych dużych modeli językowych (LLM) o zamkniętym i otwartym kodzie źródłowym, współpracujących ze sobą w celu uzyskania lepszych wyników. Jest to przeciwieństwo innych dostawców, którzy są związani z określonymi LLM. Na przykład Microsoft Copilot polega na GPT-4, a Google na Gemini.

Takie podejście do sztucznej inteligencji wyróżnia Zoom AI Companion, zapewniając naszym klientom wysokiej jakości doświadczenia dzięki naszym najpopularniejszym funkcjom. Jak wspomniałem w mojej ostatniej aktualizacji, używamy naszego zastrzeżonego kalkulatora standaryzacji, aby ocenić jakość naszych wyników generowanych przez sztuczną inteligencję. Po pierwsze, wykorzystujemy tańszy LLM, najbardziej odpowiedni do każdego zadania. Następnie nasz kalkulator standaryzacji ocenia jakość początkowego wykonania zadania. W razie potrzeby możemy użyć innego komplementarnego LLM, aby udoskonalić zadanie. Proces ten skutkuje wyższą jakością wyników w taki sam sposób, w jaki zespół ludzi może osiągnąć razem więcej niż jakakolwiek pojedyncza osoba.

Od tego czasu ulepszyliśmy nasz kalkulator standaryzacji, włączając dodatkowe sygnały jakości z różnych LLM. Ponadto, aby lepiej dostosować się do ludzkich preferencji, ulepszyliśmy zintegrowane uczenie się przez wzmacnianie. Łącząc LLM Zoom z zestawem uzupełniających się LLM, popularne podsumowanie spotkania Zoom zapewnia wysokiej jakości wyniki i, zgodnie z naszymi ostatnimi testami porównawczymi, może teraz przewyższyć GPT-4, który jest używany w przypadku usługi Copilot w Microsoft Teams.

Jeśli chodzi o bezpieczeństwo sztucznej inteligencji, zmniejszyliśmy również nieodłączne błędy większości LLM, tworząc komitet złożony z wielu LLM, takich jak Claude-3, Gemini i GPT-4, aby zmniejszyć halucynacje i ulepszyć nasz LLM Zoom. Na przykład mało prawdopodobne jest, aby różne LLM popełniły ten sam błąd halucynacyjny, więc możemy uzyskać bardziej spójne odpowiedzi i zmniejszyć wpływ wartości odstających. 

Zintegrowane podejście Zoom do sztucznej inteligencji jest bardziej efektywne tam, gdzie nasi użytkownicy najbardziej tego potrzebują

Niedawno przeprowadziliśmy analizę porównawczą naszych wyników pod kątem dwóch najpopularniejszych komponentów podsumowania spotkania: streszczeń i kolejnych kroków. Ponad pół miliona klientów Zoom włączyło te funkcje od czasu uruchomienia asystenta AI Companion we wrześniu 2023 roku. 

W naszym najnowszym wewnętrznym teście poprosiliśmy sędziów, aby wybrali najdokładniejsze podsumowanie spotkania, nie ujawniając, który model sztucznej inteligencji został użyty do wygenerowania każdego podsumowania. Jak pokazano na poniższym wykresie, Zoom LLM przewyższył GPT-4 w języku angielskim zarówno pod względem podsumowań spotkań, jak i wyodrębniania kolejnych kroków w każdym ślepym teście. Możemy zmniejszyć względne błędy podsumowań spotkań i wyodrębniania kolejnych kroków odpowiednio o ponad 20% i 60%, co bezpośrednio przekłada się na przewagę jakościową.

Rysunek 1. Podsumowanie spotkania i wyodrębnienie kolejnych kroków w języku angielskim w ocenie człowieka. LLM Zoom i Anthropic Claude-3 zostały połączone w celu uzyskania końcowych wyników, które znacznie przewyższają wyniki uzyskane przy użyciu wyłącznie GPT-4 OpenAI.

Rysunek 1. Podsumowanie spotkania i wyodrębnienie kolejnych kroków w języku angielskim w ocenie człowieka. LLM Zoom i Anthropic Claude-3 zostały połączone w celu uzyskania końcowych wyników, które znacznie przewyższają wyniki uzyskane przy użyciu wyłącznie GPT-4 OpenAI.

Zmierzyliśmy również jakość ogólnego podsumowania spotkania dla języka japońskiego, używając LLM Zoom w porównaniu z GPT-4. Jak widać na poniższym wykresie, nasze zintegrowane podejście było w stanie zapewnić lepsze wyniki w tym zakresie. 

Rysunek 2. Ogólne podsumowanie spotkania w języku japońskim w ocenie człowieka. LLM Zoom i GPT-4 OpenAI zostały połączone w celu uzyskania końcowych wyników, które przewyższają wyniki uzyskane przy użyciu wyłącznie GPT-4 OpenAI.
Rysunek 2. Ogólne podsumowanie spotkania w języku japońskim w ocenie człowieka. LLM Zoom i GPT-4 OpenAI zostały połączone w celu uzyskania końcowych wyników, które przewyższają wyniki uzyskane przy użyciu wyłącznie GPT-4 OpenAI.

Zoom Workplace i usługi biznesowe z wbudowaną, wysokiej jakości sztuczną inteligencją

Dokładamy wszelkich starań, aby zapewnić naszym klientom korzyści płynące z Zoom AI Companion na platformie Zoom bez dodatkowych kosztów w przypadku kwalifikujących się płatnych planów Zoom*. Ten nieustanny nacisk na jakość sztucznej inteligencji zwiększa wartość dla klientów planu Zoom Workplace i Usług biznesowych Zoom. Ponadto, zgodnie z badaniem GigaOm zleconym przez Zoom (opublikowanym 26 marca 2024 r.), transkrypcja asystenta AI Companion przebiega z 95% dokładnością, a w przypadku scenariuszy pytań podczas spotkania asystent AI Companion dostarczał wyniki czterokrotnie szybciej niż sieć ChatGPT-4.

Dzięki tym innowacjom masz pewność, że każdemu spotkaniu Zoom może towarzyszyć wygenerowane przez sztuczną inteligencję podsumowanie spotkania, które ma jedną z najlepszych jakości sztucznej inteligencji w branży. 

* Asystent AI Companion może nie być dostępny we wszystkich regionach i branżach.

Nasi klienci nas kochają

Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox
Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom – jedna platforma do połączeń