BlenderBot 3: AI Chatbot, който се подобрява чрез разговор

За да изградим системи с изкуствен интелект (AI), които могат да взаимодействат с хората по по-интелигентни, по-безопасни и по-полезни начини, трябва да ги научим да се адаптират към нашите нужди. Днес пускаме BlenderBot 3, нашият най-съвременен разговорен агент, който може да разговаря естествено с хора, които след това могат да предоставят обратна връзка на модела за това как да подобри своите отговори. Ще споделяме данни от тези взаимодействия и споделихме модела на BlenderBot 3 и картите с модели с научната общност, за да подпомогнем напредъка в изследванията в разговорния AI.

Серията BlenderBot постигна напредък в комбинирането на разговорни умения – като личност, съпричастност и знания – включващи дългосрочна памет и търсене в интернет за провеждане на смислени разговори. BlenderBot 3 наследява тези умения и осигурява превъзходна производителност, защото е изграден от публично достъпния Meta AI Езиков модел OPT-175B — приблизително 58 пъти по-голям от размера на BlenderBot 2.

Тъй като е известно, че всички разговорни AI чатботове понякога имитират и генерират опасни, пристрастни или обидни забележки, ние проведохме широкомащабни проучвания, съвместно организирахме семинари и разработихме нови техники за създаване на предпазни мерки за BlenderBot 3. Въпреки тази работа, BlenderBot все още може правят груби или обидни коментари, поради което събираме обратна връзка, която ще помогне за подобряване на бъдещите чатботове.

Обещанието и предизвикателството да чатите с хора

Позволяването на AI система да взаимодейства с хора в реалния свят води до по-дълги, по-разнообразни разговори, както и по-разнообразна обратна връзка. Например, можете да реагирате на всяко съобщение в чата в нашата демонстрация на BlenderBot 3, като щракнете върху иконите с палец нагоре или с палец надолу. Избирането на палец надолу ви позволява да обясните защо не сте харесали съобщението – дали е извън темата, безсмислено, грубо, като спам или нещо друго. Можете също да изпратите обратна връзка в самия чат.

Разработване на безопасен чатбот, който се подобрява сам

За да подобрим способността на BlenderBot 3 да се ангажира с хора, ние го обучихме с голямо количество публично достъпни езикови данни. Много от използваните набори от данни бяха събрани от нашия собствен екип, включително един нов набор от данни, състоящ се от повече от 20 000 разговора с хора, базирани на повече от 1000 теми за разговор. Обучихме BlenderBot 3 да се учи от разговори, за да подобри уменията, които хората смятат за най-важни – от говорене за здравословни рецепти до намиране на подходящи за деца удобства в града.

Когато отговорът на чатбота е незадоволителен, ние събираме обратна връзка за него. Използвайки тези данни, можем да подобрим модела, така че да не повтаря грешките си.

Разбираме, че не всеки, който използва чатботове, има добри намерения, затова разработихме и нов алгоритъм за обучениес да прави разлика между полезни отговори и вредни примери. С течение на времето ще използваме тази техника, за да направим нашите модели по-отговорни и безопасни за всички потребители.

Тестване на BlenderBot 3

В сравнение с предшествениците си открихме, че BlenderBot 3 се е подобрил с 31% при разговорни задачи. Освен това е два пъти по-осведомен, като същевременно е фактически неверен с 47% по-рядко. Открихме също, че само 0,16% от отговорите на BlenderBot към хората са маркирани като груби или неподходящи.

Целта на нашето изследване е да съберем и публикуваме данни за обратна връзка, които ние и по-широката изследователска общност на ИИ можем да използваме с течение на времето. По този начин можем да намерим нови начини системите с изкуствен интелект да бъдат по-безопасни и по-ангажиращи за хората, които ги използват.

Ускоряване на разговорния AI

Напредъкът в областта на ИИ силно зависи от възможността за по-широката изследователска общност на ИИ да надгражда върху най-добрата налична технология. Ето защо, пускането на модели и набори от данни за chatbot е от ключово значение за получаване на пълна, надеждна представа за това как и защо работят, потенциала, който притежават, и техните ограничения.

Въпреки че BlenderBot 3 значително подобрява публично достъпните чатботове, това със сигурност не е на човешко ниво. Понякога е неправилно, непоследователно и извън темата. Тъй като повече хора взаимодействат с нашата демонстрация, ние ще подобрим нашите модели, като използваме тяхната обратна връзка и ще публикуваме данни, за да бъдем от полза за по-широката общност на AI.

Научете повече за BlenderBot 3