Как на самом деле работают чат-боты и модели больших языков, или LLM

Во втором нашем серия из пяти частейя собираюсь объяснить, как на самом деле работает технология.

Искусственный интеллект, лежащий в основе ChatGPT, чат-бота Bing от Microsoft и Bard от Google, может вести человеческую беседу и писать естественную, плавную прозу на бесконечное множество тем. Они также могут выполнять сложные задачи, от написания кода до планирования детского дня рождения.

Но как все это работает? Чтобы ответить на этот вопрос, нам нужно заглянуть под капот чего-то, что называется большой языковой моделью — типа ИИ, который управляет этими системами.

Большие языковые модели, или LLM, относительно новы на сцене ИИ. Первые появились всего около пяти лет назад и были не очень хороши. Но сегодня они могут составлять электронные письма, презентации и заметки и обучать вас иностранному языку. В ближайшие месяцы и годы обязательно появится еще больше возможностей, поскольку технология совершенствуется, а Силиконовая долина изо всех сил пытается получить прибыль.

Я собираюсь провести вас через настройку большой языковой модели с нуля, упростив вещи и опустив много сложной математики. Давайте представим, что мы пытаемся создать LLM, чтобы помочь вам отвечать на ваши электронные письма. Мы назовем его MailBot.

Содержание статьи

0.1 Шаг 1: поставьте цель
0.2 Шаг 2. Соберите много данных

1 Новое поколение чат-ботов
2 Твоя домашняя работа
3 Контрольный опрос
- 3.1 Какова основная целевая функция больших языковых моделей, таких как ChatGPT?
4 Глоссарий

Шаг 1: поставьте цель

Каждой системе ИИ нужна цель. Исследователи называют это целевая функция. Это может быть просто — например, «выиграть как можно больше партий в шахматы» — или сложно, например, «предсказать трехмерную форму белков, используя только их аминокислотные последовательности».

Большинство больших языковых моделей имеют одну и ту же основную целевую функцию: по заданной последовательности текста угадать, что будет дальше. Позже мы дадим MailBot более конкретные цели, но пока давайте придерживаться этой.

Шаг 2. Соберите много данных

Далее нам нужно собрать обучающие данные, которые научат MailBot писать. В идеале мы создадим колоссально большое хранилище текста, что обычно означает миллиарды страниц, извлеченных из Интернета, таких как посты в блогах, твиты, статьи в Википедии и новости.

Для начала мы воспользуемся некоторыми бесплатными общедоступными библиотеками данных, такими как репозиторий веб-данных Common Crawl. Но мы также хотим добавить наш собственный секретный соус в виде проприетарных или специализированных данных. Может быть, мы лицензируем какой-нибудь текст на иностранном языке, чтобы MailBot научился составлять электронные письма на французском или испанском языках, а также на английском. В общем, чем больше у нас данных и чем разнообразнее источники, тем лучше будет наша модель.

Прежде чем мы сможем передать данные в нашу модель, нам нужно разбить их на единицы, называемые токенами, которые могут быть словами, фразами или даже отдельными символами. Преобразование текста в фрагменты размером с укус помогает модели легче анализировать его.

Шаг 3: Создайте свою нейронную сеть

Как только наши данные токенизированы, нам нужно собрать «мозг» ИИ — тип системы, известный как нейронная сеть. Это сложная сеть взаимосвязанных узлов (или «нейронов»), которые обрабатывают и хранят информацию.

Для MailBot мы собираемся использовать относительно новый тип нейронной сети, известный как трансформер модель. Они могут анализировать несколько фрагментов текста одновременно, что делает их более быстрыми и эффективными. (Модели-трансформеры являются ключом к таким системам, как ChatGPT, чей полный акроним расшифровывается как «Generative Pretrained Transformer».)

Шаг 4: Обучите свою нейронную сеть

Далее модель будет анализировать данные, токен за токеном, выявляя закономерности и взаимосвязи. Он может заметить, что за словом «Уважаемый» часто следует имя, или что слово «С наилучшими пожеланиями» обычно стоит перед вашим именем. Идентифицируя эти шаблоны, ИИ учится создавать сообщения, которые имеют смысл.

Система также развивает чувство контекста. Например, он может узнать, что «банк» может относиться к финансовому учреждению или берегу реки, в зависимости от окружающих слов.

Изучая эти паттерны, модель-трансформер рисует карту: чрезвычайно сложное математическое представление человеческого языка. Он отслеживает эти отношения, используя числовые значения, известные как параметры. Многие из лучших на сегодняшний день LLM имеют сотни миллиардов параметров и более.

Обучение может занять дни или даже недели и потребует огромных вычислительных мощностей. Но как только это будет сделано, он будет почти готов начать писать ваши электронные письма.

Как ни странно, это может развить и другие навыки. По мере того, как LLM учатся предсказывать следующее слово в последовательности снова и снова, они могут приобретать другие, неожиданные способности, такие как знание того, как кодировать. Исследователи ИИ называют это эмерджентным поведением, и они до сих пор иногда озадачены им.

Шаг 5: Точная настройка модели

После обучения большой языковой модели ее необходимо откалибровать для конкретной задачи. Например, чат-боту, используемому в больнице, может потребоваться понимать медицинские термины.

Чтобы настроить MailBot, мы могли бы попросить его сгенерировать кучу электронных писем, нанять людей, чтобы оценить их точность, а затем передать оценки обратно в модель, пока она не улучшится.

Это грубое приближение к подходу, который использовался с ChatGPT, который известен как обучение с подкреплением с обратной связью от человека.

Шаг 6: Запускайте осторожно

Поздравляем! После того, как MailBot обучен и настроен, он готов к использованию. После того, как вы создадите для него какой-то пользовательский интерфейс — например, расширение Chrome, которое подключается к вашему почтовому приложению — оно может начать рассылать электронные письма.

Но каким бы хорошим он ни казался, вам все равно захочется следить за своим новым помощником. Такие компании, как Microsoft и Meta, на собственном горьком опыте убедились, что системы искусственного интеллекта могут быть неустойчивыми и непредсказуемыми или даже становиться жуткими и опасными.

Завтра мы узнаем больше о том, как что-то может пойти не так неожиданным и иногда тревожным образом.

Твоя домашняя работа

Давайте рассмотрим одну из наиболее творческих способностей LLM: способность объединять разрозненные концепции и форматы в нечто причудливое и новое. Например, наши коллеги из Well попросили ChatGPT «написать песню голосом Тейлор Свифт, используя темы из книги доктора Сьюза».

В качестве домашнего задания попробуйте смешать формат, стиль и тему — например, «Напишите лимерик в стиле Снуп Догга о глобальном потеплении».

Не забудьте поделиться своим творением в комментариях.

Контрольный опрос

Вопрос 1 из 3

Какова основная целевая функция больших языковых моделей, таких как ChatGPT?

Начните викторину, выбрав свой ответ.

Глоссарий

Модель трансформатора: Архитектура нейронной сети, полезная для понимания языка, которая не должна анализировать слова по одному, а может просматривать все предложение сразу. Техника, называемая самовниманием, позволяет модели сосредоточиться на определенных словах, важных для понимания смысла предложения.
Параметры: Числовые значения, определяющие структуру и поведение большой языковой модели, например подсказки, помогающие угадать, какие слова следуют дальше. Считается, что современные системы, такие как GPT-4, имеют сотни миллиардов параметров.
Обучение с подкреплением: Техника, которая учит модель ИИ находить лучший результат методом проб и ошибок, получая награды или наказания от алгоритма на основе его результатов. Эта система может быть улучшена людьми, дающими отзывы о ее работе.

Щелкните здесь, чтобы просмотреть дополнительные термины из глоссария.