Стартер-пак для бизнеса: зачем нужен GPT-3 и какие навыки потребуются для работы с этой нейросетью

Опубликовано От Sergey

Сочинить пост, перевести интервью, переписать код — рынок полон запросов по работе с «текстом» в самом широком смысле этого слова. Однако большая часть работ пока делается вручную. Чтобы добиться существенной автоматизации, можно прибегнуть к помощи GPT-3, самого продвинутого алгоритма для генерации осмысленного текста.

Rusbase изучил, как именно применяется технология, и узнал у экспертов, какие навыки понадобятся для работы с ним.

Стартер-пак для бизнеса: зачем нужен GPT-3 и какие навыки потребуются для работы с этой нейросетью

Варвара Краснова

 

Коммерческий интерес

На сегодня GPT-3 — самый мощный и перспективный алгоритм генерации текстов, способный понимать не только программные, но и естественные языки. Многие предприниматели высоко оценивают потенциал этой технологии. Microsoft даже стал обладателем эксклюзивной лицензии на исходный код GPT-3, внедрив программу в свой облачный суперкомпьютер.

При этом OpenAI, компания-создатель GPT, заверяла, что нацелена на благо общества, а не отдельного государства или корпорации.

Изначально доступ к программе планировали открывать только «мирному» бизнесу и исследователям (правда, критерии «мирности» пока что не озвучивались).

В частности, в июне в рамках бета-тестирования OpenAI доверила код GPT-3 нескольким сотням разработчиков и ученых. 

Однако начиная с 1 октября политика компании несколько изменилась: как выяснил независимый аналитик Гверн Бранвен, для желающих воспользоваться GPT-3 заработал специальный тарифный план, действующий до завершения бета-тестирования. Цены варьируются от $100 до $400 за месяц в зависимости от целей получателя и объема токенов В данном случае токены — семантическая единица. В рамках тарифов открываются от 100 тыс до 10 млн токенов на определенный срок. Для сравнения, для обучения модели GPT-3 потребовалось 499 млрд таких токенов. 2 млн токенов, предусмотренных в плане GPT-3 Create, равняются примерно 900 тыс слов из работы Уильяма Шекспира. (Прим. ред.).

Впрочем, с заинтересованными в непредвзятом исследовании GPT-3 кодом поделятся бесплатно, просят только встать в лист ожидания, заполнив специальную форму. Идет ли отбор «мирных» заявок по-прежнему или же доступ дают буквально каждому  — неизвестно. 

Тарифный план на GPT-3 

 

Практическая реализация

Хотя тестирования GPT-3 еще идут, предприимчивые разработчики уже смогли запустить сервисы на основе этой технологии.

Одни решения, вроде Compose.ai, OthersideAI и Magic Email, могут сочинять электронные письма. Другие, как Copy.AI, придумывают рекламный текст для социальных сетей. Третьи, например, Snazzy.ai, генерируют лендинги и веб-объявления. Принцип работы у всех приложений схож: пользователь задает несколько ключевых фраз, а на выходе получает готовое сообщение.

Но генерация текста на основе текстовых описаний — довольно очевидное применение GPT-3. Наверное, использовать эту нейросеть можно и не так прямолинейно? Да, можно. Вот несколько нестандартных примеров.

  • Веб-дизайн. Дизайнер Джордан Сингер научил алгоритм верстать макеты по описанию компонентов в Figma, популярном сервисе для разработки интерфейсов. 

  • Стартапы. Разработчик Питер Левелс сделал приложение IdeasAI, которое формулирует новые бизнес-идеи на основе разработки OpenAI и уже запущенных стартапов.

  • Онлайн-игры. Гейм-специалист Ник Уолтон создал текстовый квест AI Dungeon 2, где в роли гейм-мастера выступает GPT-3, а игровые команды и сюжеты ограничены только воображением. 

Забавных опытов тоже немало. Предприниматель Мануэль Араоз за пару часов работы с GPT-3 получил главу книги на испанском, интервью с самим собой об этой книге, собственную биографию, стихотворение, песню и генератор кулинарных рецептов.

Разработчик Вит Гордон пошел еще дальше — он провел собеседование с GPT-3 как с senior-программистом, и выяснил, что разработка вполне способна моделировать ответы на стандартные вопросы. Но и на этом не все.

  • Литература. Художник Аррам Сабети использовал умную модель для создания нуарного детектива про Гарри Поттера, стихотворения «Илон Маск доктора Сьюза» и рассказа о том, как Канье Уэст объявляет Диснейленд столицей США. 

  • Блогинг. Студент Лиам Порр попробовал вести блог о мотивации и продуктивности, все тексты в котором генерировал не кто иной как GPT-3. Из 26 000 читателей только один догадался, что тексты на самом деле писал не человек, а машина. 

  • Журналистика. Способности GPT-3 можно счесть пугающими: когда один из разработчиков попросил нейросеть написать текст о самой себе, она создала статью с громким названием «GPT-3 от OpenAI может стать величайшим открытием после Bitcoin». А еще сочинила для The Guardian эссе, почему людям не стоит бояться искусственного интеллекта.

Сторонники технологии даже создали отдельный сайт, на котором собраны примеры ее использования. Кстати, запущенные с помощью GPT-3 приложения отправляют наработки на облачные серверы OpenAI, делая алгоритм еще умнее.

 

Что нужно знать разработчику

Чтобы запустить подобные решения, наверняка нужны серьезные познания в программировании? Поскольку «Сбербанк» первый опубликовал русифицированную версию алгоритма, ruGPT-3, мы спросили его экспертов о том, как работать с этой технологией.

Татьяна Шаврина, лидер команды AGI NLP Сбербанка:

«Работа с уже обученными моделями проста — по сути, достаточно уметь скачивать и запускать готовое решение. Все предыдущие модели GPT требовали примерно таких же навыков: знание языка программирования Python, понимание смысла одной метрики качества (перплексии) — с этим справится Junior Data Scientist.

Сейчас многие школьники старших классов создают решения, для которых нужен уровень выше. А вот для реализации собственной задумки на основе моделей нужно чуть больше — нужна идея! Ну и, конечно, некоторые навыки прототипирования и немного данных для реализации этой самой идеи».

 

Чтобы привлечь внимание комьюнити к новому алгоритму и опробовать ее в разных форматах, сейчас проводится онлайн-соревнование AI 4 Humanities по прототипам коммерческих и социальных решений на базе ruGPT-3. Татьяна привела пример решения: модель научили писать связные школьные сочинения.

 

Заданная тема: В нынешние времена – все политика. (С. Кьеркегор)

Генерация ruGPT-3: «Обществоведение согласно С. Кьеркегору означает «науку о законах человеческого общежития». Политика — это «система власти», направленная на подавление и подчинение других обществ.В современном мире в политике участвуют множество стран и отдельных групп людей. В политической деятельности людей участвуют все — от президента до последнего рабочего и учителя.

Что же это такое — политическая деятельность? Оказывается, понятие политика не является полностью объективным. Оно включает в себя не только «превышение власти» над другими людьми, но и борьбу за власть. Даже простая житейская ситуация может служить примером политической борьбы. Вот как говорит об этом С. Кьеркегор: «Чтобы хорошо понять политику, надо самому подвергнуться избирательному давлению и найти способ противостоять ему». Вот поэтому до сих пор большинство политических деятелей, — это не самые лучшие люди.

Лучше всего о них написал И. Гончаров в рассказе «Крейцерова соната». Многие политики скрывают свои действительные политические взгляды. И то, что они говорят, — это лишь слухи, еще не подтвержденные фактами. В повести представлены люди разных убеждений и политических ориентаций. Например, один из главных героев, честолюбец и карьерист. Остальные просто делают свою карьеру, строят карьеру. С. Кьеркегор говорил о том, что большую роль в жизни играет случай, а не законы общественного развития». 

 

Также участники соревнования попробовали обучить ruGPT-3 реагировать на «программистские вопросы». Тема сложная, поэтому пока что алгоритм отвечает местами невпопад.

 

Вопрос: Как мне вывести список в обратном порядке в Python? Я новичок.

Ответ ruGPT-3: Простейший способ получить необходимый список: push.log(«Shalom»). 

Установка значения означает угрозу попыткой нажатий на какую-нибудь цифру справа, поэтому я действую наоборот. 

Изменение размера и числа означает перегрузку времени активации set.log()**) 

 rGet = puts.random(extents) 

 log.findIndex(puts.current)

void join($window, command=’unsetMainServer onManager’) } 

Нет ничего хуже, чем полный дебаггинг

 

Впрочем, другие эксперты предупреждают — для создания полноценного коммерческого приложения на основе GPT-3 может потребоваться больше опыта.

Екатерина Касилина, руководитель отдела анализа данных «Лиги Цифровой Экономики»:

«Для построения приложения на основе GPT-3 нужен опытный Data Scientist или ML-Engineer: чтобы нейросеть выдавала нужный результат, “выход” потребуется дополнительно обрабатывать. Также, скорее всего, необходимо будет “доучить” модель под конкретные задачи.

И конечно, для получения наилучшего результата на “вход” алгоритма должны подаваться корректно обработанные данные. Также надо понимать, что для русского языка результаты будут несколько хуже, чем для английского, потому что в обучении использовалось в разы меньше русских текстов, а сам “великий и могучий” сложнее по структуре».

 

Что нужно знать бизнесу

В недавней статье MIT Technology Review говорится, что алгоритм «не понимает мир, а значит, нельзя по-настоящему доверять тому, что он говорит». Он может утерять логику текста, забыть о его цели или вовсе перестать согласовывать между собой абзацы.

По мнению авторов, GPT-3 грамматически и семантически симулирует предложения, просто «предсказывая» продолжение. Вот почему, говорят эксперты, эта технология больше подходит для создания небольших текстов или частичной автоматизации человеческого труда. 

Татьяна Шаврина, лидер команды AGI NLP Сбербанка:

«Пока еще рано говорить о полной автоматизации человеческого труда, особенно творческого или завязанного на сложные бизнес-процессы. Внесение новых правок от заказчика “сломает” любую нейросеть. А если серьезно, то такие решения уже в ближайшее время смогут использоваться в областях с долгим прототипированием: например, модель сгенерирует несколько десятков вариантов дизайна сайта по ТЗ для первичной оценки, а заказчик уже выберет один и дальше “доведет до готовности” человеческими руками.

 В перспективе предобученные модели значительно ускорят процесс работы и улучшат качество уже существующих решений автоматизации колл-центров, чат-ботов и виртуальных ассистентов. Они помогут даже бизнесу с очень небольшими накопленными данными: если нейросети дадут изучить только 100 примеров работы с клиентскими обращениями, она все равно хорошо воспроизведет работу менеджера-человека».

 

Чтобы точно понять, какие силы потребуются для использования обученных моделей в бизнесе, редакция обратилась с вопросами к представителям ИТ-компаний. 

Екатерина Касилина, руководитель отдела анализа данных «Лиги Цифровой Экономики»

«В использовании GPT-3 заинтересованы многие компании, но не все понимают, что для качественного результата придется потратить время и средства. Прежде всего, неожиданностью стало то, что в октябре OpenAI сделала свою технологию платной. Также создатели следят за этичностью использования технологии, поэтому запросы компаний, видимо, каким-то образом анализируются».

Ярослав Шмулев, руководитель группы машинного обучения «Инфосистемы Джет»:

«Для начала работы, то есть для развертывания модели и настройки веб-интерфейса компании точно понадобится DevOps-программист. А вот для поддержки классический Data Scientist уже не нужен, так как бизнес использует уже готовые обученные модели. Так что, если инфраструктура уже развернута, для поддержки такой системы достаточно будет обычного штатного ИТ-специалиста.

Специальные навыки для работы с настроенной моделью тоже не требуются. Однако если мы говорим об адаптации модели к какой-то специфической предметной области, то есть обучению GPT-3 особой терминологии, языку или стилю музыки, то придется прибегнуть к помощи эксперта в области Data Science — он поможет обучить и настроить модель под специфику бизнеса».

 

Один из сооснователей OpenAI как-то написал, что у системы «есть серьезные недостатки и иногда она делает глупые ошибки». По его мнению, искусственный интеллект изменит мир, но GPT-3 — это «лишь очень ранний проблеск». Поэтому пока что даже самая развитая нейросеть становится прикладной только в руках талантливого человека-оператора, обладающего специальными знаниями.

Фото на обложке: Unsplash

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Источник: https://rb.ru/

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *