Лекция директора по маркетингу сервисов «Яндекса» Андрея Себранта об отраслях, которые обречены на забвение в ближайшем будущем.
Сотрудникам технологических компаний — «Яндекса», Mail.Ru Group, Parallels, IBM — легко говорить о будущем. Ведь такие гиганты во многом сами его формируют.
При подготовке к этой лекции мне на глаза попалась обложка августовского номера журнала The Economist с изображением изношенного двигателя внутреннего сгорания. Оказалось, сейчас в мире происходит перестройка автомобильной промышленности и всего, что с ней связано.
Где двигатели внутреннего сгорания, там и топливо. А это интереснейшая отрасль нефтехимии и одновременно огромная инфраструктура, выросшая вокруг неё. На протяжении как минимум последнего столетия всё, что связано с двигателями внутреннего сгорания, было воплощением смелых инженерных идей. Теперь вся эта новизна постепенно исчезает. Выпуск двигателей внутреннего сгорания прекратится к 2050 году. Это значит, что и наука, и инфраструктура обслуживания должны будут перестроиться.
Многие ещё мечтают о том, как будут проектировать огромные двигатели для гоночных машин. Вузы готовят инженеров, наука улучшает технологии. Все они работают на обреченную отрасль.
Так происходит не впервые. На рубеже 20 и 21 веков то же самое случилось с наукой и технологиями обработки фото- и кинопленок. В начале 21 века на Kodak — крупнейшую мировую корпорацию — работали целые научные центры, не говоря уже про соответствующие кафедры и вузы. Однако это не помешало компании обанкротиться.
И так не только с двигателями. За пять минут я набросал список из шести отраслей, которые полностью изменятся в ближайшие 15-20 лет. Это лишь то, что сразу приходит в голову.
Я очень люблю рассуждать о технологиях машинного интеллекта. События 2017 года показывают, насколько быстро, радикально и неожиданно всё меняется. В человеческом сознании стала резко смещаться граница между человеческими и машинными способностями.
Начнём с вполне физических возможностей человека. Когда-то умение донести весть, пробежав марафонскую дистанцию в 42 километра, было важно потому, что другого способа передавать информацию не было.
Сейчас бег уже не служит таким решением. Однако марафонами увлекаются столько людей, сколько не увлекалось даже в Древней Греции. Мы не перестали бегать, хотя теперь в этом нет никакой практической необходимости. Изменилась мотивация.
Это справедливо и для других областей человеческой деятельности. Первыми под удар попали шахматы. На сайте Electronic Frontier Foundation есть интересный материал о том, как в разных областях машины отвоёвывали позиции у человека.
В середине 20 века возникла идея о том, что машина может неплохо имитировать человеческий интеллект, тогда же начали появляться программы для игры в шахматы. С 1980-х годов их уровень повышался, но до чемпионов мира им было далеко.
Потом появился суперкомпьютер Deep Blue, который в 1997 году обыграл Гарри Каспарова. На этом прогресс не остановился. В какой-то момент оказалось, что машины играют в шахматы на недостижимом для человека уровне. Однако чемпионаты мира по шахматам продолжили существовать.
Мы не соревнуемся с рациями в скорости доставки информации на 42 километра. Спортсмены бегают на марафонскую дистанцию потому, что им интересно соревноваться друг с другом. И в шахматах появились две лиги: машины играют с машинами, а люди — друг с другом, будто забыв о том, что никто из них никогда не обыграет программу.
Победа машины над человеком в шахматах, конечно, стала событием, но не таким большим, как когда компьютер начал хорошо играть в го. Шахматы — игра, просчитываемая до конца, в ней не так много позиций, а стратегии известны. До 1990-х годов компьютеры не выигрывали у человека только потому, что им не хватало вычислительных мощностей.
Технологический прогресс привёл к тому, что на рубеже веков стало возможным просчитать оптимальную партию. С этого момента выиграть у машины нельзя: она может просчитать столько ходов, сколько не просчитает ни один шахматист. Человеческая интуиция обесценилась, ведь по ту сторону доски — заведомо оптимальные решения. Это называется «брутфорс» — перебор всех вариантов, для которого достаточно вычислительных мощностей.
Когда машины начали хорошо играть в шахматы, для специалистов в машинном интеллекте возник следующий предел — игра в го. В го количество возможных ходов на много порядков превышает число атомов во Вселенной. Невозможно просчитать эту игру методом брутфорса.
Не существует учебников по игре в го. В неё нужно погружаться. Как человек постепенно начинает чувствовать прелесть сложной классической музыки, так и игрок в го чувствует гармонию позиций, правильность следующего хода, непредсказуемость хода противника. Это выражается не в количественных формулировках, а в таких категориях, которые, казалось, невозможно объяснить машине.
В 2014 году эксперт пишет: прогноз о том, что через десять лет машина победит человека в го, кажется оптимистичным. Сами игроки считают, что это не машинная задача. При этом в начале 2014 года британская компания Deep Mind, купленная Google, начала работу над проектом AlphaGo. Пока эксперт предсказывал будущее, они его строили.
В 2015 году, когда AlphaGo уже на равных играл с европейскими чемпионами, другой эксперт написал, что игра в го по-прежнему не поддаётся компьютерам, ведь в ней нужна интуиция и другие исключительно человеческие качества.
Через несколько месяцев после этого, в начале 2016 года, прошёл матч между AlphaGo и профессиональным игроком в го Ли Седолем. В матче из пяти партий Седоль выиграл одну, AlphaGo — четыре. После этого Всемирная федерация го решила запретить использование смартфонов на чемпионатах по го.
Одновременно появилось огромное количество статей и заявлений о том, что Ли Седоль выиграл одну партию в условиях стресса, поэтому у человечества остаётся надежда. В конце 2017 года в Москве пройдет фестиваль научно-популярного кино «360», его проводит Политехнический музей. В рамках программы будет представлен документальный фильм под названием AlphaGo.
Я смотрел его и остался недоволен. Это фильм про то, как Ли Седоль отстаивает честь человечества в го, а создатели AlphaGo выглядят как толпа программистов, тычущих пальцами в экран. Уверен, со стороны команды AlphaGo было вложено не меньше умственных усилий, чем со стороны Ли Седоля.
После Седоля китаец Ки Цзе, признанный лучшим в мире игроком в го, пообещал победить AlphaGo. Сыграв в мае 2017 года одну партию, он проиграл всухую.
Надо понимать, что алгоритмы, которые обыгрывают человека в го, учатся, играя сами с собой. Они не знают никаких стратегий, в них не заложено ничего, кроме формальных правил игры. Они играют сами с собой и поэтому совершенствуются непрерывно. Они набирают такой опыт, который никогда не получит ни один человек.
После победы над Ли Седолем AlphaGo играла с Ки Цзе, но также сыграла ещё несколько миллионов партий сама с собой. Ки Цзе просто не осознавал, что у него нет шансов. После победы программы над Цзе создатели AlphaGo объявили, что закрывают проект, потому что дальше уже неинтересно. Они опубликовали лучшие партии из сыгранных AlphaGo с самой собой, чтобы все могли увидеть игру нечеловеческого уровня. Пара моих знакомых фанатов го говорят, что это действительно нечто невозможное.
После этого игроки и учёные заговорили про покер — это ещё одна игра, которая считается недоступной машинам, потому что там надо хитрить и жульничать. Итог понятен. Машине не показывали лучшие партии в покер, а просто дали правила и сказали: «Поиграй сама с собой, а потом — с лучшими игроками мира».
В августе 2017 года бот — то есть очередная программа с машинным интеллектом — обыграл живого игрока в Dota 2. Многие говорили, что он победил, потому что игра была один на один. Dota — это командная игра. Считается, что машины никогда не победят команду людей. Возможно, но следующее, чему будет учиться команда ботов, — играть друг с другом, команда на команду.
Машины быстро вырабатывают качества, которые считаются исключительно человеческими: умение договариваться, полагаться на интуицию и прочие. «Вырабатывают» — это значит, что их никто не программирует. На этом моменте начинается непонимание.
В «Яндексе» мы решили пойти другим путем и не экспериментировать с играми. Мы посмотрели, могут ли современные способы машинного обучения решать творческие задачи, которые считаются сугубо человеческой прерогативой. Оказалось, что могут.
Создание музыки при помощи алгоритмов
Самое ценное для меня в этом ролике — мнение Маши Черновой. Легко написать нейронной сеткой то, что понравится нам самим. Но что скажут эксперты? Примут за своего или нет? Приняли. Конечно, есть и другая точка зрения. Есть люди, которые по-прежнему говорят: нет, я чувствую, что это писал не человек. Возможно.
Мы убедились, что во всяком случае у нас есть шанс на интересное творческое партнёрство. Можно прийти в музей Скрябина с композицией, написанной нейросетью под руководством Вани (Иван Ямщиков, консультант «Яндекса» — vc.ru) и Леши (Алексей Тихонов, ведущий аналитик «Яндекс.Дзена» — vc.ru), а сотрудники музея найдут композиторов, пригласят Петра Термена — правнука Льва Термена, создателя терменвокса.
Все они очень вдохновлены и ради выступления на конференции «Яндекса» собираются, репетируют и играют эту музыку. Это хорошая иллюстрация того, как люди и машины работают вместе, решая творческую задачу.
В процессе работы Ивану и Алексею пришлось написать научную статью, в которой они описали изобретённый ими автоматический механизм преобразования. Во введении к этой работе есть любопытная фраза о том, что задачи, которые считались сугубо человеческими из-за интуитивной или творческой направленности, становятся доступны алгоритмическим решениям. Музыка — лишь один пример из множества.
Креативный или интуитивный характер задач — это не только музыка, это огромное количество других отраслей: и классическое творчество, и хороший бизнес, и честный маркетинг.
Почему история про самообучение машин так пугает людей? Им нужно привыкать жить с мыслью, что компьютер — это не просто программируемый механизм, которому нужно задавать пошаговую инструкцию.
Поворот мышления происходит тогда, когда становится понятно, что с машиной можно взаимодействовать по-другому. Хорошо, пожалуй, не с машиной, но с программистом. Не — «У меня есть последовательность действий, зашифруй её», а — «У меня есть задача, пусть машина сама научится её решать, хотя я понятия не имею, как это делать».
Однако тут необходимы данные для обучения. Наверное, наиболее классический, кочующий из одной научно-популярной статьи в другую, пример — это коты и собаки.
Вам сложно ответить, где изображен кот, а где собака? Наверняка нет. Кто может описать, как он пришёл к этому решению?
Зритель: У пса длинный нос, у кота нос плоский. У кота есть усы…
Андрей Себрант: Давайте начнём с носа. А если это мопс? Он сразу кот?
Зритель: Нет.
АС: Усы. У моих друзей ребенок побрил кота, сбрил ему усы. Перестал ли кот при этом быть котом?
Зритель: Наверное, дело в форме носа? У кота он треугольный, у собаки — круглый или прямоугольный. Ещё есть разница в форме зрачка.
АС: Так, фраза про форму зрачка мне нравится. Представьте, что вы должны объяснить это программисту. Как он должен рассказать программе, что такое зрачок?
Голос из зала: Надо загрузить учебник биологии.
АС: Загрузить учебник биологии, выделить круглые объекты. Вы действительно проделали эти действия, когда взглянули на картинку?
Зритель: Мы же учились…
АС: Учились. Это ключевое слово. Когда вы были детьми, родители не рассказывали вам про форму носа у кота и собаки. Они говорили: «Вот это собачка, а это кошечка». В итоге вы можете их различать.
Ниже ещё один график с сайта Electronic Frontier Foundation. Он показывает долю ошибок при работе программы с огромной базой изображений. Компьютер должен был определить, что изображено на картинке. Ещё не так давно, в 2011 году, программа ошибалась в 25% случаев. Судя по этим данным, в 5% случаев человек всегда врёт. А к 2017 году погрешность компьютера даже ниже.
Как удалось этого добиться? Программе показали миллион котов и миллион собак с соответствующими тегами «кот» или «собака». Это классический вариант обучения с подкреплением: программа что-то отвечает, правильность её ответа подтверждается, в следующий раз она ошибается, за этим следует реакция: «Неверно». После некоторого количества повторений компьютер перестает ошибаться.
Как ребенок учит новый язык, когда его перевозят в другую страну? Его не заставляют оканчивать филологический факультет или изучать теорию времён и падежей. Он начинает беседовать со сверстниками и через некоторое время говорит лучше, чем человек, прошедший систему традиционного образования.
Почему мы считаем, что машина должна сначала усвоить все правила? Современную программу можно заставить работать по тем же механизмам, что и ребёнок, который погружается в новую языковую среду. Этот подход используется во всех современных системах машинного перевода. Они всё время улучшаются — но не потому, что для них дописывают теорию, а за счёт постоянного обучения.
Я предполагаю, почему многие не верят в способность машины обучаться так, как учится ребенок. В нас встроен антропоцентризм. Мы — высшая ступень эволюции, а машины ниже нас, они не могут превосходить нас интеллектуально, ведь именно мозг делает нас особенными.
Но почему? Кто сказал, что мы венец творения? Может быть, мы промежуточная стадия для создания машинного сверхинтеллекта? В ответ я слышу те же аргументы, которые до Галилея люди приводили в защиту геоцентрической схемы.
Видно, что Солнце встаёт и ходит по небу, видно, что есть неподвижные звезды, видно, что планеты движутся сложным образом. Эта модель держалась веками и считалась глубоко научной, ведь этому учил весь человеческий опыт. Видимо, с антропоцентризмом дело обстоит примерно так же.
Это становится причиной появления странных суждений, в том числе и в бизнес-сфере. Классическое представление о взаимодействии человека и машины в информационном обществе — это телепорт в фильме «Особое мнение». Ты передвигаешь пальцами элементы интерфейса — и всё меняется.
В кино это выглядит так, а в жизни — совсем по-другому. На этой картинке исследователь данных говорит: «После внимательного рассмотрения всех этих 437 графиков, таблиц и метрик я решил сдаться, пойти за выпивкой и хорошенько напиться. Кто со мной?» Абсолютно адекватное описание реальности.
Это следствие убеждения о том, что данные непременно должны быть преобразованы в читаемый человеком вид, чтобы у него в голове возникали инсайты и варианты решений. Так построено современное производство.
Считается, что в информационном обществе идеал структурного производства выглядит следующим образом. Есть внешний мир — люди, заводы, «умные» дома, — который создаёт огромное количество данных. «Умные» алгоритмы преобразуют эту информацию в человекочитаемый вид.
Дальше человек принимает решение. Другой человек, программист, воплощает его в цифровой форме, которая что-то меняет в этом мире: встраивается в производственный цикл, перераспределяет потоки продуктов в магазины, настраивает температуру дома.
Когда есть повторяющиеся и слегка изменяемые ситуации, алгоритм, обучающийся на исторических данных, работает лучше. В условиях растущего количества производств человек оказывается лишним, ведь он ошибается чаще.
При этом возможность внедрить в схему «умную» машину становится доступна всем, поскольку произошла революция, которую никто не заметил, — революция открытых источников. Алгоритм, который умеет учиться, ещё десятилетие назад считался бы главным коммерческим секретом компании, а теперь его публикуют в открытом доступе.
Google предоставила всем доступ к TensorFlow — алгоритму обучения при помощи глубоких нейронных сетей. В июле «Яндекс» опубликовал свой CatBoost — алгоритм, использующий градиентные ускорения и эффективно работающий на промышленных задачах.
Для того, чтобы начать пользоваться этими технологиями, нужен всего один программист среднего класса вместо команды компьютерных гениев. Microsoft описывает это термином «демократизация технологий».
Компания McKinsey, которая занимается промышленным консалтингом, опубликовала текст, в котором употребила фразу со свойственной американской политкорректностью: «Использование человека в цикле принятия решений становится непрактичным».
Поначалу надо мной смеялись, теперь смеются меньше. Если человек приходит учиться и говорит: «Покажите мне алгоритм, по которому надо работать», то он обречен. Алгоритму проще обучить любую машину.
Примеры
В выплавке современной стали всегда немного меняется сырье. Сталеплавильное производство получает металлический лом, который сегодня привезли из города, где сломали чугунную ограду, а завтра — с какой-нибудь автомобильной свалки. Это разный по составу металл, поэтому всякий раз нужно вводить добавки, чтобы сталь соответствовала требованиям.
Для этого технологи, знающие теорию металлургического производства и имеющие профессиональное чутьё, каждый раз подбирают новый режим. Но поскольку эти производства хорошо автоматизированы, на них ведётся запись сырья, технологических решений, результатов.
Если использовать эти данные для обучения программы, можно снизить расходы эффективнее, чем это сделает самый опытный и одаренный технолог.
Есть и другой пример. Модератор — человеческая роль. Клиент в этом случае — престижная сеть знакомств. Предположим, у неё есть огромный штат индусов, которые должны модерировать аватары пользователей так, чтобы там не было неприличного контента и изображений знаменитостей.
Если обучить индусов искать порнографию как-то удалось, то заставить их знать всех знаменитостей — никак. Они часто ошибались. Для нейросети это простая задача. Индусов освободили. Время модерации резко сократилось, а качество — повысилось. Увеличились и пользовательские оценки. Но индусы остались без работы.
Не так давно в США для диагностики нескольких типов рака кожи разрешили применять хорошо обученную нейронную сеть. Она ошибается реже, чем самые опытные дерматологи. На анализе изображений основано 90% медицинской диагностики, будь то рентгенограмма, УЗИ или что-то ещё.
Программу можно обучить распознавать невероятное количество визуальной информации. И она начнёт видеть то, что врач упускает. Однако люди привыкли слышать свой диагноз от врача, поэтому у многих возникает психологическая реакция отторжения на сотрудничество специалиста с машиной.
В 2016 году ещё невозможно было привести этот пример. Albert — маркетинговая платформа полного цикла. Она осуществляет практически все операции. Многие фирмы заявляют, что пользуются технологиями искусственного интеллекта, но Cosabella — компания-производитель нижнего белья — расформировала свой отдел маркетинга и полностью доверилась системе Albert.
В Cosabella говорят, что нужно отличать компании, в которых технологии искусственного интеллекта лишь приводят к инсайтам, от компаний, где все маркетинговые решения принимает нейросеть.
Есть очень много видов деятельности, которые может выполнять нейросеть. К примеру, сортировка мусора: его дорого перерабатывать, экономика не замыкается, нужны субсидии. Проблема в том, что мусор всегда немного разный, а чтобы его эффективно переработать, он должен обладать фиксированными характеристиками.
Это как с металлургией, где всё время немножко разный лом. Обученная программа позволяет сделать переработку мусора экономически выгодной. Это неплохое решение глобальной задачи.
Вопрос, который всегда задают на лекции о машинном интеллекте: мы вместе с технологиями или они вместо нас? Когда как. В случае с рутинными профессиями — технолог, ассистент врача, маркетолог — компьютеры способны замещать людей. Однако иногда они работают вместе: вместе с группой музыкантов, сыгравших на открытии конференции «Яндекса», вместе с врачом для постановки максимально точных диагнозов пациентам.
Я сформулировал четыре правила для каждого человека после 2020 года. Самое главное, как мне кажется, первое. Об этом ещё говорил Дмитрий Песков из Агентства стратегических инициатив.
У меня часто спрашивают, чему учить ребёнка. Ответ: учите учиться. Самые интересные профессии ещё не появились, и пока ими невозможно овладеть. Но вскоре они появятся. Десять лет назад не существовало профессии оператора беспилотника, а сейчас это интересная и популярная работа в самых разных сферах — от кинематографа до военных действий.
Напоследок я хотел бы порекомендовать две книги. Одна из них переведена на русский язык — это «Неизбежно» Кевина Келли. Вторая — Machine Platform Crowd пока вышла только на английском. Надеюсь, её когда-нибудь переведут. Первая книга больше про жизнь и про то, куда мы все идем. Вторая написана двумя экономистами. Она посвящена экономическому и коммерческому влиянию трёх основных трендов: машинное обучение, новые платформы и краудсорсинг в широком смысле этого слова. Именно эти три направления и изменят экономику в ближайшие несколько лет.