Стэнфордская команда привлекла внимание популярной технологической компании Google. Остальное всем известно. В 2010 году представители Google объявили, что в компании втайне разрабатывали и испытывали системы беспилотного управления автомобилями. Цель – сократить число аварий на дорогах вдвое. Главой проекта, который впоследствии переименуют в Waymo, стал Себастьян Трун, руководитель Стэнфордской лаборатории искусственного интеллекта. Себастьян хотел вывести беспилотники на рынок к 2020 году.
В первый испытательный парк вошли шесть машин Toyota Prius и одна Audi TT. В машины были установлены датчики, камеры, лазеры, специальные радиолокационные GPS-технологии. Автомобили могли взаимодействовать со средой, а не просто ехать по намеченному маршруту. Система отслеживала опасности и распознавала объекты (пешеходов, велосипедистов и другие машины) на расстоянии нескольких сотен метров. Водитель-испытатель все время находился в автомобиле, чтобы при необходимости взять управление на себя.
Исследования Google породили всплеск интереса к теме. Именитые компании увеличили инвестиции в технологическую и автомобильную отрасли, а вместе с тем возросло и число стартапов. По данным Брукингского института, американского аналитического центра, на разработку беспилотных автомобилей в период с 2014 по 2017 год было потрачено 80 миллиардов долларов. Возможно, это станет крупнейшей ошибкой капиталистов, по сравнению с которой финансовый пузырь «Компании Южных морей», тюльпанная лихорадка и ипотечный кризис в США покажутся довольно разумными.
Как обычно, оценки того, когда автомобили станут полностью автономными, оказались слишком амбициозными. Можно разобраться в причинах такого расхождения с реальностью, если посмотреть, как должны работать эти чудеса техники.
Чувство дороги
Дивный новый мир поистине умных машин требует разнообразных приборов, с помощью которых автомобиль пытается получить точное представление об окружающей обстановке.
Самыми дорогими и эффектными датчиками, которые производят специально для беспилотных машин, являются лидары (от англ. LiDAR, Light Detection and Ranging — обнаружение и определение дальности с помощью света). Обычно их устанавливают на крыше. Эти системы посылают невидимые лазерные лучи малой мощности, которые, отражаясь от объектов, позволяют создать подробную и точную трехмерную карту окрестностей. Поле обзора может достигать 360 градусов. За счет мощных лазеров лидары пригодны для использования при любом освещении.
Ученые измеряют расстояние с помощью лазеров еще с 1960-х годов. Тогда группа ученых из Массачусетского технологического института (МТИ) вычислила точное расстояние до Луны, измерив время, за которое свет долетает туда и обратно. В автомобилях лазеры впервые установили в 2007 году в ходе эксперимента компании Velodyne, производившей звуковое оборудование. Пять машин, на которые установили принципиально новые датчики, удачно справились с ориентированием в смоделированных условиях города.
В 2016 году лидар стоил около 75 000 долларов на автомобиль. К 2019 году его цена упала до 7500 долларов за флагманскую модель. Но стоимость должна стать еще ниже. В компании Ford рассчитывают, что лидар будет стоить приблизительно 500 долларов. Сейчас на большинстве автомобилей установлен один лидар, который создает панораму в 360 градусов или поворачивая всю систему лазеров, или быстро вращая зеркала. Многие исследователи считают, что главное условие для снижения стоимости – создание твердотельных конструкций, где вращающиеся элементы сведены к минимуму или вовсе отсутствуют.
От зеркал получится отказаться, если заменить их на фазированные решетки, в которых используется ряд лазерных передатчиков. Когда все передатчики срабатывают одновременно, луч идет по прямой. Но если сместить фазы сигналов, то луч отклонится вправо или влево. Лидар на основе вспышки – другое возможное решение. По принципу действия он напоминает фотоаппарат. Устройство выпускает один луч, который рассеивается и подсвечивает сразу всю область.
Слежение за дорогой с помощью лазеров.
Лидары становятся меньше и дешевле.
Затем сеть из крошечных датчиков регистрирует свет, который возвращается с разных сторон. Лидары такого типа хороши, потому что моментально охватывают всю область, но в то же время из-за этого появляется шум и картина становится менее четкой.
Но это не единственная проблема. Когда на большинстве автомобилей будут установлены лидары, они начнут создавать помехи друг для друга. Обычно система запускает прямой лазерный луч и использует сверхточные часы. Если лазеры на других машинах будут действовать в той же области, это нарушит их нормальную работу. Скептики также беспокоятся о том, справится ли система с плохими погодными условиями. Наконец, чтобы не нанести вред зрению человека, используются лазеры относительно малой мощности. Дальность луча равна примерно 150 метрам. Для ускорения и лавирования в потоке автомобилей нужен луч длиной по крайней мере 300 метров. Производители лидаров работают над увеличением частоты лазерного излучения, за счет которого получится усилить мощность. Благодаря этому луч будет простираться дальше видимого диапазона спектра. Вероятно, при совершенствовании системы удастся справиться и с другими недостатками. Технология уже неплохо работает в снег и дождь, а еще показывает хорошие результаты в избегании помех.
Лидар помогает машине «видеть» на коротких расстояниях, но для длинных дистанций требуется другое решение. И здесь на первый план выходят радары. На многих новых автомобилях уже установлены радиолокационные датчики, которые используются для адаптивного круиз-контроля, контроля слепых зон и автоматической системы аварийного торможения. Их поле обзора составляет примерно 10 градусов, а стоимость относительно невысока – от 80 до 120 фунтов стерлингов за сенсор.
Главным преимуществом радаров традиционно считают способность воспринимать расстояние и скорость. Радар может измерить скорость на большом расстоянии. Это технология, которая отлично себя показала. Радар может распознать даже то, что находится за предметом. Его волны относительно длинные, поэтому появляются дифракция и отражение. За счет этих явлений можно «увидеть», что скрывается за другими объектами. На YouTube есть видео, снятое внутри движущейся машины, где показано, как информация с радиолокационного датчика приводит в действие систему автоматического экстренного торможения. Впереди не было ничего необычного, но через полсекунды машина перед нами врезалась в другую. Радар на нашем автомобиле смог распознать, что впереди резко затормозила вторая машина от нас. Благодаря этим данным сработали тормоза и аварию удалось предотвратить.
Основной недостаток радаров, из-за которого их необходимо дополнять другими датчиками, – это невозможность восприятия в деталях. Все кажется размытым. Радары не могут отличить пешехода от велосипедиста, хотя способны распознать, движутся эти люди или нет. Лидар в Waymo может не только отличить одного от другого, но и указать, в какую сторону они направляются. Ультразвуковые датчики используются для определения позиции объектов, которые расположены близко к транспортному средству. Чаще всего они встречаются в виде датчиков парковки, издающих звуковые сигналы.
Их изобрели в 1970-е годы, а первой моделью машины массового производства, на которую их установили, стала Toyota Prius 2003 года. Такие датчики работают на расстоянии всего метров 10, но при этом они отличаются низкой стоимостью и оказываются крайне полезны при маневрировании на низкой скорости или в плотном потоке.
Камеры с высоким разрешением – важный элемент оснащения беспилотного автомобиля. Они используются для распознавания светофоров, дорожной разметки, уличных знаков и других объектов, которые содержат зрительные ориентиры, но не более того. Камеры, в отличие от лидаров, различают цвета, а также разницу в текстуре. Если установить несколько камер, получится определить расстояние до предметов. Но чем дальше объект, тем менее точен расчет, поэтому для вождения на высокой скорости это не подходит. Стоимость камеры относительно невелика – 150 фунтов стерлингов на автомобиль, но стоит учитывать, что ее работа зависит от условий освещения и видимости. Инфракрасное излучение способно в какой-то степени решить эту проблему.
Можно подумать, что для передвижения крайне важно наличие GPS. Но эта система работает точно лишь на расстоянии нескольких метров и не всегда исправно: сигнал прерывается рядом с высокими зданиями и в тоннелях. Именно поэтому использование GPS в автономных автомобилях носит ограниченный характер. Однако в сочетании с другими датчиками она может быть полезной. В МТИ, к примеру, сконструировали беспилотный Prius, который неплохо ориентируется на дороге с помощью лишь GPS, лидара и акселерометров.
Мозг автомобиля
Конечно, все описанные датчики оказались бы бесполезны, не будь устройства, которое анализировало бы поступающую информацию. Для обработки огромного количества данных (причем быстрой) требуется очень мощный компьютер, по характеристикам заметно превосходящий тот, что стоит у вас дома. Даже современные автомобили вроде Waymo каждые полминуты генерируют информацию объемом до 150 гигабайт. Этого достаточно, чтобы заполнить жесткий диск большинства ноутбуков. В час производится 19 терабайт информации. Автомобили должны хранить эти огромные объемы данных на случай последующих рассмотрений из-за аварий или споров. Все это влияет на потребление энергии: прототип расходует 5000 ватт (примерно столько же требуется 40 обычным ПК). Такой уровень потребления заметно сокращает количество топлива или время работы батареи. Представьте, что для экономии заряда придется отключить автопилот и взять управление в свои руки, иначе до места назначения вы не доедете. Не очень-то похоже на прогресс.
Сейчас на разработку процессоров, которые соответствовали бы потребностям автономных машин, направлено много сил. В Google создали тензорные процессоры (Tensor Processing Units), которые предназначены специально для задач автопилота. В процессоре задействуется только та часть чипа, которая необходима для выполнения конкретной задачи. За счет этого увеличивается количество операций в секунду и уменьшается расход энергии. Тензорные процессоры подходят для машинного обучения разного рода, потому что могут одновременно выполнять множество задач по обработке, которым не требуется большая мощность.
Компания Nvidia, которая известна в первую очередь как производитель видеокарт для компьютеров, выпустила чип Xavier. Он способен выполнять 30 триллионов операций в секунду, что в 500 раз больше хорошего ноутбука, потребляя при этом всего 30 ватт. Эта разработка – удивительно мощное и эффективное устройство, которое представляет собой самую сложную систему на кристалле из когда-либо созданных. Она состоит из центрального процессора (8 ядер), графического процессора (512 ядер), ускорителей глубокого обучения и компьютерного зрения, а также процессора для обработки видео в разрешении 8K. «Мы перенесли суперкомпьютер из центра разработки данных в автомобиль», – заявил Дэнни Шапиро, который отвечает за развитие сегмента автомобильных систем в Nvidia. Но пройдет еще немало времени, прежде чем системы станут энергетически (и экономически) эффективными и выйдут в массовое производство. Кроме того, можно установить самый мощный компьютер в мире, но без правильного программного обеспечения он останется всего лишь дорогим черным ящиком.
Искусственный интеллект
Устройство приборов может показаться сложным, но программное обеспечение, которое сделает беспилотные автомобили привычным явлением, в сотни раз сложнее. Вероятно, на сегодня это самое серьезное испытание для искусственного интеллекта.
Идея заключается в том, что автомобиль получает крупицы информации со всех датчиков и объединяет их, чтобы определить, где он находится, что его окружает и как обстановка может измениться. На основе этого машина вырабатывает способ перемещения в пространстве. Все эти действия нужно выполнить за миллисекунды и не допустить ни единой ошибки.
В автомобилях используется глубокое обучение. Я чрезмерно упрощаю, но принцип действия технологии такой: бортовой компьютер превращает информацию с датчиков в огромную матрицу, которая содержит миллиарды битов данных в цифровой форме. Затем он ищет знакомые шаблоны в этой базе, чтобы выбрать правильный вариант поведения. Иногда это называют нейронной сетью. Когда шаблоны и необходимые варианты поведения определены, они переводятся в физическую форму: в действие приходят ускоритель, тормоза, руль или другие системы вроде фар и даже звукового сигнала.
Мощный интеллект
Автопилот будет не единственным проявлением интеллекта машин.
В автомобилях появится технология распознавания лиц, позаимствованная у смартфонов. С ее помощью можно будет открывать дверь и заводить машину. Еще одна функция прямиком из смартфона – голосовой помощник. Сири, Алекса и другие станут быстрее ставить музыку и точнее отвечать на неотложные вопросы. Владельцы электрокаров смогут выбирать звук, который издает их автомобиль (что-то вроде рингтона для машины). Компания BMW уже наняла Ханса Циммера, композитора фильма «Бегущий по лезвию 2049», чтобы тот написал приятную мелодию, которая предупреждала бы пешеходов о приближении практически беззвучной машины. Скоро автомобиль настолько поумнеет, что заменит курьера. Сервисы смогут открывать машину и оставлять там посылки (или даже чистую одежду из химчистки). Автопарковка появится гораздо раньше автопилота. Вызов машины за несколько метров с помощью приложения на смартфоне или параллельная парковка без помощи водителя быстро станет вчерашним днем. Вместо этого автомобиль сам заранее узнает о свободных местах и построит к ним маршрут для самостоятельной парковки. А после владелец сможет автоматически вызвать машину когда и куда угодно.
В автомобилях будущего будет решена проблема со звуком: в каждое кресло встроят устройства подавления шума и усиления голоса, что позволит спокойно общаться с попутчиками. Более того, салон машины станет просторнее и его можно будет изменять по своему вкусу, настраивая экраны, приборную панель и графику. Экраны дополненной реальности будут выводить подсказки GPS-навигатора и полезные указания прямо на лобовое стекло.
Если в двух словах, то автомобиль находит шаблон в базе данных и реагирует на него. Такую же технологию используют для прогнозирования многих ситуаций – от землетрясений до сердечных заболеваний. Со временем стало возможным анализировать результаты исследований на наличие раковых клеток, распознавать болезни глаз и повреждение мышц. Компьютер справляется с задачей быстрее и точнее врача. Эта же технология оказалась полезной при распознавании лиц (от этого в какой-то степени даже некомфортно). Были случаи, когда записывали биометрическую информацию посетителей концерта, решивших сделать фото в будке, или когда людей по ошибке задерживали за магазинное воровство просто из-за того, что их черты лица схожи с чертами преступников. Из-за этого распознавание лиц приобрело дурную славу. Эти ситуации показали, насколько глубокое обучение может не оправдать ожидания.
Распознавание шаблонов на дороге заметно сложнее, ведь нужно учитывать множество факторов в сжатые сроки. Разработка программного обеспечения, которое поможет реагировать на сигналы из окружающей среды, – крайне сложная задача. Наиболее очевидный способ научить автомобиль правильным действиям – так называемое поведенческое клонирование (источником информации выступает опытный водитель). На следующем этапе система практикуется и учится принимать решения самостоятельно, повышая свой уровень вождения. При этом процесс контролирует человек и вмешивается, если что-то идет не так (а это случается часто).
На базовом уровне система способна определить, что дорога свободна, на основе большого объема подобных фотографий. Сопоставив данные, система увеличивает скорость до предустановленного предела. Задача становится сложнее, если на дороге много легковых автомобилей, фур, пешеходов и велосипедистов, а в базе нет готовых действий для этой ситуации. Системе придется угадывать, как поведет себя каждый из участников движения, и реагировать соответственно.
Себастьян Трун считает точное восприятие наиболее сложным аспектом. Он отмечает, что в начале работы над проектом Google по разработке автономных автомобилей модуль восприятия не мог отличить пакет от сбитого ребенка. Как уже было сказано, прогресс есть. На конференции Google I/O в 2018 году беспилотник Waymo продемонстрировал взаимодействие с пешеходом, несшим доску размером с дверь, рабочим, наполовину вылезшим из люка, и даже людьми, одетыми в надувные костюмы динозавров. В каждом случае очертания пешеходов были неясны, но Waymo верно их распознавал.
Существуют проблемы и с системой глубокого обучения. По сути, каждая ситуация, с которой сталкивается система, должна быть ей знакома. В противном случае у нее нет варианта действий. Одна из проблем называется «переобучение». Система начинает устанавливать связь между показателями, которые друг к другу никак не относятся. Это все равно что пытаться угадать число, которое выпадет на кубике, основываясь на его цвете или времени суток. Программа искусственного интеллекта будет продолжать строить гипотезы по поводу выпадающих чисел на базе всех параметров, которые ей доступны.
Проблема усугубляется, когда рассматривается больше факторов. Представим, что я повернул налево. Система может решить, что я поступил так из-за велосипедиста в 200 метрах от меня. К тому же я уже несколько раз делал так в этом районе в это время суток. Я описываю очень схематично, но эти примеры позволят понять сложность обучения ИИ вождению, так как там множество переменных.
Недообучение – обратная проблема. Система ИИ не всегда улавливает нужные связи. К примеру, она может не распознать обочину дороги или не понять, пешеход перед ней или велосипедист, неверно истолковав данные с камеры и лидара. Обычно для борьбы с недообучением в систему загружают новые данные или больше практической информации о взаимосвязи между системой ИИ и реальным миром. В компаниях, занимающихся разработкой беспилотных автомобилей, тысячи сотрудников вручную снабжают изображения тегами с полезной информацией. Такое дополнение нейронных сетей фактическими данными позволяет устранить недообучение.
Другая проблема – обобщение. Если человек знает, как выглядят мышь и песчанка, то без труда скажет, что хомяк находится где-то между ними – еще один млекопитающий грызун. Искусственному интеллекту такая задача кажется сложной. Ему тяжело взять что-то знакомое и на основе этого создать нечто новое, которое при этом обладает смыслом. ИИ или вовсе не распознает новый объект, или выдает постоянно меняющиеся описания. Именно поэтому чат-боты пока плохо поддерживают беседу. Нет ощущения, будто они понимают хоть что-то. Чат-боты просто подбирают более-менее подходящую фразу из тех, что слышали прежде.
Искусственный интеллект в действии. Процессор Nvidia выделяет разноцветной обводкой и другими способами те объекты, которые удалось распознать: машины, пешеходов и велосипедистов.
Эксперты по ИИ считают программное обеспечение беспилотных автомобилей чем-то вроде черного ящика. Входные данные известны. Выходные – тоже. Но как система приходит от одного к другому, остается загадкой. Не вполне понятно, как работают алгоритмы или как «думает» машина. В компании Nvidia попытались визуализировать это с точки зрения автопилота. На изображении, полученном с датчиков автомобиля, они выделили объекты, которые влияют на принятие решений. Результаты обнадеживают: процессор фокусируется на контурах дороги, разметке и припаркованных автомобилях. На то же обращали бы внимание и обычные водители.
«Мы не обучали сеть обращать внимание на эти аспекты напрямую. В этом кардинальное отличие», – написал в блоге Урс Мюллер, главный архитектор ПО для беспилотных автомобилей в Nvidia.
Это не исчерпывающее объяснение принципов, по которым нейронная сеть принимает решения, но с чего-то нужно начинать. Мюллер замечает: «Я не могу объяснить все требования, которые предъявляю автомобилю, но могу показать их, а сеть продемонстрирует, что она усвоила». Некоторые убеждены, что пассажирам следует показывать визуализацию. Так они смогут понять, как думает машина, что повысит доверие к автопилоту.
В дополнение к нейронным сетям программное обеспечение беспилотных автомобилей включает в себя карту в высоком разрешении, которая постоянно обновляется по беспроводной сети. Это трехмерные карты, где информация отображается с точностью до сантиметра (к примеру, при передаче дорожной разметки). Они включают в себя множество слоев, в том числе сведения о ситуации на дороге в реальном времени (сигналы светофора) и «семантические» характеристики (дорожные знаки).
Основные игроки. Кто они?
Широкое распространение беспилотных автомобилей кажется очень близким, но в то же время недосягаемым. Совсем как ховерборд из «Назад в будущее» или устройство, похожее на вавилонскую рыбку из романов Дугласа Адамса, которая моментально переводила с одного языка на другой. В 2015 году Илон Маск поделился прогнозом, по которому Tesla начала бы продавать полностью автономные автомобили к 2018 году. Этого не произошло. Не исполнились и планы компании NuTonomy: руководство хотело запустить в Сингапуре сервис беспилотных такси к 2019 году. Сейчас проводятся эксперименты. General Motors обещала в 2019 году выпустить на рынок полностью автономный серийный автомобиль без руля. На момент написания книги он так и не появился.
В 2015 году Google основала родительскую компанию Alphabet и через год перевела Waymo под ее начало. Многие считают, что Waymo заметно опережает других производителей беспилотных автомобилей. Она выигрывает, к примеру, в вопросах расстояния, которое преодолевает машина без вмешательства водителя-испытателя, когда возникает угроза безопасности. Департамент Калифорнии по регистрации транспортных средств предоставляет наглядную статистику по сконцентрированности технологических компаний и экспериментов с беспилотниками именно в этом штате. В Waymo заявляют, что в среднем в 2018 году их автомобили самостоятельно проехали 17 000 километров по территории штата Калифорния без вмешательства водителя. Общий километраж всех машин достиг 16 миллионов, при этом более 1,5 миллионов километров пришлось на 2018 год.
Авторитетная исследовательская компания Navigant с 2015 года занимается аналитикой в этом секторе. Она учитывает 10 критериев: концепцию; стратегию выхода на рынок; партнеров; производственную стратегию; технологии; продажи; маркетинг и распространение; характеристики продукта; его качество и надежность; линейку продуктов и ее жизнеспособность. Специалисты Navigant
Вы ознакомились с фрагментом книги.
Приобретайте полный текст книги у нашего партнера: