«Умный» поиск
Самый популярный в мире поисковик Google оснащен ИИ. Текстовые и голосовые запросы и изображения обрабатывает умная самообучающаяся система – с 2015 года, когда был запущен RankBrain[23 - Search Engine Land, FAQ: All about the Google RankBrain algorithm: https://searchengineland.com/faq-all-about-the-new-google-rankbrainalgorithm-234440 (https://searchengineland.com/faq-all-about-the-new-google-rankbrainalgorithm-234440)].
Текстовый и голосовой поиск основан на обработке естественного языка: алгоритмы оценивают слова в контексте, а не по отдельности. Это семантический анализ.
В поиске по картинкам компьютерное зрение распознает и классифицирует данные об изображении, чтобы пользователи могли найти его текстовым или голосовым поиском. Алгоритмы глубокого обучения постоянно совершенствуются в том, чтобы распознавать и классифицировать отдельные элементы изображения. Чем больше учебных картинок обрабатывает машина, тем лучше понимает, что на них представлено.
Когда ИИ Google проанализировал запрос и предположил, что вам нужно, он сразу обращается к каталогу онлайн-контента: веб-страниц, изображений, видео и документов. Они уже обработаны системой машинного обучения.
Системы учатся сортировать, ранжировать и фильтровать контент каталога. Каждая единица контента оценивается по количеству ссылок на нее, точности содержащейся в ней информации. Также ИИ проверяет, не спам ли это или реклама и не нарушает ли контент закон или авторские права.
Обычный поиск Google – это множество сложных, мгновенно выполняемых вычислений ИИ. Системы, способные ежедневно осуществлять миллиарды вычислений, вознесли Alphabet и Google на вершину и принесли невероятную прибыль.
Google использует ИИ для других целей, например чтобы обеспечить безопасность аккаунтов Gmail и сервиса контекстной рекламы, которую показывают только потенциально заинтересованным пользователям.
Персональный помощник на базе ИИ
Персональный помощник с голосовым управлением на основе ИИ появился несколько лет назад. Сегодня всем известны Google Home, Amazon Alexa и Apple Siri.
Поначалу обработка естественного языка в пользовательских устройствах впечатляла, особенно по сравнению с недавним прошлым, но обнаружились ее ограничения. ИИ хорошо понимает только элементарные и короткие предложения и команды. Попробуйте поговорить с ним, как с обычным человеком, – и он сразу запутается.
По человеческим меркам нынешний ИИ – младенец. А если говорить на языке науки, ему не хватает данных. Но он быстро растет, например благодаря технологии Google Duplex. Она поддержит и довольно неформальную беседу, потому что обучена для конкретных ситуаций, и алгоритмы собирают только касающиеся этих событий данные. Google демонстрирует прогресс Duplex на примере записи в парикмахерскую по телефону[24 - Google, Google Duplex: An AI System for Accomplishing Real-World Tasks Over the Phone: https://ai.googleblog.com/2018/05/duplex-aisystem-for-natural-conversation.html (https://ai.googleblog.com/2018/05/duplex-aisystem-for-natural-conversation.html)]. В таких узких и контролируемых случаях технология ведет себя почти по-человечески. Для этого инженеры Google запрограммировали свойственные нашей речи междометия: машина вставляет в разговор «эм-м», «ах» и «угу», когда сочтет это уместным.
Языковой перевод
Компьютер можно научить говорить на одном языке, а любой другой он освоит сам с помощью машинного обучения. По этому принципу работает переводчик Google, раскладывая язык на основные составляющие. Глубокие нейронные сети Google Translate постоянно оттачивают алгоритмы, изучая новые языки, и так совершенствуются в точности переводов. Google внедрила эту функцию в наушники Pixel Buds на базе Google Assistant, и пользователи могут слушать трансляцию перевода почти в режиме реального времени[25 - The Verge, The Pixel Buds’ translation feature is coming to all headphones With Google Assistant: https://www.theverge.com/circuitbreaker/2018/10/15/17978298/pixel-buds-google-translate-google-assistantheadphones (https://www.theverge.com/circuitbreaker/2018/10/15/17978298/pixel-buds-google-translate-google-assistantheadphones)].
Беспилотные автомобили
У Waymo – подразделения Alphabet, которое разрабатывает беспилотные автомобили, – одна из самых развитых платформ в мире. Недавно компания стала первым коммерческим перевозчиком[26 - Financial Times, Alphabet’s Waymo begins charging passengers for self-driving cars: https://www.ft.com/content/7980e98e-d8b6-11e8-a854-33d6f82e62f8 (https://www.ft.com/content/7980e98e-d8b6-11e8-a854-33d6f82e62f8)].
Alphabet пошел еще дальше: автомобили полностью автоматизированы, в них даже нет руля и педалей. Они созданы для новой урбанистической эпохи, в которую быть владельцем автомобиля – дорого и неудобно. Сервис Waymo ориентирован на частный извоз: по прогнозам компании, такой формат будет основным в умных городах будущего.
Субтитры к миллионам видеозаписей
В машинном обучении Google использует алгоритмы естественного языка, когда автоматически записываются субтитры для слабослышащих (или предпочитающих тишину) людей на сервисе потокового видео YouTube. Как и с речью, для идентификации звуков (аплодисментов, музыки) система использует глубокие нейронные сети и автоматически выводит текст: он сообщает зрителю, что происходит[27 - Google, Adding Sound Effect Information to YouTube Captions: https://ai.googleblog.com/2017/03/adding-sound-effect-information-to.html (https://ai.googleblog.com/2017/03/adding-sound-effect-information-to.html)].
Диагностика заболеваний
Технология ИИ Alphabet (в частности на базе глубокого обучения) широко применяется в медицине. Из недавних новшеств стоит упомянуть офтальмологическую диагностику. Для обучения алгоритмов используются снимки оптической когерентной томографии – инфракрасные 3D-изображения глазного яблока[28 - Nature, Clinically applicable deep learning for diagnosis and referral in retinal disease: https://www.nature.com/articles/s41591-018-0107-6 (https://www.nature.com/articles/s41591-018-0107-6)]. Система основана на двух алгоритмах глубокого обучения. Один строит подробную схему устройства глаза и определяет, что нормально, а что может быть симптомом болезни, например возрастной макулодистрофии (истончение сетчатки глаза). Второй алгоритм анализирует медицинские показатели и выдает специалистам диагноз и схему лечения.
Google Brain
Исследовательское подразделение искусственного интеллекта Google называется Google Brain. Его основали в 2011 году Джефф Дин, Грег Коррадо и Эндрю Ын из Стэнфордского университета. Они стали пионерами практических технологий ИИ.
В Google Brain предположили, что обширные сверхбыстрые сети хранилища и огромный объем данных интернета, который проходит по их серверам, пригодятся для машинного и глубокого обучения. С тех пор команда разработала ключевые технологии, такие как компьютерное зрение и обработка естественного языка, и сделала ИИ востребованным в бизнесе[29 - Google, Using large-scale brain simulations for machine learning and A.I.: https://googleblog.blogspot.com/2012/06/using-large-scale-brainsimulations-for.html (https://googleblog.blogspot.com/2012/06/using-large-scale-brainsimulations-for.html)].
Deep Mind
Deep Mind – еще один знаковый для Alphabet термин, появившийся в 2014 году. Британский стартап специализировался на симуляторах нейронных сетей мозга и обучал их играть в игры. Исследователи Deep Mind наблюдали, как мозг решает когнитивные, то есть связанные с познанием, задачи во время игры, а данные использовали для обучения машин. Технология стала сенсацией в 2016 году, когда оснащенный ей компьютер победил профессионального игрока в го[30 - Wired, Google’s AI Wins First Historic Match: https://www.wired.com/2016/03/googles-ai-wins-first-game-historic-match-go-champion/ (https://www.wired.com/2016/03/googles-ai-wins-first-game-historic-match-go-champion/)].
Сегодня на Deep Mind работают интеллектуальные программы Alphabet. Они управляют охлаждающим оборудованием дата-центров, оптимизируют расход аккумулятора мобильных устройств на Android и т. д. А еще они участвуют в офтальмологической программе, о которой речь шла выше.
Самое главное
Alphabet и Google считают ИИ отправной точкой для революции компьютерных технологий.
• Компании уверены, что влияние следующей волны на общество будет еще более значительным, чем появление интернета.
• Большой объем данных позволил Alphabet разработать первые в своем роде услуги: поиск, показы рекламы, языковой перевод, обработку речи, «умные дома» и беспилотные автомобили.
• Благодаря инфраструктуре и вычислительной мощности для обработки большого объема данных на необходимой для поисковика супервысокой скорости Google применила все эти возможности к ИИ.
• Финансовые ресурсы Google позволили воспользоваться всеми качественно новыми разработками исследовательских групп и стартапов в сфере ИИ, такими как глубокое обучение.
3. Amazon. Глубокое обучение повышает показатели бизнеса
Основателю книжного интернет-магазина Amazon Джеффу Безосу было все равно, чем торговать: он хотел подняться на буме онлайн-продаж, который предвидел. Сегодня Amazon – международная торговая площадка и ведущий мировой провайдер облачных вычислений. Компания занимает третье место по выручке и рыночной капитализации. Помимо онлайн-магазина и предоставления облачных услуг компания владеет издательским подразделением, кино- и телевизионной студией и производит бытовые товары: электронные книги Kindle, планшетные компьютеры и медиаплееры Fire и умные колонки Amazon Echo.
С начала 1990-х Amazon использовала прогностическую аналитику. И внедряла ее везде – от знаменитого рекомендательного сервиса до оптимизации маршрута роботов в центрах исполнения заказов. В начале последнего десятилетия растущий потенциал машинного обучения заставил интернет-гиганта пересмотреть все аспекты деятельности. Безосу мало было обойти Walmart и Target на рынке продаж – он претендовал на уровень Google, Facebook и Apple и первое место в технологической сфере. Значит, надо было внедрять глубокое обучение в ключевые сервисы и расширять деятельность. Так появились умные колонки Echo с виртуальным помощником Alexa и бескассовые супермаркеты.
Среди дальнейших планов – доставка заказов автоматизированными дронами и «опережающая доставка» (до заказа) товаров, которые могут понравиться клиенту.
Как Amazon использует ИИ
Amazon первой внедрила рекомендательный сервис, то есть предложение товаров на основе предыдущих покупок. Это с самого начала было основой бизнес-стратегии компании. За годы аналитические инструменты усовершенствовались, но до сих пор делят пользователей на категории по собранным о них данным, моделируют поведение и предлагают товары, популярные у покупателей из той же категории.
В начале 2014 года компания запустила крупную модернизацию существующей рекомендательной системы: начала внедрять алгоритмы глубокого обучения в прогностические инструменты[31 - Wired, Inside Amazon’s Artificial Intelligence Flywheel: https://www.wired.com/story/amazon-artificial-intelligence-flywheel/ (https://www.wired.com/story/amazon-artificial-intelligence-flywheel/)]. Сейчас глубокое обучение встроено в большинство функций сайта, разработанных для персонификации покупательского опыта: «эти товары часто покупают вместе», «купившие этот товар также приобрели…» и т. д.
Глубинные слои нейронных сетей учатся так же, как человеческий мозг, – на данных, которые через них проходят. Алгоритмы постоянно совершенствуются в поиске паттернов и связанных данных – в случае Amazon это данные о транзакциях и покупательском поведении. На этих алгоритмах работают рекомендательный сервис Amazon, поиск Google, лента Facebook и подбор фильмов Netflix. Как и соперники в борьбе за первое место, Amazon делает ставки на глубокое обучение – двигатель революции ИИ.
Amazon использует ИИ в центрах исполнения заказов – на складах, где люди и роботы ежедневно собирают и упаковывают миллионы посылок. С виду складские роботы ничем не примечательны – это приземистые передвижные платформы[32 - Robots, Drive Unit: https://robots.ieee.org/robots/kiva/?utm_source=spectrum (https://robots.ieee.org/robots/kiva/?utm_source%3dspectrum)]. Но благодаря алгоритмам глубокого обучения они шустро снуют по складским лабиринтам, находят на полках нужный товар и привозят сотруднику, который комплектует заказ. Робот способен действовать в условиях, неудобных для человека, поэтому Amazon расширяет складские площади и ускоряет выполнение заказов, а значит, растет и доход. В настоящее время в центрах исполнения заказов Amazon по всему миру используются сотни тысяч роботов[33 - IEEE Spectrum, Brad Porter, VP of Robotics at Amazon, on Warehouse Automation, Machine Learning, and His First Robot: https://spectrum.ieee.org/automaton/robotics/industrial-robots/interview-brad-portervp-of-robotics-at-amazon (https://spectrum.ieee.org/automaton/robotics/industrial-robots/interview-brad-portervp-of-robotics-at-amazon)].
Amazon Alexa
Уже не верится, что персональный домашний ИИ-ассистент в 2015 году казался чудом. К 2018 году он был в 16 % семей в США. Технология совершенствуется, реклама не отстает – и «электронного помощника» покупают все чаще[34 - Tech Crunch, 39 million Americans now own a smart speaker, report claims: https://techcrunch.com/2018/01/12/39-million-americans-now-own-a-smart-speaker-report-claims/ (https://techcrunch.com/2018/01/12/39-million-americans-now-own-a-smart-speaker-report-claims/)].
Шагом вперед стало понимание, что реализацию домашних ИИ-устройств ограничивает не технология – она была уже достаточно развитой для выполнения такого рода задач. Проблема состояла в интерфейсе: смартфон – удобная вещь, но не так просто устроенная, как выключатель, чайник, радио или поваренная книга.
C Echo появилось голосовое управление умными устройствами: не отрываясь от уборки, можно найти нужную информацию или включить музыку.
Ассистент интерпретирует голосовые команды с высокой точностью. Этим он обязан алгоритмам глубокого обучения[35 - Quora, How does Amazon use Deep Learning?: https://www.quora.com/How-does-Amazon-use-Deep-Learning (https://www.quora.com/How-does-Amazon-use-Deep-Learning)]. Нейронные сети реагируют на заданное пользователем «пробуждающее слово» – сигнал слушать и анализировать команду. С опытом ассистент все лучше понимает нюансы разговорной речи. Глубокие нейронные сети учатся говорить, как мы, обрабатывая голосовые данные.
Интеллектуальный «маховик» Amazon
Модель распространения ИИ во все сферы деятельности в Amazon назвали «маховиком»[36 - Wired, Inside Amazon’s Artificial Intelligence Flywheel: https://www.wired.com/story/amazon-artificial-intelligence-flywheel/ (https://www.wired.com/story/amazon-artificial-intelligence-flywheel/)]. Вообще, это механическое устройство, которое накапливает поступающую от генератора кинетическую энергию и регулирует степень ее высвобождения. А в случае Amazon избыточная «энергия», сгенерированная успешным внедрением ИИ в одну сферу деятельности, идет на исследования и инвестиции в другую.
Таким образом создается благоприятная среда обмена данными и технологиями между отделами и подразделениями. Лучшие практические наработки передаются из рук в руки. К примеру, повышение точности рекомендательного сервиса с помощью глубокого обучения пригодилось в распознавании речи Echo.