Направления финансирования представлены на рисунке ниже.
Финансирование Федерального проекта «Искусственный интеллект» в 2021—2024 гг. составляет 31,5 млрд рублей, из которых 24,6 млрд рублей выделяется из федерального бюджета, а также привлечено из внебюджетных источников 6,9 млрд рублей.
Соответственно 5,7 млрд рублей выделялось на проведение именно того самого конкурса, в котором МГТУ им. Н. Э. Баумана должен был принять непосредственное участие, а я должен был организовать весь процесс, в том числе в части написания Программы и Плана мероприятий Центра.
Сложностей на пути к достижению поставленной передо мной цели оказалось не просто много, а очень много.
Одна из них, которая могла бы свести всю начатую работу к нулю, заключалась в поиске индустриального партнера и инвестиций в проект.
Где найти компанию, которая бы поверила в потенциал МГТУ им. Н. Э. Баумана и вложила бы в совместный проект 270 млн руб.?
Вопрос, как говорится, на миллиард и сто семьдесят миллионов…
Что же в таком случае делать?
Ответ очевиден – нужно идти к поставленной цели. Мы пошли двумя очевидными для нас путями: подготовили письма и предложения для потенциальных компаний-инвесторов, сделав уйму различных версий документов и презентаций, а также стали представлять наш проект на всех возможных мероприятиях, форумах и выставках.
Параллельно с той работой, как мне тогда представлялось, нужно было сформировать «с нуля» группы разработки для решения прикладных технических задач. Несмотря на то, что какие-то специалисты в МГТУ им. Н. Э. Баумана уже имелись на тот момент, ситуация с ними была такая, что все они занимались каждый своими задачами и не было ни единой цели, ни стратегии, ни задач, которые бы могли их объединить в одну мощную команду. Самое любопытное в том, у меня сложилось мнение о том, что у некоторых из этих «специалистов» даже нет понимания того, что же такое «искусственный интеллект», нет единого мнения, нет понимания «единой цели» и более того, как выяснилось позже, у них нет желания «созидать» и делать это совместными усилиями.
Тут необходимо сделать небольшое отступление для читателя и дать несколько ключевых определений:
– Искусственный интеллект (artificial intelligence) – это отрасль компьютерных наук, занимающаяся моделированием интеллектуального поведения.
– Машинное обучение (machine learning) – это подмножество искусственного интеллекта, которое использует компьютерные алгоритмы для анализа данных и принятия разумных решений на основе полученных знаний без явного программирования. Алгоритмы машинного обучения обучаются на больших наборах данных и учатся на примерах. Они не следуют алгоритмам, основанным на правилах. Машинное обучение – это то, что позволяет машинам самостоятельно решать проблемы и делать точные прогнозы, используя предоставленные данные.
– Нейронная сеть (artificial neural networks) – математическая модель, а также её программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей – сетей нервных клеток живого организма. Также, под нейронной сетью понимают набор небольших вычислительных единиц, называемых нейронами, которые принимают входящие данные и учатся принимать решения с течением времени. Нейронные сети часто имеют многоуровневую структуру и являются причиной того, что алгоритмы глубокого обучения становятся более эффективными по мере увеличения объема наборов данных, в отличие от других алгоритмов машинного обучения, которые по мере увеличения объема данных могут выйти на плато.
– Глубокое обучение (deep learning) – это специализированное подмножество машинного обучения, которое использует многоуровневые нейронные сети для имитации принятия решений человеком, путем извлечения знаний из необработанных данных и их преобразования на каждом уровне. Эти уровни постепенно получают функции более высокого уровня из необработанных данных, что позволяет решать сложные проблемы с более высокой точностью, меньшим количеством функций и меньшей ручной настройкой. Алгоритмы глубокого обучения могут маркировать и категоризировать информацию и определять закономерности. Это то, что позволяет системам ИИ постоянно учиться на работе и улучшать качество и точность результатов, определяя, были ли решения правильными.
– Наука о данных (Data Science) – это процессы и методы извлечения знаний и идей из больших объемов разрозненных данных. Являясь междисциплинарной областью, она включает математику, статистический анализ, визуализацию данных, машинное обучение и многое другое. Наука о данных позволяет нам анализировать информацию, видеть закономерности, находить смысл в больших объемах данных и использовать их для принятия решений, или, как я часто говорю, получать «ценность» или «знания» из данных. Наука о данных может использовать разные методы искусственного интеллекта для анализа данных.
Итак, мне нужны были руководители групп разработки (именно «групп») и сами разработчики, которые бы работали в разных направлениях, решая задачи из некой составленной мной «матрицы», в которой по вертикали находились отрасли экономики, а по горизонтали технологии искусственного интеллекта (работа с «голосом», «текстом», «изображениями» и т.д.), а внутри, на их пересечении, располагались бы отраслевые задачи от наших потенциальных заказчиков и индустриальных партнеров. «Технари» мне нужны были еще и за тем, чтобы они помогали мне в процессе поиска индустриального партнера и привлечению новых заказов в Центр, показывая наши реальные наработки и компетенции.
По факту, все вышло несколько иначе, чем я себе это представлял…
С технарями ничего не получилось.
Времени собрать их было слишком мало, не говоря уже о том, чтобы в кратчайшие сроки сделать хоть сколь-нибудь работающий прототип для демонстрации заказчикам.
И, по факту, оставалось только одно – готовить презентационный материал, который бы раскрывал потенциал нашего будущего Центра, с темами («кейсами») для различных отраслей экономики и заказчиков.
Среди перспективных для нашего Центра были: государство, здравоохранение и промышленность. Позже мы переориентировались на телекоммуникационный рынок.
В силу того, что МГТУ им. Н. Э. Баумана посещают ежедневно большое число руководителей крупных предприятий и организаций, а также министров и чиновников из различных министерств и ведомств, буквально за первые недели у меня набралось несколько десятков предложений для заказчиков по разным темам.
Ниже я привожу визуальное изображение, которое отражает перечень из 75 взаимосвязанных задач от наших заказчиков, которые сформировались уже за пару месяцев подготовки к конкурсу по тематике искусственного интеллекта.
Читателю на столь маленькой картинке, к сожалению, будет плохо видно, но для общего понимания происходящих процессов и объема предстоящих работ, я все-таки публикую наш рабочий файл, в котором отражены все задачи наших заказчиков.
На что стоит также обратить свое внимание, так это на то, что задачи поступали от таких организаций, как Министерство обороны РФ, ФНС, Роскосмос, МВД, Министерство строительства и жилищно-коммунального хозяйства РФ, НИИ «Восход», РФЯЦ-ВНИИЭФ, Росатом, Министерство энергетики РФ и многих других.
Эта визуализация, в свою очередь, говорит о высокой потребности на рынке в использовании технологий искусственного интеллекта для решения локальных задач автоматизации в совершенно разных отраслях экономики.
Популярность нашего Центра стала потихоньку набирать обороты.
Другая совсем не маленькая проблема заключалась в том, чтобы определиться с направлением работ и темой будущей Программы.
Согласно требованиям конкурсной документации для участников отбора были определены 14 передовых направлений развития сферы искусственного интеллекта, в том числе «сильного» искусственного интеллекта, систем доверенного искусственного интеллекта и этических аспектов применения искусственного интеллекта, для определения тематик Центров, а именно:
– Направление «Искусственный интеллект для промышленности».
– Направление «Искусственный интеллект для медицины».
– Направление «Биометрические технологии искусственного интеллекта».
– Направление «Искусственный интеллект для оптимизации управленческих решений в целях снижения углеродного следа».
– Направление «Анализ естественного языка методами искусственного интеллекта».
– Направление «Искусственный интеллект для решения задач развития ТЭК и энергетики».
– Направление «Искусственный интеллект для „Умного города“ и транспорта».
– Направление «Искусственный интеллект для робототехники и управления беспилотными системами».
– Направление «Искусственный интеллект в сельском хозяйстве и производстве продуктов питания».
– Направление «Искусственный интеллект в биотехнологиях и генной инженерии».
– Направление «Доверенный искусственный интеллект».
– Направление «Межотраслевые технологии искусственного интеллекта и искусственный интеллект для иных приоритетных отраслей экономики и социальной сферы».
– Направление «Этические аспекты применения искусственного интеллекта».
– Направление «Искусственный интеллект для обеспечения кибербезопасности».
Проблема заключалась даже не столько с выбором какого-то направления (каждое из них по-своему интересно), сколько с тем, что в программе Центра в разделе «Описание тематики программы Центра» необходимо было привести научное обоснование выбранного направления и темы Центра, основанное на конкретных прикладных задачах, в том числе сформулированных индустриальным партнером, который, по своей сути, и определял основной вектор развития Центра искусственного интеллекта.
И, здесь, с выбором темы Программы центра, мне немного повезло.
Во-первых, индустриальным партнером стала компания АО «ЭР-Телеком Холдинг», о знакомстве с которой я расскажу несколько позже.
Во-вторых, тему для индустриального партнера я придумывал уже не просто сам, а со своей маленькой командой, состоящей из четырех человек, и индустриальным партнером в составе двух человек (!). Споров было, как всегда, много, но итоговый вариант был за партнером. Точку в наших дискуссиях поставил Денис Реймер – Директор по продуктам b2b и инновациям АО «ЭР-Телеком Холдинг».
Ну, и в-третьих, потому, что за основу, как самой темы Центра, так и ее Программы, я взял наработки из своей кандидатской диссертации, тема которой: «Анализ и выбор рациональной структуры региональных распределенных сетей передачи, обработки и хранения данных» и докторской диссертации: «Методология определения операционных характеристик и рациональной структуры региональных распределенных сервисных сетей передачи, обработки и хранения данных».
Таким образом «пазл», как говорят, начался складываться и мы определились со следующим: