ТОП-50 лучших книг в жанре Big data
bannerbanner

Big data - ТОП 50 лучших книг

Отображать сначала: популярныеновыеТОП лучших книг
Теоретический минимум по Big Data. Всё что нужно знать о больших данных (pdf+epub)
5
Cегодня Big Data – это большой бизнес. Нашей жизнью управляет информация, и извлечение выгоды из нее становится центральным моментом в работе современных организаций. Неважно, кто вы – деловой человек, работающий с аналитикой, начинающий программист или разработчик, «Теоретический минимум по Big Data» позволит не утонуть в бушующем океане современных технологий и разобраться в основах новой и стремительно развивающейся отрасли обработки больших данных. Хотите узнать о больших данных и механизмах работы с ними? Каждому алгоритму посвящена отдельная глава, в которой не только объясняются основные принципы работы, но и даются примеры использования в реальных задачах. Большое количество иллюстраций и простые комментарии позволят легко разобраться в самых сложных аспектах Big Data.
Ключевые идеи книги: Просто о больших данных. Джудит Гурвиц, Алан Ньюджент, Ферн Халпер, Марсия Кауфман
5
Этот текст – сокращенная версия книги «Просто о больших данных» (Джудит Гурвиц, Алан Ньюджент, Ферн Халпер, Марсия Кауфман). Только самые ценные мысли, идеи, кейсы, примеры. Посты в социальных сетях, данные навигаторов, датчики на производстве, показания приборов – ежедневно мир генерирует колоссальные объемы информации – Big Data, или большие данные. Пока основная часть больших данных никак не монетизирована. Но развитие технологий на стороне предприимчивых. Саммари знакомит со стратегиями и инструментами, которые помогут повернуть бурный поток информации в нужное вашей компании русло и использовать возможности больших данных для повышения эффективности бизнеса. Читать, чтобы: • Понять ключевые принципы работы с большими данными. • Узнать, как превратить огромные объемы данных в понятную и полезную информацию. • Познакомиться с практическими инструментами работы с большими данными и оценить, как их можно использовать в своем бизнесе. Об авторах Джудит Гурвиц – президент, глава совета директоров и идеол…
Python. Экспресс-курс (pdf+epub)
5
Вы уже умеете кодить на одном или нескольких языках программирования? Тогда настала пора пройти экспресс-курс Python. Впервые на русском языке выходит новое издание одной из самых популярных книг издательства Manning. С помощью этой книги вы можете быстро перейти от основ к управлению и структурам данных, чтобы создавать, тестировать и развертывать полноценные приложения. Наоми Седер рассказывает не только об основных особенностях языка Python, но и его объектно-ориентированных возможностях, которые появились в Python 3. Данное издание учитывает все изменения, которые произошли с языком за последние 5 лет, а последние 5 глав рассказывают о работе с большими данными.
Изучаем Spark. Молниеносный анализ данных
5
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala. Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Осваиваем язык Julia
5
Julia – это хорошо структурированный язык программирования с большим быстродействием, устраняющий классическую проблему выполнения анализа на одном языке и трансляции его результатов на второй с целью повышения производительности. Приведены этапы инсталляции и выполнения Julia в разных операционных средах. Описываются различные способы работы с языком, его ключевой функционал, пошагово разбираются практические примеры. Рассмотрена работа Julia с внешними процессами, благодаря которым происходит значительное улучшение качества визуализации графиков и данных. Не обделено вниманием метапрограммирование, формирующее сетевую и распределенную вычислительную среду языка. Издание предназначено для специалистов в области анализа данных, а также разработчиков, желающих познакомиться с новым языком программирования.
Работа с BigData в облаках. Обработка и хранение данных с примерами из Microsoft Azure (pdf+epub)
5
Перед вами – первая исходно русскоязычная книга, в которой на реальных примерах рассматриваются секреты обработки больших данных (Big Data) в облаках. Основное внимание уделено решениям Microsoft Azure и AWS. Рассматриваются все этапы работы – получение данных, подготовленных для обработки в облаке, использование облачных хранилищ, облачных инструментов анализа данных. Особое внимание уделено службам SAAS, продемонстрированы преимущества облачных технологий по сравнению с решениями, развернутыми на выделенных серверах или в виртуальных машинах. Книга рассчитана на широкую аудиторию и послужит превосходным ресурсом для освоения Azure, Docker и других незаменимых технологий, без которых немыслим современный энтерпрайз.
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
5
Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, о результатах медицинского исследования, которые намеренно утаили или случайно исказили, или о данных, ставших темными из-за плохого набора критериев для включения в выборку. Хэнд также рассказывает о том, какие меры могут сгладить эффект темных данных и как их можно обратить себе на пользу.
Наука о данных
5
Сегодня наука о данных используется практически во всех сферах: вы видите подобранные специально для вас рекламные объявления, рекомендованные на основе ваших предпочтений фильмы и книги, ссылки на предполагаемых друзей в соцсетях, отфильтрованные письма в папке со спамом. Книга знакомит с основами науки о данных. В ней охватываются все ключевые аспекты, начиная с истории развития сбора и анализа данных и заканчивая этическими проблемами, связанными с конфиденциальностью информации. Авторы объясняют, как работают нейронные сети и машинное обучение, приводят примеры анализа бизнес-проблем и того, как их можно решить, рассказывают о сферах, на которые наука о данных окажет наибольшее влияние в будущем. «Наука о данных» уже переведена на японский, корейский и китайский языки.
Cassandra. Полное руководство
5
Из этой книги вы узнаете, как система управления базами данных Cassandra справляется с обработкой сотен терабайтов данных, работая в нескольких ЦОДах и сохраняя высокую доступность. Во втором издании, дополненном и охватывающем версию Cassandra 3.0, вы найдете технические детали и практические примеры, которые помогут запустить эту систему в боевых условиях. Авторы демонстрируют достоинства нереляционного дизайна Cassandra, уделяя особое внимание моделированию данных. Издание предназначено для разработчиков, администраторов баз данных и архитекторов, работающих с «большими данными» и стремящихся решить проблему масштабирования.
Форма жизни № 4. Как остаться человеком в эпоху расцвета искусственного интеллекта
5
Форма жизни № 4 – это люди, усиленные имплантами и искусственным интеллектом. Речь идет о недалеком будущем: уже сегодня машины могут безостановочно обучаться, ИИ становиться умнее и дешевле, а спектр его возможностей расширяется с каждым днем. Евгений Черешнев – визионер, первый российский ИТ-спикер TED New York, предприниматель и бионик – описывает ИИ как ступень в эволюции жизни на нашей планете. Автор проанализировал историю думающих машин и современных методов анализа данных, рассказал о влиянии автоматизации на социум, семью, экономику и геополитику, об инструментах защиты от трекинга и цифровых угроз. А главное – он показал, как может выглядеть мир ХХII века, где никто не сможет отключиться от глобальной сети, а нужда во многих сферах человеческой деятельности полностью отпадет. Чтобы не стать рабами в мире разумных роботов, нужно помнить о машинной этике, установить правила сбора и анализа данных и, что важнее всего, понять, как устроен и развивается искусственный разум. Об этих и многих других ас…
Данные: визуализируй, расскажи, используй. Сторителлинг в аналитике
5
Эта книга для всех, кто работает с аналитикой и создает презентации на основе данных. В ней показано, как выйти за рамки стандартных инструментов, чтобы раскрыть суть данных и использовать их для создания увлекательной, информативной и убедительной истории. Уроки из этой книги помогут превратить ваши данные в яркие наглядные визуализации, понятные аудитории. Расскажите вашу историю на основе данных! В тексте неоднократно упоминаются названия социальных сетей, принадлежащих Meta Platforms Inc., признанной экстремистской организацией на территории РФ.
Kafka Streams и ksqlDB. Данные в реальном времени (pdf + epub)
5
Работа с неограниченными и быстрыми потоками данных всегда была сложной задачей. Но Kafka Streams и ksqlDB позволяют легко и просто создавать приложения потоковой обработки. Из книги специалисты по обработке данных узнают, как с помощью этих инструментов создавать масштабируемые приложения потоковой обработки, перемещающие, обогащающие и преобразующие большие объемы данных в режиме реального времени. Митч Сеймур, инженер службы обработки данных в Mailchimp, объясняет важные понятия потоковой обработки на примере нескольких любопытных бизнес-задач. Он рассказывает о достоинствах Kafka Streams и ksqlDB, чтобы помочь вам выбрать наиболее подходящий инструмент для каждого уникального проекта потоковой обработки. Для разработчиков, не пишущих код на Java, особенно ценным будет материал, посвященный ksqlDB. После покупки предоставляется дополнительная возможность скачать книгу в формате epub.
Введение в статистическое обучение с примерами на языке R
5
Книга представляет собой доступно изложенное введение в статистическое обучение – незаменимый набор инструментов, позволяющих извлечь полезную информацию из больших и сложных наборов данных, которые начали возникать в последние 20 лет в таких областях, как биология, экономика, маркетинг, физика и др. В этой книге описаны одни из наиболее важных методов моделирования и прогнозирования, а также примеры их практического применения. Рассмотренные темы включают линейную регрессию, классификацию, создание повторных выборок, регуляризацию, деревья решений, машины опорных векторов, кластеризацию и др. Описание этих методов сопровождается многочисленными иллюстрациями и практическими примерами. Поскольку цель этого учебника заключается в продвижении методов статистического обучения среди практикующих академических исследователей и промышленных аналитиков, каждая глава включает примеры практической реализации соответствующих методов с помощью R – чрезвычайно популярной среды статистических вычислений с открытым код…
Большие данные. Зачем, что и как?
4
Электронный учебник – сборник материалов, после изучения которого вы сможете получить краткое и емкое представление о работе с Большими Данными. – Что такое Большие Данные? – Откуда берутся Большие Данные и в чем их польза? – Из каких этапов состоит работа над Большими Данными? – Как собирать, хранить и анализировать Большие Данные? – Как понять, о чем говорят специалисты? На изучение вам потребуется 40 минут. В конце вас ждут вопросы для проверки усвоения материала. В формате PDF A4 сохранен издательский макет книги.
Не лги себе. Почему Big Data знает тебя лучше, чем ты сам, и как использовать это, чтобы добиться успеха
4
За последнее десятилетие ученые изучили гигантские наборы данных, чтобы найти новые подходы к решению самых важных жизненных вопросов. Исследователь данных Сет Стивенс-Давидовиц проанализировал множество научных исследований об удовольствии и счастье, чтобы понять, чего мы хотим от жизни на самом деле. В формате PDF A4 сохранен издательский макет книги.
Ключевые идеи книги: Просто о больших данных. Джудит Гурвиц, Алан Ньюджент, Ферн Халпер, Марсия Кауфман
4
Этот текст – сокращенная версия книги «Просто о больших данных» (Джудит Гурвиц, Алан Ньюджент, Ферн Халпер, Марсия Кауфман). Только самые ценные мысли, идеи, кейсы, примеры. Посты в социальных сетях, данные навигаторов, датчики на производстве, показания приборов – ежедневно мир генерирует колоссальные объемы информации – Big Data, или большие данные. Пока основная часть больших данных никак не монетизирована. Но развитие технологий на стороне предприимчивых. Саммари знакомит со стратегиями и инструментами, которые помогут повернуть бурный поток информации в нужное вашей компании русло и использовать возможности больших данных для повышения эффективности бизнеса. Читать, чтобы: • Понять ключевые принципы работы с большими данными. • Узнать, как превратить огромные объемы данных в понятную и полезную информацию. • Познакомиться с практическими инструментами работы с большими данными и оценить, как их можно использовать в своем бизнесе. Об авторах Джудит Гурвиц – президент, глава совета директоров и идеол…
Данные: визуализируй, расскажи, используй. Сторителлинг в аналитике
4
Эта книга для всех, кто работает с аналитикой и создает презентации на основе данных. В ней показано, как выйти за рамки стандартных инструментов, чтобы раскрыть суть данных и использовать их для создания увлекательной, информативной и убедительной истории. Уроки из этой книги помогут превратить ваши данные в яркие наглядные визуализации, понятные аудитории. Расскажите вашу историю на основе данных! В тексте неоднократно упоминаются названия социальных сетей, принадлежащих Meta Platforms Inc., признанной экстремистской организацией на территории РФ.
Data mining, или Интеллектуальный анализ данных для занятых. Практический курс
4
Что такое информация? Как можно проанализировать данные, которые у вас есть? А если данных очень много и они требуют вычислительной мощи современных компьютеров? Какие выводы можно сделать из этого массива данных? Может – никаких, а может – это неиссякаемый источник, приносящий все новые возможности. Самое ценное, что есть у любого человека, это его знания, помноженные на опыт. Эта книга помогает занятому человеку быстро погрузиться в увлекательный мир интеллектуального анализа данных с целью извлечения полезной информации, которую можно использовать в дальнейшем, например, в бизнесе или в принятии решений. Эта деятельность по-английски называется Data mining и содержит методы, используемые самыми разными специалистами-аналитиками, исследующими медицинские, политические, экономические и другие всевозможные источники данных. Предполагается, что читатель более-менее знаком с Excel и пользуется им время от времени. Знания SQL-сервера не требуется, но полезно иметь.
Журнал Computerworld Россия №09/2012
4
В номере: Жизнь только начинается В мае наступает 60-я годовщина со времени изобретения корпорацией IBM цифровой магнитной ленты. О том, что лента отслужила свое, заявляли уже много раз, но похоже, что у нее впереди еще долгая жизнь. Во-первых, изменился рынок – потоковое мультимедиа, облака и Большие Данные заставили снова задуматься о цене хранения, параметре, по которому лентам нет равных до сих пор. На пике возможностей Как полагают в Panasonic, российский рынок DECT-телефонов достиг своего максимума, за которым последует плавное снижение объемов продаж, а вот продажи МФУ, в том числе снабженных факс-аппаратом, будут расти. AQ на уровне IBM предлагает измерять аналитический коэффициент бизнеса, показывающий, какую долю своего информационного потенциала организация реально использует, утверждая что у компаний с высоким AQ и результаты выше. Видео с доставкой на дом Компания CDNvidеo, построившая собственную сеть распространения видеоконтента, объявила о начале предоставления соответствующих услуг хр…
Роман с Data Science. Как монетизировать большие данные
4
Как выжать все из своих данных? Как принимать решения на основе данных? Как организовать анализ данных (data science) внутри компании? Кого нанять аналитиком? Как довести проекты машинного обучения (machine learning) и искусственного интеллекта до топового уровня? На эти и многие другие вопросы Роман Зыков знает ответ, потому что занимается анализом данных почти двадцать лет. В послужном списке Романа – создание с нуля собственной компании с офисами в Европе и Южной Америке, ставшей лидером по применению искусственного интеллекта (AI) на российском рынке. Кроме того, автор книги создал с нуля аналитику в Ozon.ru. Эта книга предназначена для думающих читателей, которые хотят попробовать свои силы в области анализа данных и создавать сервисы на их основе. Она будет вам полезна, если вы менеджер, который хочет ставить задачи аналитике и управлять ею. Если вы инвестор, с ней вам будет легче понять потенциал стартапа. Те, кто «пилит» свой стартап, найдут здесь рекомендации, как выбрать подходящие технологии и …
Блокчейн философия. Часть I
4
Книга рассказывает о новых явлениях жизни: blockchain, smart-контракты, Интернет вещей, Big Data, ИИ не с позиции технологии, но с точки зрения осмысления влияния феноменов на человека, общество и будущее каждого из нас. Кроме того, она из плеяды тех книг, которые превращают скучную и пыльную философию академического стиля в эмоциональный жанр самоосмысления важнейших составляющих бытия и быта через описание ключевых достижений человечества.
MySQL 8 для больших данных
4
Среди организаций, работающих с крупными объемами данных на регулярной основе, реляционная система управления базами данных MySQL стала популярным решением по обработке структурированных больших данных. В книге вы познакомитесь с тем, как администраторы баз данных могут использовать MySQL для обработки миллиардов записей и извлечения данных с производительностью, сравнимой или превосходящей коммерческие решения для СУБД с более высокими затратами. Показано, как реализовывать успешную стратегию больших данных с помощью таких технологий, как Apache Hadoop, MapReduce и MySQL Applier. Также книга включает в себя практические примеры использования Apache Sqoop для обработки событий в режиме реального времени. Издание будет полезно администраторам баз данных MySQL и специалистам по большим данным, которые хотят интегрировать MySQL и Hadoop с целью реализации высокопроизводительных решений.
Ключевые идеи книги: Лгут все. Что интернет и Big Data могут сказать нам о нашем истинном «Я». Сет Стивенс-Давидовиц
4
Этот текст – сокращенная версия книги Сета Стивенса-Давидовица «Лгут все. Что интернет и Big Data могут сказать нам о нашем истинном «Я»». Только самые ценные мысли, идеи, кейсы, примеры. О книге Cет Стивенс-Давидовиц, автор книги «Лгут все», в свое время занимался анализом Big Data в Google. Он утверждает, что информация, которую люди сами оставляют о себе в интернет-пространстве, искажена. Люди лгут друзьям, любовникам, врачам, ученым – и самим себе. Однако сегодня нет необходимости полагаться на чужие слова. На сегодняшний день накоплено около восьми триллионов гигабайт данных о человечестве в поисковике Google, социальных сетях, на сайтах знакомств и даже на порнографических сайтах. Этот ошеломляющий объем информации откроет правду о том, кто мы такие: о страхах и желаниях, которые нами движут, о сознательных и бессознательных решениях, которые мы принимаем. Если вы зададите правильный вопрос, то, благодаря большим данным, сможете узнать что угодно о человеческой природе. Зачем читать • Научиться виде…
Ключевые идеи книги: Оружие математического поражения: как технология Big Data усугубляет неравенство и угрожает демократии. Кэти О'Нил
4
Этот текст – сокращенная версия книги Кэти О'Нил «Оружие математического поражения». Только самые ценные мысли, идеи, кейсы, примеры. О книге Кэти О'Нил, бывший аналитик с Уолл-стрит, в своей книге «Оружие математического поражения» знакомит общественность с тревожным симптомом. Математические модели, которые пронизывают современную жизнь, угрожают разрывом социальных связей. Мы живем в эпоху алгоритма. Решения, которые оказывают влияние на нас, принимаются не людьми, а машинами. Теоретически это должно приводить к справедливому распределению благ: если всех судят по одним правилам, значит, предвзятость устранена. Однако на деле математические модели, которые работают с большими данными, непрозрачны, их невозможно проверить и отрегулировать. Модели поддерживают счастливчиков и наказывают угнетенных. Кэти О'Нил призывает разработчиков брать на себя ответственность за свои алгоритмы, а политиков – регулировать их использование. Зачем читать • Взглянуть на BigData с критической точки зрения, проанализировать…
Форма жизни № 4. Как остаться человеком в эпоху расцвета искусственного интеллекта
4
Форма жизни №4 – это люди, усиленные имплантами и искусственным интеллектом. Речь идет о недалеком будущем: уже сегодня машины могут безостановочно обучаться, ИИ становиться умнее и дешевле, а спектр его возможностей расширяется с каждым днем. Евгений Черешнев – визионер, первый российский ИТ-спикер TED New York, предприниматель и бионик – описывает ИИ как ступень в эволюции жизни на нашей планете. Автор проанализировал историю думающих машин и современных методов анализа данных, рассказал о влиянии автоматизации на социум, семью, экономику и геополитику, об инструментах защиты от трекинга и цифровых угроз. А главное – он показал, как может выглядеть мир ХХII века, где никто не сможет отключиться от глобальной сети, а нужда во многих сферах человеческой деятельности полностью отпадет. Чтобы не стать рабами в мире разумных роботов, нужно помнить о машинной этике, установить правила сбора и анализа данных и, что важнее всего, понять, как устроен и развивается искусственный разум. Об этих и многих других …
Форма жизни № 4. Как остаться человеком в эпоху расцвета искусственного интеллекта
4
Форма жизни № 4 – это люди, усиленные имплантами и искусственным интеллектом. Речь идет о недалеком будущем: уже сегодня машины могут безостановочно обучаться, ИИ становиться умнее и дешевле, а спектр его возможностей расширяется с каждым днем. Евгений Черешнев – визионер, первый российский ИТ-спикер TED New York, предприниматель и бионик – описывает ИИ как ступень в эволюции жизни на нашей планете. Автор проанализировал историю думающих машин и современных методов анализа данных, рассказал о влиянии автоматизации на социум, семью, экономику и геополитику, об инструментах защиты от трекинга и цифровых угроз. А главное – он показал, как может выглядеть мир ХХII века, где никто не сможет отключиться от глобальной сети, а нужда во многих сферах человеческой деятельности полностью отпадет. Чтобы не стать рабами в мире разумных роботов, нужно помнить о машинной этике, установить правила сбора и анализа данных и, что важнее всего, понять, как устроен и развивается искусственный разум. Об этих и многих других ас…
Технология хранения и обработки больших данных Hadoop
3
Apache Hadoop - это платформа для распределенной обработки больших наборов данных на кластерах компьютеров с использованием простых моделей программирования. В этой книге вы познакомитесь с общей архитектурой платформы, компонентами стека, такими как HDFS и MapReduce, приложениями Hadoop.
Переосмысление роли HR
3
Harvard Business Review – ведущий мировой деловой журнал с многолетней историей. В новой книге серии «Harvard Business Review: 10 лучших статей» собраны самые полезные и востребованные материалы по инновациям в сфере HR. Вот некоторые темы, которые затронуты в этом сборнике: использование аджайл-подхода и больших данных в управлении персоналом, эффективные программы обеспечения равенства возможностей, изменение состава рабочей силы в эпоху старения населения, сотрудничество людей и интеллектуальных машин. В этих и других аспектах современных тенденций в сфере управления персоналом необходимо ориентироваться не только сотрудникам корпоративных HR-служб, но и руководителям всех уровней.
Big data простым языком
3
Наш телефон знает о нас больше, чем мы думаем. Он умеет собирать и анализировать информацию о том, как мы передвигаемся по городу, какие посты лайкаем и какими приложениями пользуемся. Он сообщит о пробках и поторопит на работу, чтобы мы не опоздали; подберет музыку под наше настроение и составит список персональных рекомендаций, чем можно занять себя в течение дня. Телефон – больше не устройство, по которому звонят, это уже средство управления окружающим нас миром. Незаметно мы окружили себя такими интерфейсами, которые создают невидимый барьер между человеком и окружающей средой. Планирование, управление, коммуникация, все теперь строится через эти программы и девайсы. Даже человеческие отношения. Но насколько глубока кроличья нора? Каждому предстоит разобраться в этом самому. Эта книга поможет донести основные принципы проектирования и создания таких интерфейсов управления бизнесом, обществом и окружающим нас миром посредством Больших данных. Читайте, наслаждайтесь и помните: сожжение книг противозакон…
Машинное обучение на практике – от модели PyTorch до Kubeflow в облаке для BigData
3
В этой книге Главный Архитектор Департамента Архитектуры Управления Технической Архитектуры (Центра Облачных Компетенций Cloud Native и Корпоративного университета архитекторов) и архитектор решения Сбербанка делится знаниями и опытом с читателей в области ML, полученных в работе Школе архитекторов. Автор: * проводит читателя через процесс создания, обучения и развития нейронной сети, показывая детально на примерах * повышает кругозор, показывая, какое она может занимать место в BigData с точки зрения Архитектора * знакомит с реальными моделями в продуктовой среде
Роман с Data Science. Как монетизировать большие данные
3
Как выжать все из своих данных? Как принимать решения на основе данных? Как организовать анализ данных (data science) внутри компании? Кого нанять аналитиком? Как довести проекты машинного обучения (machine learning) и искусственного интеллекта до топового уровня? На эти и многие другие вопросы Роман Зыков знает ответ, потому что занимается анализом данных почти двадцать лет. В послужном списке Романа – создание с нуля собственной компании с офисами в Европе и Южной Америке, ставшей лидером по применению искусственного интеллекта (AI) на российском рынке. Кроме того, автор книги создал с нуля аналитику в Ozon.ru. Эта книга предназначена для думающих читателей, которые хотят попробовать свои силы в области анализа данных и создавать сервисы на их основе. Она будет вам полезна, если вы менеджер, который хочет ставить задачи аналитике и управлять ею. Если вы инвестор, с ней вам будет легче понять потенциал стартапа. Те, кто «пилит» свой стартап, найдут здесь рекомендации, как выбрать подходящие технологии и …
Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
3
Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой – крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, результатах медицинского исследования, которые намеренно утаили или случайно исказили, или данных, ставших «темными» из-за плохого набора критериев для включения в выборку. Хэнд также рассказывает о том, какие меры могут сгладить эффект «темных данных» и как их можно обратить себе на пользу. Книга будет интересна широкому кругу читателей, интересующихся дата-сайенс, программированием и статистикой.
Машинное обучение с использованием библиотеки Н2О
3
Н2О – простая в использовании и открытая библиотека, которая поддерживает большое количество операционных систем и языков программирования, а также масштабируется для обработки больших данных. Эта книга научит вас использовать алгоритмы машинного обучения, реализованные в Н2О, с упором на наиболее важные для продуктивной работы аспекты. Рассмотрены глубокое обучение, случайный лес, обучение на неразмеченных данных и ансамбли моделей. В российское издание добавлены дополнительно два приложения, описывающих новейшие модули Н2О – Deep Water и Stacked Ensemble. Их также можно найти в репозитории https://github.com/statist-bhfz/h2o_book_translate. Издание предназначено для специалистов по анализу данных, желающих изучить и применять на практике относительно новый, но многообещающий инструмент – библиотеку Н2О.
Построение систем машинного обучения на языке Python
3
Применение машинного обучения для лучшего понимания природы данных – умение, необходимое любому современному разработчику программ или аналитику. Python – замечательный язык для создания приложений машинного обучения. Благодаря своей динамичности он позволяет быстро производить разведочный анализ данных и экспериментировать с ними. Обладая первоклассным набором библиотек машинного обучения с открытым исходным кодом, Python дает возможность сосредоточиться на решаемой задаче и в то же время опробовать различные идеи. Книга начинается с краткого введения в предмет машинного обучения и знакомства с библиотеками NumPy, SciPy, scikit-learn. Но довольно быстро авторы переходят к более серьезным проектам с реальными наборами данных, в частности, тематическому моделированию, анализу корзины покупок, облачным вычислениям и др. Издание рассчитано на программистов, пишущих на Python и желающих узнать о построении систем машинного обучения и научиться извлекать из данных ценную информацию, необходимую для решения раз…
Анализ больших наборов данных
3
Эта книга написана ведущими специалистами в области технологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы добычи данных (data mining). В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce – важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности. Издание будет в равной мере полезна студентам и программистам-практикам.
Data mining, или Интеллектуальный анализ данных для занятых. Практический курс
3
Что такое информация? Как можно проанализировать данные, которые у вас есть? А если данных очень много и они требуют вычислительной мощи современных компьютеров? Какие выводы можно сделать из этого массива данных? Может – никаких, а может – это неиссякаемый источник, приносящий все новые возможности. Самое ценное, что есть у любого человека, это его знания, помноженные на опыт. Эта книга помогает занятому человеку быстро погрузиться в увлекательный мир интеллектуального анализа данных с целью извлечения полезной информации, которую можно использовать в дальнейшем, например, в бизнесе или в принятии решений. Эта деятельность по-английски называется Data mining и содержит методы, используемые самыми разными специалистами-аналитиками, исследующими медицинские, политические, экономические и другие всевозможные источники данных. Предполагается, что читатель более-менее знаком с Excel и пользуется им время от времени. Знания SQL-сервера не требуется, но полезно иметь.
Переосмысление роли HR
3
Harvard Business Review – ведущий мировой деловой журнал с многолетней историей. В новой книге серии «Harvard Business Review: 10 лучших статей» собраны самые полезные и востребованные материалы по инновациям в сфере HR. Вот некоторые темы, которые затронуты в этом сборнике: использование аджайл-подхода и больших данных в управлении персоналом, эффективные программы обеспечения равенства возможностей, изменение состава рабочей силы в эпоху старения населения, сотрудничество людей и интеллектуальных машин. В этих и других аспектах современных тенденций в сфере управления персоналом необходимо ориентироваться не только сотрудникам корпоративных HR-служб, но и руководителям всех уровней.