本书以多格漫画形式掀开大数据的朦胧面纱,带领读者走进数据科学的浩瀚世界。故事讲述了由数据的产生,直至其发展成为大数据这一历程,使读者感受到大数据释放的力量、绽放的价值、迸发的智慧、遭遇的安全之忧。同时,引导读者进一步理解数据的形式与内涵、大数据的概念及特征、人工智能与大数据的关系,加深对数据科学的认知。
本书系统介绍了面向人工智能领域中的数据安全、隐私保护技术和工程实践。本书首先探讨了人工智能领域所面临的各种数据安全和隐私保护的问题及其核心需求,并在此基础上纵览和比较了各种隐私保护计算技术和解决方案的利弊;然后详细阐述了目前比较具有工程实践优势的可信执行环境技术,及其在主流人工智能场景中的工程实践参考案例。此外,本书介
本书首先简要介绍了大数据分析与挖掘的相关概念,以及R语言的基础知识,以此来帮助读者了解、使用R语言;其次详细介绍了探索性数据分析、数据采集,以此来帮助读者了解数据的基本分析方法和数据的获取方法;然后着重介绍了目前主流的数据挖掘算法——时间序列算法、线性回归算法、分类算法、关联算法、聚类算法,从算法的原理到如何使用R语言
本书由数数科技分析师团队撰写。基于数数科技成立以来服务上千家游戏企业、近万个游戏项目的经验,作者介绍了游戏行业的数据分析现状,解读了数据驱动增长的典型案例,阐明了如何建设数据分析体系才能给游戏企业带来商业价值,希望为游戏行业的运营、数据分析、策划等岗位从业者提供从方法到实践的指导,驱动游戏业务增长。
《吉布斯分布的局部、动态与快速采样算法》由爱丁堡大学博士后凤维明撰写,内容荣获2021年度CCF优秀博士学位论文奖。全书立足大数据背景下的新问题,从分布式采样和动态采样两个具体问题入手,给出了有理论保障的算法并研究了新模型下采样问题的复杂性。《吉布斯分布的局部、动态与快速采样算法》共十章,分为四个部分:第零部分(第1~
本书对大数据挖掘与应用的基本算法进行了系统的介绍,每种算法不仅包括对算法基本原理的介绍,而且配有大量的例题以及基于阿里云大数据平台(数加平台)的演示,这种理论与实践相结合的方式极大地方便了读者对抽象的数据挖掘算法的理解和掌握。本书共11章,内容覆盖了数据预处理、分类算法、聚类算法及常见的数据挖掘应用,具体章节包括大数据
Centreon是一款分布式开源监控平台,易于安装、管理,可支持大规模的网络监控。本书基于作者实践经验讲述如何使用Centreon。全书共15章,大致可分为4部分:第1章和第2章为基础部分,主要介绍分布式监控平台Centreon的主要特征、功能;第3~5章介绍系统部署,用ISO镜像文件部署Centreon及在CentO
本书采用“问题描述+解决方案”模式,通过500个案例介绍了使用Pandas进行数据分析和数据处理的技术亮点。全书共分为8章,主要案例包括:读写CSV、Excel、JSON、HTML等格式的数据;根据行标签、列名和行列数字索引筛选和修改数据,使用各种函数根据数据大小、日期范围、正则表达式、lambda表达式、文本类型等多
本书系统介绍Spark大数据处理框架。全书共8章,内容包括大数据技术概述、Spark大数据处理框架、SparkRDD编程、SparkSQL结构化数据处理、HBase分布式数据库、SparkStreaming流计算、SparkMLlib机器学习、数据可视化。本书可作为高等院校计算机科学与技术、信息管理与信息系统、软件工程
本书从系统的角度,成体系地研究动态数据驱动原理与方法。以数据驱动为根本出发点,揭示了复杂系统的设计、运行、控制与优化规律,从信号感知、结构感知、环境感知、情景感知、语境感知、能量感知、过程感知、网络感知、系统感知等不同维度,介绍了主流的理论与方法,提供了研究复杂系统问题的新思路、新方法。