本书按照“理论+实战”的形式编写,将企业项目需求分解为单独的任务,全面系统地讲解了大数据采集与预处理的相关知识与技术。全书针对数据采集的不同来源,将知识内容分为五个项目,包括网络数据采集、分布式消息系统Kafka、实时数据库采集工具Canal和Maxwell、ETL日志采集技术栈以及ETL工具——Kettle。本书针对
全书共9章,内容涉及数据采集、环境部署、Kettle安装及应用、pandas应用以及Python应用案例,由浅入深地介绍了数据可视化的基础内容。
本书以智能机器人开发的基本技术为主要脉络,以ROS系统为核心开发平台,以企业真实产品为载体,以岗位能力要求为导向,由校企合作团队共同编写而成。本书分为4篇,20个项目,主要内容包括认识智能机器人、智能机器人复杂的大脑、智能机器人蹒跚学步、智能机器人发电报、智能机器人收电报、智能机器人计算好帮手、智能机器人有求必应、智能
"本书是一本面向大数据基础知识学习、基本技能训练和场景应用的项目化教程。全书共分为8个单元,内容包括初识大数据、Linux应用基础、大数据存储与计算、大数据编程基础、数据采集与预处理、数据分析与挖掘、数据可视化、大数据典型行业应用分析。本书知识点全面,融合了大数据应用开发的新技术和多个典型行业应用场景,突出情境案例导引
本书以大数据分析与挖掘的常用技术与真实案例相结合的方式,按照“概念和原理讲解、案例分析、能力拓展——Python软件应用”的层次进行阐述,深入浅出地介绍大数据分析与挖掘的重要内容。全书共11章,第1章作为全书的绪论,介绍了大数据分析与挖掘的基本概念、行业应用等;第2章介绍了Python的安装、编程基础以及常用的数据分析
Spark是业界主流的大数据计算框架。本书通过一系列大数据应用案例和实践项目贯穿始终,使用Python详细阐述了Spark大数据环境的搭建、SparkRDD离线数据计算、SparkSQL离线数据处理、SparkStreaming实时数据计算等一系列常见的大数据处理问题,并在此基础上对Spark的核心概念及技术原理进行了
我国互联网平台经济自2010年开始步入快速发展阶段,成为推动经济、社会发展的重要引擎,也推动着新业态新模式不断涌现。在数字经济时代,数据成为互联网平台经济的驱动要素。平台企业基于互联网技术,以数据作为生产要素对资源进行配置。然而,互联网平台企业数据造假现象问题一直存在,尤其是社交平台、媒体广告平台、点评平台问题最为突出
本书第4版根据计算机控制与网络技术的发展,基于工业界、科技界和教育界的成果进行了全面修订。本书面向新工科建设、工程教育专业认证和卓越工程人才培养计划,以立德树人为根本任务,以科学家精神、企业家精神、工匠精神等中国精神为动力,以培养学生解决复杂工程和实际问题的综合能力为出发点,以主流机型PC/ISA/PCI/PCIE总
本书主要介绍了常用传感器的构成、工作原理、特性参数、选型及安装调试等方面的知识,对测量电路的基本概念、抗干扰技术及新型传感器的应用也做了介绍。书中列举了各类传感器在工业、科研和日常生活中的应用实例,每章均附有习题,注重培养和提高学生的应用能力与分析能力。本书为新形态一体化教材,扫描书中二维码,可获取微课视频数字化学习内
本书是备受广大读者推崇的数据结构与算法入门教程,已在GitHub获得超60k的Star,并多次登顶GitHubTrending。书中系统介绍了数据结构与算法基础、复杂度分析、数组与链表、栈与队列、哈希表、树、堆、图、搜索、排序、分治、回溯、动态规划和贪心算法等核心知识,通过清晰易懂的解释和丰富的代码示例,以及生动形象的