flink 机器学习python,flink python案例

大家好，今天小编关注到一个比较有意思的话题，就是关于flink 机器学习 python的问题，于是小编就整理了2个相关介绍flink 机器学习Python的解答，让我们一起看看吧。

数据分析真的每天都是python，SQL吗？转行数据分析的话要重点学习什么呢？
想自学大数据，不知道从哪里学起，有什么书籍和学习路线推荐么？

数据分析真的每天都是python，SQL吗？转行 数据 分析的话要重点学习什么呢？

1、SQL是必备的。

2、一些python的分析工具包，numpy、pandas、matplotlib库要熟悉。

（图片来源网络，侵删）

3、要会ETL。如：ETL工具 离线： sqoop、DataX、Kettle，实时:StreamSets。

ETL（提取、转换、加载）指数据驱动型组织从多个来源收集数据，然后将数据集中起来以满足数据发现、报告、分析和决策需求的过程。

4、另外一些BI工具要熟悉，不光分析数据，还得展示出来给大众看，像powerBI，fineBI，superBI，Tableau。

（图片来源网络，侵删）

5、大数据方向的技术也是必备的。如：

文件存储：Hadoop HDFS、Tachyon、KFS，NFS、S3等

离线计算：Hadoop MapReduce、Spark等

（图片来源网络，侵删）

流式、实时计算：Storm、Spark Streaming、S4、Flink等

NOSQL数据库：HBase、Redis、MongoDB、Dragonfly 等

SQL是数据分析师最常用的工具，几乎每天都会用到，主要是其基本用法需要掌握。

基础入门可能包含如下：

提高篇：

可以对照看看，自己各点掌握得如何？

Python在业内使用也挺多，但不是必须，相当企业并没有要求。当然如果你想学习机器学习算法，建模，python是一个可选的基础之一，其第三方库包及其丰富。

其他的，比如BI工具，很多企业使用都不一样，这个其实可以在工作中边学边用。

既然是转行到数据分析，就涉及到如何拿到一份offer的问题。笔者以往的经历来看，相当多企业，面试开始就是SQL技术面。过关之后就会有大量的分析题，这非常考验面试者能力。

数据分析理论知识：

思维能力：这块面试官可以从你的表达，谈吐感受到。往往也是考虑的重点，建议看看经典书籍《金字塔原理》、《批判性思维》等；

项目积累：即使是转行，从未涉及过数据分析工作，在找工作之前，完全可以找到一些项目和数据练手。这样，会让自己有更充足的准备。

想自学大数据，不知道从哪里学起，有什么书籍和学习路线推荐么？

大数据学习可以从最基础的java 语言入手，然后去学习Linux&Hadoop生态体系，一些分布式的技术理念，再然后就是学习机器学习，深度学习算法。

阶段一、大数据基础——Java 语言基础方面

（1）J***a语言基础

J***a开发介绍、熟悉Eclipse开发工具、J***a语言基础、J***a流程控制、J***a字符串、J***a数组与类和对象、数字处理类与核心技术、I/O与反射、多线程、Swing程序与集合类

（2）J***aWeb和数据库

数据库、J***aWeb开发核心、J***aWeb开发内幕

推荐书籍：

《Effective J***a中文版》（第2版）

这本书是学习j***a必备书籍，看完这本书也就掌握了入门的基础知识。

阶段二、 Linux&Hadoop生态体系

随着互联网技术的发展，大数据行业前景非常被看好，有很多朋友对大数据行业心向往之，却苦于不知道该如何下手，或者说学习大数据不知道应该看些什么书。作为一个零基础大数据入门学习者该看[_a***_]书?今天就给大家分享几本那些不容错过的大数据书籍。

1、《数据挖掘》

这是一本关于数据挖掘领域的综合概述，本书前版曾被KDnuggets的读者评选为最受欢迎的数据挖掘专著，是一本可读性极佳的教材。它从数据库角度全面系统地介绍数据挖掘的概念、方法和技术以及技术研究进展，并重点关注近年来该领域重要和最新的课题——数据仓库和数据立方体技术，流数据挖掘，社会化网络挖掘，空间、多媒体和其他复杂数据挖掘。

2、《Big Data》

这是一本在大数据的背景下，描述关于数据建模，数据层，数据处理需求分析以及数据架构和存储实现问题的书。这本书提供了令人耳目一新的全面解决方案。但不可忽略的是，它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。本书将教你充分利用集群硬件优势的Lambda架构，以及专门用来捕获和分析网络规模数据的新工具，来创建这些系统。

3、《Mining of Massive Datasets》

这是一本书是关于数据挖掘的。但是本书主要关注极大规模数据的挖掘，也就是说这些数据大到无法在内存中存放。由于重点强调数据的规模，所以本书的例子大都来自Web本身或者Web上导出的数据。另外，本书从算法的角度来看待数据挖掘，即数据挖掘是将算法应用于数据，而不是使用数据来“训练”某种类型的机器学习引擎。

到此，以上就是小编对于flink 机器学习python的问题就介绍到这了，希望介绍关于flink 机器学习python的2点解答对大家有用。

正文

flink 机器学习python,flink python案例

数据分析真的每天都是python，SQL吗？转行 数据 分析的话要重点学习什么呢？

想自学大数据，不知道从哪里学起，有什么书籍和学习路线推荐么？

相关阅读

学习dba必须要会linux吗（dba好学吗）

小白学习python游戏,python游戏入门

linux内核技术手册学习（linux内核设计与实现知乎）

linux和sql学习外包,

目录[+]