学大数据还要学Python吗?java大数据与python大数据如何选择?今天我们来看看一位大神的回答。
目前Java和Python是做大数据平台开发最常见的两种编程语言,当然还有Scala和R,下面简单的分析一下Java与Python在做大数据开发时的优缺点,具体选择哪个可以根据实际情况来判断。
Java大数据
首先说一下Java语言,Java语言应用广泛,可以应用的领域也非常多,有完整的生态体系,另外Java语言的性能也非常不错。Java与大数据的关系非常密切,一方面目前做大数据开发的程序员很多都是从Java程序员转过去的,另一方面Hadoop平台本身就是基于Java开发的,所以目前Java在大数据开发中的使用还是非常普遍的。
但是Java语言自身的复杂性让很多程序员感觉它有点“重”,格式化的东西有点多,所以在Spark平台下,很多程序员更愿意使用Scala语言,而Scala就是基于Java语言构建的,所以有Java基础再学习Scala还是比较轻松的。
单学Java以后的就业方向单一,薪资就是java程序员的基本水平;而java大数据工程师,以后的就业可以从事java方面的工作,也可以涉猎大数据方面的工作,因为对大数据技术知识有所涉猎,所以谈薪资的资本会高一些:
Java大数据薪资:
Python大数据
再说一下Python语言,Python语言目前在大数据和人工智能领域有广泛的应用,原因就是Python语言简单、直接、方便。Python语言是脚本式语言,所以学习起来比较简单,脚本语言的天然属性就是直接,所以Python在语法结构上比Java要“轻”很多。
另外,由于Python有丰富的库支持,所以Python做软件开发也非常“直接”,程序员的作用有点像做“集成”的感觉。目前Python在Hadoop和Spark平台下的使用都非常普遍,而且越来越多的Java程序员转向使用Python,因为没人愿意复杂。
但是Python缺点也比较明显,那就是Python的性能远不及Java,另外与大数据平台的耦合度也不如Java好。但是如果你使用Python做算法实现、数据分析、数据呈现等应用是完全没有问题的,效率也比较高。
总之,如果做大数据开发,Java和Python最好都学习一下(主学Java),语言本身就是工具,学习起来并不是十分困难。