学生党会java,如何学习大数据开发?


如果电脑性能足够ok的话,那就在电脑上玩,装个vmware,或者virtualbox,自己鼓捣着玩如果电脑性能不够好的话,去阿里云自己买个主机去,学生价十分优惠,或者什么新浪云啊,腾讯云啊,哪个便宜玩那个。只会java,不知道你java掌握的怎么样,但是你想用java玩大数据呢,其实是最好的因为想hadoop这种大数据处理工具都是java写的,无缝结合。不知道你数据库会不会啊,不会其实也没太大关系,但你最好会,这是基础的东西从hadoop家族开始学吧,先学zookeeper,然后学下hadoop中的序列化工具avro,rpc远程调用协议你要看看,你也可以额外看看dubbo,dubbox,然后学hadoop,重点学mapreduce,还有就是hdfs。mapreduce的设计原理,以及hdfs的读写底层hadoop是怎么实现的,这些都要好好看看。然后日志工具flume,扇入扇出怎么玩,怎么配置,hive数据仓库,这个我觉得可以重点看看,因为大数据有相关职位叫做ETL工程师。还有hadoop的性能调优什么的也最好看看,也有对应职位,比如bat的hadoop运维什么的,虽然现在云很火,但是还是有不少公司没有用云,而是自己整的服务器。还有hbase,大数据中最常用的非关系型数据库,kafka做大数据方面的消息队列,看完Kafka之后就要看storm了,在线流式处理数据的一个工具。。。。算了先说这么多吧,免得专业性名词太多打消你的积极性这些东西你要是想真的学的很好,够你花费大量时间去鼓捣了。但愿你不会调配置文件调到吐血三升。最后给你们干货,大数据资料,想要的就私信我吧。我不是大神,只是一名喜欢技术的程序员,全心敲代码,天道自酬勤,希望可以和你们一起交流。

可以的,大数据的很多优秀框架都有单机模式。另外,如果笔记本内存很大(16g),可以装一个sandbox,里面有已经ok的环境

有java基础学习大数据相对上手更容易一些,海牛部落可以提供学习资料和学习视频帮助你自学!