spark是啥 想自學大數(shù)據(jù),不知道從哪里學起,有什么書籍和學習路線推薦么?
想自學大數(shù)據(jù),不知道從哪里學起,有什么書籍和學習路線推薦么?謝謝!筆者剛剛簽了一份大數(shù)據(jù)挖掘工程師的合同,到了研究生階段才轉(zhuǎn)向大數(shù)據(jù)方向。目前大數(shù)據(jù)火爆,很多學生都想上交,但自學的學習路線因人而異。以
想自學大數(shù)據(jù),不知道從哪里學起,有什么書籍和學習路線推薦么?
謝謝!筆者剛剛簽了一份大數(shù)據(jù)挖掘工程師的合同,到了研究生階段才轉(zhuǎn)向大數(shù)據(jù)方向。目前大數(shù)據(jù)火爆,很多學生都想上交,但自學的學習路線因人而異。
以我自己為例,作者出生于Python數(shù)據(jù)分析領(lǐng)域,具有通用編程能力。因此,在此基礎(chǔ)上,他首先學習了Linux的基本操作命令,安裝了Ubuntu的雙系統(tǒng),并進一步安裝了Hadoop和spark組件。在此基礎(chǔ)上,他利用pypark操作spark大數(shù)據(jù)框架進行學習。您可以推薦以下書籍:
pypark實用指南
,由淺入深,非常好用。