當前位置:首頁 » 操作系統 » hadoop權威指南源碼

hadoop權威指南源碼

發布時間: 2025-09-07 08:31:28

Ⅰ 如何使用Maven構建《hadoop權威指南3》隨書的源碼

《hadoop:the definitive guide 3th》中的例子默認提供了一種編譯和構建jar包方法——maven,如果沒有maven你會發現編譯測試隨書的源碼會非常的麻煩(至少在命令行下),當然你也可以使用eclipse導入隨書的源碼再自己一個個的添加依賴性jar包(恐怕也不太容易)。不過還好有非常好的開源的軟體項目管理工具來幫助我們做這些無關於程序本身設計與架構的瑣碎的工作,那就是maven!
如果你對maven還不太了解,可以參看這里。

《hadoop:the definitive guide 3th》的源碼包可以從github中下載到,如下圖所示:

下面我們就可以切換到本書的源文件包的根目錄下使用maven來構建本書的jar包了:
% mvn package -DskipTests -Dhadoop.version=1.0.4

執行過這條命令後就是很長時間的等待,maven會到他的中央倉庫和apache的倉庫中下載所需要的jar包和pom.xml文件(這個過程可能要持續大約一個小時,要確保你的電腦已經連上網路,下載完成後在~/.m2/repository文件夾中——也即本地倉庫——可以看到已經下載下來的jar包和pom文件),然後再逐個構建根目錄下pom.xml中配置的moles,等所有的工作做完就可以看到已經打包的各個jar包,從而可以很方便的在命令行使用hadoop命令測試書中的代碼了。

Ⅱ Hadoop 請教學習順序

雖然從事Hadoop方面工作,但是不是高手,畢竟只有一年經歷而已。
分享下本人的學習經歷吧。
了解Hadoop運行機制,可以學習Hadoop權威指南或者Hadoop實戰;
了解Hadoop運行流程,看懂HADOOP_HOME/bin/下面主要執行腳本
查看core-default.xml/hdfs-default.xml/mapred-default.xml等默認配置
文件,及core-site.xml/hdfs-site.xml/mapred-site.xml等相關文件,學會
如何進行參數優化,以及掌握如何配置讀取壓縮文件,默認的gzip,及
自定義的lzo,學會自定義Combiner/Patitioner等,掌握各種輸入輸出
格式的區別及應用場景,學會自定義輸入輸出格式,其次學習MapRece演算法
比如In-Map-Combing,相對頻度計算,Pairs演算法,Strips演算法等。掌握好
maprece編程
在這其中,需要好好閱讀HADOOP_HOME/src/目錄下的Hadoop源碼,
這個就是開源最大的好處。說的比較亂,但是就湊合著借鑒下吧

熱點內容
傳奇私人伺服器搭建需要什麼硬體 發布:2025-09-07 15:15:51 瀏覽:273
少兒編程培訓排行 發布:2025-09-07 15:14:20 瀏覽:361
中國版pc我的世界有什麼伺服器 發布:2025-09-07 15:14:17 瀏覽:75
blbl如何設置密碼 發布:2025-09-07 14:57:04 瀏覽:545
水粉解壓 發布:2025-09-07 14:56:16 瀏覽:260
松下編程入門 發布:2025-09-07 14:43:14 瀏覽:715
淘寶採集php 發布:2025-09-07 14:43:12 瀏覽:615
外國人財富密碼什麼意思 發布:2025-09-07 14:38:43 瀏覽:289
路由器配置備份文件怎麼查看 發布:2025-09-07 14:26:11 瀏覽:984
sql許可權控制 發布:2025-09-07 14:03:24 瀏覽:731