IntelliJ IDEA 遠端除錯Hadoop

阿新 • • 發佈：2019-01-03

開發環境 IntelliJ IDEA 2017.1.3

JDK VERSION jdk 1.8

Hadoop 版本 hadoop1.0.0

虛擬機器完全分散式

node1172.16.20.101 master

node2172.16.20.102 slave1

node3172.16.20.103 slave2

由於當前關於Hadoop2.x的書籍國內還是很少所以本人從hadoop1.x 開始入門推薦書籍《Hadoop 實戰》《Hadoop 權威指南》

Eclipse 網上有很多DFS外掛開發起來比較容易但是IDEA上的外掛比較少本文主要討論如何在IDEA上遠端除錯Hadoop

一、 Maven 構建 Hadoop開發環境

<!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-core -->
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-core</artifactId>
    <version>1.0.0</version>
</dependency>

二、新增配置檔案

直接從Master的 $HADOOP_HOME/conf 下拷貝

core-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/hadoop/tmp</value>
 
        <description>A base for other temporary directories. </description>
    </property>
<!-- file system properties  -->
<property>
        <name>fs.default.name</name>
        <value>hdfs://172.16.20.101:9000</value>
    </property>
</configuration>

mapred-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
    <property>
        <name>mapred.job.tracker</name>
        <value>http://172.16.20.101:9001</value>
    </property>
</configuration>

由於Hadoop在執行下面的程式碼時會自動載入classpath中shang's配置檔案

Configuration conf = new Configuration();

三、執行WordCount 例項

Hadoop example.jar 裡面直接拷貝程式碼並進行改寫

package com.hadoop.wordcount;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
import java.io.IOException;
import java.util.StringTokenizer;
/**
 * Created by nanzhou on 2017/9/13.
 */
public class WordCount {

    public static class TokenizerMapper
            extends Mapper<Object, Text, Text, IntWritable> {
        private static final IntWritable one = new IntWritable(1);
        private Text word = new Text();
        public void map(Object key, Text value, Mapper<Object, Text, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
            StringTokenizer itr = new StringTokenizer(value.toString());
            while (itr.hasMoreTokens()) {
                this.word.set(itr.nextToken());
context.write(this.word, one);
}
        }
    }

    public static class IntSumReducer
            extends Reducer<Text, IntWritable, Text, IntWritable> {
        private IntWritable result = new IntWritable();
        public void reduce(Text key, Iterable<IntWritable> values, Reducer<Text, IntWritable, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
            int sum = 0;
            for (IntWritable val : values) {
                sum += val.get();
}
            this.result.set(sum);
context.write(key, this.result);
}
    }

    public static void main(String[] args)
            throws Exception {
        Configuration conf = new Configuration();
String[] ioArgs = new String[]{"/user/hadoop/input", "/user/hadoop/output"};
String[] otherArgs = new GenericOptionsParser(conf, ioArgs).getRemainingArgs();
        if (otherArgs.length != 2) {
            System.err.println("Usage: wordcount <in> <out>");
System.exit(2);
}
        JobConf jobConf = new JobConf();
jobConf.setJar("/Applications/file/work/JavaProject/hadoopbasic/target/hadoop-basic-1.0-SNAPSHOT.jar");
Job job = new Job(jobConf, "word count");
job.setJarByClass(WordCount.class);
job.setMapperClass(TokenizerMapper.class);
job.setCombinerClass(IntSumReducer.class);
job.setReducerClass(IntSumReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
FileInputFormat.addInputPath(job, new Path(otherArgs[0]));
FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));
System.exit(job.waitForCompletion(true) ? 0 : 1);
}
}

NOTICE：

（1）很多在本地搭建執行Hadoop會出現許可權的問題解決方法有兩種

<1> 將自己的使用者名稱改為 Hadoop上的使用者名稱列如hadoop

<2> 更改配置hdfs-site.xml

<property> 
<name>dfs.permissions</name> 
<value>true</value> 
</property>

(2) 執行MapReduce時會出現 Map以及Reduce class not found的情況

需要程式碼上加上 JobConf 配置指定本地Jar包的地址就可以實現Eclipse外掛 Run on hadoop 的作用

執行時需要利用Maven 重新 install 工程

本文原始碼地址 https://github.com/stupidcupid/hadoop-1.x

IntelliJ IDEA 遠端除錯Hadoop

開發環境 IntelliJ IDEA 2017.1.3 JDK VERSION jdk 1.8 Hadoop 版本 hadoop1.0.0 虛擬機器完全分散式 node1172.16.20.101 master node2172.16.20.102 sl

通過Idea遠端除錯Hadoop叢集

早期的開發中經常用eclipse遠端除錯Hadoop叢集，近期Idea的市場佔有率逐漸增加，本文介紹如何在通過Idea遠端除錯Hadoop叢集。一、工程截圖二、操作流程 Idea中新建專案將h

IntelliJ IDEA遠端除錯Tomcat

博主說在除錯程式碼的過程中，為了更好的定位及解決問題，有時候需要我們使用遠端除錯的方法。在本文中，就讓我們一起來看看，如何利用 IntelliJ IDEA 進行遠端 Tomcat 除錯的配置。服務端Tomcat配置（Linux）進入服務端Tomc

[IDE][IDEA小技巧系列]Intellij IDEA遠端除錯

配置 idea Edit Configurations 從左側新增一個Remote 新增完畢後在右側的設定位 Command Line arguments for running remote JVM需要進行設定 -agentlib:jdwp=transport

Intellij IDEA遠端向hadoop叢集提交mapreduce作業

說明安裝配置 1、首先將叢集上的hadoop環境下載到本地，本文是下載到“E:\javaws”。 2、在本地配置環境變數 HADOOP_HOME=D:\yangjm\Code\study\hadoop\hadoop-2.6.0 HADOOP_B

簡單明瞭IntelliJ IDEA 遠端除錯 Tomcat 的方法

首先，配置remote：點選Edit Configurations，進入如下介面：我們進入了Run/Debug Configurations介面，然後點選左上角的+，選擇Remote：標註 3：除錯模式，預設為Attach；標註 4

12--配置IDEA遠端除錯Hadoop程式（Hadoop HA下）

public class MyUtils { public static void deleteDir(Configuration conf, String dirPath) throws IOException{ FileSystem fs=FileSystem.get(conf)

IntelliJ Idea 遠端除錯Java服務

1、背景在很多情況下，服務端程式部署在遠端，某部分邏輯出現問題時，不停地對程式碼修改，增加log查出問題根源。但是，有些服務啟動時間較長、不斷的打包、上傳、測試會令人非常頭疼。因此，可以使用遠端除錯的方式對遠端部署的服務除錯。 2、準備 idea ID

intellij IDEA下遠端除錯hadoop

test: [exec] deploy jar [exec] deploy run.sh [exec] change authority [exec] start run.sh [exec] add jar to classpath [exec] r

在阿里雲伺服器上快速搭建JavaWeb環境（安裝JDK、Tomcat、MySQL）+Intellij IDEA遠端部署除錯tomcat

首先介紹一下我的的伺服器的系統是Ubuntu 16.04 64位 ide用了Intellij IDEA JDK8 Tomcat8 MySQL5.7 一、先下載JDK 8 1、JDK8 # sudo apt-get install openjdk-8

IntelliJ IDEA遠端連線tomcat，實現單步除錯

web專案部署到tomcat上之後，有時需要打斷點單步除錯，如果用的是Intellij idea，可以通過如下方法實現：開啟de

【Java】使用IDEA遠端除錯Java程式碼【Java】Maven Tomcat外掛使用

概述　　服務端程式執行在一臺遠端伺服器上，我們可以在本地服務端的程式碼（前提是本地的程式碼必須和遠端伺服器執行的程式碼一致）中設定斷點，每當有請求到遠端伺服器時時能夠在本地知道遠端服務端的此時的內部狀態測試專案　　建立方式參考：【Java】Maven Tomcat外掛使用　　專案中新增了一個測

IntelliJ IDEA debug 除錯開啟 Evaluate Expression計算表示式視窗

在用IDEA debug除錯的時候，當需要動態檢視某一個值的時候，就需要用到計算表示式視窗當debug選中某一行的時候，按快捷鍵 Alt + F8 就可以開啟Evaluate Expression計算表示式視窗如下：然後就可以在輸入框中輸入物件，檢視具體的值！原地址：

Intellij IDEA Debug 除錯技巧

F9：恢復程式 Alt+F10：顯示執行斷點 F8：跳到下一步 F7：進入到程式碼 Alt+shift+F7：強制進入程式碼 Shift+F8：跳到下一個斷點 Atl+F9：執行到游標處 ctrl+shift+F9：debug執行java類 ctrl+shift+F10：正常執行

idea遠端除錯jar包

1 伺服器啟動jar包（監聽埠5005）　　java -Xdebug -Xrunjdwp:transport=dt_socket,address=5005,server=y,suspend=y -jar xxxxxx.jar 2配置idea 　　-agentlib:jdwp=tran

IDEA遠端除錯tomcat

所謂的遠端除錯的意思就是IDEA安裝在開發者本機，tomcat安裝在遠端伺服器，程式碼則包含兩份，打包後的在tomcat的webapps目錄下，原始碼在IDEA上，在原始碼上加斷點，可以直接除錯tomcat下打包專案 1.以除錯選項啟動tomcat 開啟catalina.

idea遠端除錯spark任務

1.在idea 新建Remote 2.spark任務提交，監聽啟動 spark2-submit --master yarn --deploy-mode client --class com.my.ba

如何使用IDEA遠端除錯跳板機背後的Java服務

如果可以除錯執行在跳板機(防火牆)後的Java服務，那麼可快速定位Java服務問題的本質原因，從而解決這個問題。本篇分享的就是這樣的一個方法。背景開發微信生態的後臺服務時，要求後臺服務必須部署在公網可訪問的伺服器上。這就要求我們在本機開發，然後在公網部署。為了定位問題

springboot專案利用Idea遠端除錯

首先，啟動命令需要帶上引數 java -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=留給遠端除錯工具的埠 -jar 你得程式jar包案例： java -Xdebug -Xrunjdwp:tran

IDEA遠端除錯Jetty

專案中，使用Jetty9作為web容器，在測試環境中釋出了程式碼，發生了bug，追查起來還是比較麻煩的，於是就想到了遠端除錯。進行遠端除錯分兩步： Jetty服務端配置專案中使用了jetty9，啟動引數都在start.ini檔案裡，修改此檔案，加入

IntelliJ IDEA 遠端除錯Hadoop

相關推薦