Cloudera PvC ์ค์น ํ์ Cloudera Manager Console์์ ์ด๊ธฐ ์ค์ ํ ๋ด์ฉ์ ์ค๋ช ํฉ๋๋ค.
// Cloudera Manager Admin Console Language ์ค์
๋ธ๋ผ์ฐ์ ์ ์ธ์ด ์ค์ ์ ๋ฐ๋ฆ(์์ด๋ก ์ค์ )
Firefox๋ ์ค์ --> ์ผ๋ฐ --> ์ธ์ด์ ๋ชจ์ --> ์ธ์ด --> ์์ด --> ์ฌ์์
Chrome๋ ์ค์ --> ๊ณ ๊ธ --> ์ธ์ด --> ์ธ์ด --> ์์ด --> ๊ฐ์ฅ ์๋ก ์ด๋
// Cloudera Hosts JAVA Home Directory ์ค์ ๋ณ๊ฒฝ(Managed JDK๋ฅผ ์ ํํ ๊ฒฝ์ฐ)
Hosts > Hosts Configuration > Advanced(Java Home Directory)
Java Home Directory์ ์๋ฒ์ JAVA_HOME ๋๋ ํ ๋ฆฌ(/usr/java/jdk1.8) ์ค์
ํ์์ Cloudera Manager ๋ฅผ ์ฌ์คํ
// Cloudera Cluster ํ๊ฒฝ Security ์ค์
Enable Auto-TLS setup // ์น ๋ก๊ทธ์ธ์ http๊ฐ ์๋ https๋ก ์ค์
Kerberos ๊ธฐ๋ฐ KDC setup // kerberos ๊ธฐ๋ฐ authetication์ ์ํ ์ค์
// Cloudera Manager Admin Console์์ Cluster ์ถ๊ฐ
๋ธ๋ผ์ฐ์ ๋ก Cloudera Manager Admin Console ์๋ฒ ์ ์(default 7180 ํฌํธ) : http://cms.futuresoft.co.kr:7180
Add Cluster --> Welcome --> AutoTLS setup, Keberos KDC setup --> Continue
Cluster Basics --> Cluster Name(HadoopCluster), Basic Cluster --> Continue
Specify Hosts --> 3๋ ์ด์์ Linux ์๋ฒ FQDN worker1.futuresoft.co.kr ํ์(๊ณต๋ฐฑ ๊ตฌ๋ถ) --> ๊ฒ์ --> ์ค์น๋์ hosts ์ ํ --> ๊ณ์
Select Repository --> Agent/Public Cloudera Repository or Custom Repository(Local Repository), CDH/Use Parcels(Recommneded) --> Continue
Select JDK(Manually Managed JDK) --> Continue
Enter Login Credentials --> Login to All Hosts As : Another user, Authetication Method/All hosts accept same private key --> Choose File --> Continue
(ํ์ผ ์ ํ์ฐฝ์์ ์ค์น ๊ณ์ ์ ์จ๊น ํด๋ .ssh ํด๋์ ์์ฑํ ssh private key id_rsa๋ฅผ ์ ํ)
Install Agents(Repository์์ ๋์ ์๋ฒ์ Agent ์ค์น, ์คํจ์ Admin console ํ์ธ) --> Continue
Install Parcels(๋์ ์๋ฒ์ Parcels์ ๋ค์ด๋ก๋ํด์ ๋ณต์ฌ, parcel ๋ค์ด๋ก๋์ ์ ๋ Cloudera Manager ์๋ฒ๋ฅผ ๊ฑด๋๋ฆฌ์ง ๋ง๊ฒ) --> Continue
Inspect Cluter(Cluster hosts ๋ค์ ๋ํด Inspect Network Performance/Inspect Hosts ์ํ) --> Continue
Hosts Role Configuration --> ๊ธฐํ ๋ง๋ฌด๋ฆฌ ๋ฑ๋ก --> Cluster ์๋ ์คํ -->
Cloudera Manager Admin Console๋ก Cluster ์ํ ๊ด๋ฆฌ
// Hosts์ Role Assign ์ฐธ๊ณ ์ฌํญ
Oozie ์๋ฒ์๋ ๋ฐ๋์ Spark Gateway role์ด ์์ด์ผํจ
ํน์ ์๋น์ค๋ฅผ ์ด์ฉํ๋ ค๋ ์๋ฒ์๋ ํด๋น ์๋น์ค์ gateway role์ ๋ถ์ฌํด์ผ๋จ
๋ง์ฝ ์ค์น ์ค ๋ธ๋ผ์ฐ์ ์์ ์ด์ ๊ณผ์ ์ผ๋ก ๊ฐ๋ค ๋ค์ ์ค๋ ๊ฒฝ์ฐ Namenode์ /data/dfs ํด๋๋ฅผ ์ง์์ฃผ์ด์ผ ํจ
์ค์น์ค ์ด๋ฏธ /data/dfs ํด๋๊ฐ ์๋ ๊ฒฝ์ฐ NameNode Format์ ์คํจํจ(์ญ์ ํ ์งํ)
// Kudu Required Parameters // ์๋์ ๊ฐ์ด ์ค์ ํ๋ค.
Kudu Master WAL Directory:
/data/kudu/master_wal
Kudu Master Data Directories
/data/kudu/master_data
Kudu Tablet Server WAL Directory
/data1/kudu/tablet_wal
Kudu Tablet Server Data Directories
/data1/kudu/tablet_data
/data2/kudu/tablet_data
/data3/kudu/tablet_data
// hdfs replication factor ์กฐ์
hdfs dfs -setrep -R 3 / hdfs root ๋๋ ํ ๋ฆฌ์ replication factor๋ฅผ 1๋ก ์ค์ (node ์์ ๋ง๊ฒ ์กฐ์ - default 3)
// HDFS์ Linux ์ฌ์ฉ์์ ๋ํ ํ ๋๋ ํ ๋ฆฌ ์์ฑ ๋ฐ ๊ถํ๋ถ์ฌ(์ด๊ธฐ ์์ฑ - hdfs ๊ถํ์ผ๋ก)
HDFS user ์์ฑ ๋ฐ๊ถํ ์ค์ : ์ด๊ธฐ์ Linux ๋ก๊ทธ์ธ ๊ณ์ ์ ๋ํ HDFS user ํด๋์ ๊ถํ์ด ์์
- ์ด๊ธฐ์ Linux ์ฌ์ฉ์์ ๋ํ hdfs ํ ๋๋ ํ ๋ฆฌ(/user/home_directory)๋ฅผ ๋ง๋ค๊ณ ๊ถํ์ ์ฃผ์ง ์์ผ๋ฉด hdfs ๋ช ๋ น permission ์ค๋ฅ
- sudo -u hdfs hdfs dfs -mkdir /user/hadoop // Linux hadoop ๊ณ์ ์ ๋ํ hdfs ํ ๋๋ ํ ๋ฆฌ ์์ฑ
- sudo -u hdfs hdfs dfs -chown hadoop /user/hadoop // Linux hadoop ๊ณ์ ์ hdfs /user/hadoop ๋๋ ํ ๋ฆฌ ๊ถํ ๋ถ์ฌ
// HDFS superuser group(default๋ super group) ํ์ธ ๋ฐ ์ค์ (hadoop ๊ณ์ ์ HDFS super user ๊ทธ๋ฃน ๊ถํ ๋ถ์ฌ)
hdfs dfs -mkdir /test // hdfs root์ test ๋๋ ํ ๋ฆฌ ์์ฑ. ๊ถํ์ด ์์ด์ Permission denied ์ค๋ฅ ๋ฐ์(superuser group ๋ฑ๋ก ํ์)
hdfs --> configuration --> dfs.permissions.supergroup --> "supergroup" (default HDFS superuser group ๊ทธ๋ฃน๋ช ํ์ธ)
NameNode ํธ์คํธ๋ก ssh ๋ก๊ทธ์ธ(namenode์์ HDFS์ ์ค์ ๋ supergroup ๋ช ์ ๊ทธ๋ฃน์ ์์ฑํ๊ณ , ๊ณ์ ์ ์ถ๊ฐ)
sudo groupadd supergroup // supergroup ์์ฑ
ssh hadoop@master1 sudo /usr/sbin/groupadd supergroup //master1 ์๋ฒ(Namenode)์ hadoop ๊ณ์ ์ผ๋ก ์๊ฒฉ ์ ์ํด์ ๊ทธ๋ฃน ์ถ๊ฐ
sudo /usr/sbin/usermod -aG supergroup hadoop // hadoop ๊ณ์ ์ supergroup๋ก ์ถ๊ฐ
ssh hadoop@master1 sudo /usr/sbin/usermod -aG supergroup hadoop // master1(Namenode) server์ ์๊ฒฉ ์ ์ํด์ ์ค์ก
groups hadoop // hadoop ๊ณ์ ์ด ์ํ group ํ์(hadoop wheel supergroup)
ssh hadoop@master1 groups hadoop // master1(Namenode) ์๋ฒ์ ssh๋ก ์ ๊ทผํด์ group ์ค์ ํ์ธ
hdfs dfsadmin -refreshUserToGroupsMappings // HDFS user์ group ๋งคํ cache ์ ๋ณด๋ฅผ refresh
hdfs dfs -mkdir /test // HDFS root ๋๋ ํ ๋ฆฌ์ test ๋๋ ํ ๋ฆฌ ์์ฑ๋จ
hdfs dfs -rm -r -skipTrash /test // ์์ฑํ test ๋๋ ํ ๋ฆฌ๋ฅผ ์ญ์ ํจ(ํด์งํต์ ๋ฃ์ง์๊ณ ์ญ์ )