´óÊý¾Ý¼¼ÊõÔ­Àí¼°Ó¦ÓÃÁÖ×ÓÓê°æ¿ÎºóϰÌâ´ð°¸½âÎö - ͼÎÄ ÏÂÔØ±¾ÎÄ

***

רҵ×ÊÁÏÕûÀí·ÖÏí

Common Avro

CommeoÊÇn Ϊ HadoopÆäËû×ÓÏîÄ¿Ìṩ֧³ÖµÄ³£Óù¤¾ß£¬Ö÷Òª°üÀ¨Îļþϵͳ¡¢ ºÍ´®Ðл¯¿â

RPC

Avro ÊÇΪ HadoopµÄ×ÓÏîÄ¿£¬ÓÃÓÚÊý¾ÝÐòÁл¯µÄϵͳ£¬ÌṩÁ˷ḻµÄÊý¾Ý½á¹¹Àà ÐÍ¡¢¿ìËÙ¿ÉѹËõµÄ¶þ½øÖÆÊý¾Ý¸ñʽ¡¢ ´æ´¢³ÖÐøÐÔÊý¾ÝµÄÎļþ¼¯¡¢ Ô¶³Ìµ÷ÓõŦÄÜ ºÍ¼òµ¥µÄ¶¯Ì¬ÓïÑÔ¼¯³É¹¦ÄÜ¡£

HDFSÊÇ HadoopÏîÄ¿µÄÁ½¸öºËÐÄÖ®Ò»£¬ËüÊÇÕë¶Ô¹È¸èÎļþϵͳµÄ¿ªÔ´ÊµÏÖ¡£

HBaseÊÇÒ»¸öÌá¸ß¿É¿¿ÐÔ¡¢¸ßÐÔÄÜ¡¢¿ÉÉìËõ¡¢ÊµÊ±¶Áд¡¢·Ö²¼Ê½µÄÁÐʽÊý¾Ý¿â£¬ Ò»°ã²ÉÓà HDFS×÷ΪÆäµ×²ãÊý¾Ý´æ´¢¡£

MapReduceÊÇÕë¶Ô¹È¸è MapReduceµÄ¿ªÔ´ÊµÏÖ£¬ÓÃÓÚ´ó¹æÄ£Êý¾Ý¼¯µÄ²¢ÐÐÔËËã¡£

Zoookepper ÊÇÕë¶Ô¹È¸è ChubbyµÄÒ»¸ö¿ªÔ´ÊµÏÖ£¬ÊǸßЧºÍ¿É¿¿µÄЭͬ¹¤×÷ϵͳ£¬ Ìṩ·Ö²¼Ê½ËøÖ®ÀàµÄ»ù±¾·þÎñ£¬ ÓÃÓÚ¹¹½¨·Ö²¼Ê½Ó¦Ó㬠¼õÇá·Ö²¼Ê½Ó¦ÓóÌÐòËù³Ð µ£µÄЭµ÷ÈÎÎñ¡£

Hive ÊÇÒ»¸ö»ùÓÚ HadoopµÄÊý¾Ý²Ö¿â¹¤¾ß£¬¿ÉÒÔÓÃÓÚ¶Ô HadoopÎļþÖеÄÊý¾Ý¼¯ ½øÐÐÊý¾ÝÕûÀí¡¢ÌØÊâ²éѯºÍ·Ö²¼´æ´¢¡£

Pig ÊÇÒ»ÖÖÊý¾ÝÁ÷ÓïÑÔºÍÔËÐл·¾³£¬ ÊʺÏÓÚʹÓà HadoopºÍ MapReducceƽ̨Éϲé ѯ´óÐͰë½á¹¹»¯Êý¾Ý¼¯¡£

Sqoop¿ÉÒԸĽøÊý¾ÝµÄ»¥²Ù×÷ÐÔ£¬ Ö÷ÒªÓÃÀ´ÔÚ H´óŶŶŶÅäºÏ¹ØÏµÊý¾Ý¿âÖ®¼ä½»

ÍêÃÀ WORD¸ñʽ±à¼­

***

***

רҵ×ÊÁÏÕûÀí·ÖÏí

»»Êý¾Ý¡£

ChukwaÊÇÒ»¸ö¿ªÔ´µÄ¡¢ÓÃÓÚ¼à¿Ø´óÐÍ·Ö²¼Ê½ÏµÍ³µÄÊý¾ÝÊÕ¼¯ÏµÍ³£¬¿ÉÒÔ½«¸÷ÖÖ ÀàÐ͵ÄÊý¾ÝÊÕ¼¯³ÉÊÊºÏ Hadoop´¦ÀíµÄÎļþ£¬²¢±£´æÔÚ HDFSÖй© Hadoop½øÐи÷ ÖÖ MapReduce²Ù×÷¡£

µÚÈýÕÂ

1£®ÊÔÊö·Ö²¼Ê½ÎļþϵͳÉè¼ÆµÄÐèÇó¡£ Éè¼ÆÐèÇó ͸Ã÷ÐÔ

º¬Òå

¾ß±¸·ÃÎÊ͸Ã÷ÐÔ¡¢Î»ÖÃ͸ Ã÷ÐÔ¡¢ÐÔÄÜ¡¢ºÍÉìËõ͸Ã÷ ÐÔ

HDFSµÄʵÏÖÇé¿ö Ö»ÄÜÌṩһ¶¨³Ì¶ÈµÄ·Ã ÎÊ͸Ã÷ÐÔ£¬Íêȫ֧³ÖλÖà ͸Ã÷ÐÔ¡¢ÐÔÄܺÍÉìËõ͸Ã÷ ÐÔ

²¢·¢¿ØÖÆ

¿Í»§¶Ë¶ÔÓÚÎļþµÄ¶Áд ²»Ó¦¸ÃÓ°ÏìÆäËû¿Í»§¶Ë ¶Ôͬһ¸öÎļþµÄ¶Áд

Îļþ¸´ÖÆ

Ò»¸öÎļþ¿ÉÒÔÓµÓв»Í¬

HDFS²ÉÓÃÁ˶ั±¾»úÖÆ

λÖõĶà¸ö¸±±¾

Ó²¼þºÍ²Ù×÷ϵͳµÄÒì¹¹ ÐÔ

¿ÉÒÔÔÚ²»Í¬µÄ²Ù×÷ϵͳ

²ÉÓà Java ÓïÑÔ¿ª·¢£¬¾ß

ºÍ¼ÆËã»úÉÏʵÏÖͬÑùµÄ ¿Í»§¶ËºÍ·þÎñ¶Ë³ÌÐò

¿ÉÉìËõÐÔ

Ö§³Ö½ÚµãµÄ¶¯Ì¬¼ÓÈë»ò Í˳ö

½¨Á¢ÔÚ´ó¹æÄ£Á®¼Û»úÆ÷

Éϵķֲ¼Ê½Îļþϵͳ¼¯ Ⱥ£¬¾ßÓкܺõÄÉìËõÐÔ

ÍêÃÀ WORD¸ñʽ±à¼­

***

»úÖÆ·Ç³£¼òµ¥£¬ÈκÎʱºò ¶¼Ö»ÔÊÐíÓÐÒ»¸ö³ÌÐòд Èëij¸öÎļþ

ÓÐºÜºÃµÄ¿çÆ½Ì¨ÄÜÁ¦

***

רҵ×ÊÁÏÕûÀí·ÖÏí

ÈÝ´í ±£Ö¤Îļþ·þÎñÔÚ¿Í»§¶Ë »òÕß·þÎñ¶Ë³öÏÖÎÊÌâµÄ ʱºòÄÜÕý³£Ê¹ÓÃ

¾ßÓжั±¾»úÖÆºÍ¹ÊÕÏ ×Ô¶¯¼ì²â¡¢»Ö¸´»úÖÆ

°²È« ±£Ö¤ÏµÍ³µÄ°²È«ÐÔ °²È«ÐÔ½ÏÈõ

2£®·Ö²¼Ê½ÎļþϵͳÊÇÈçºÎʵÏֽϸßˮƽÀ©Õ¹µÄ£¿

·Ö²¼Ê½ÎļþϵͳÔÚÎïÀí½á¹¹ÉÏÊÇÓɼÆËã»ú¼¯ÈºÖеĶà¸ö½Úµã¹¹³ÉµÄ£¬

ÕâЩ½Úµã·Ö

ΪÁ½À࣬һÀà½Ð¡°Ö÷½Úµã¡±(Master Node)»òÕßÒ²±»³ÆÎª ¡°Ãû³Æ½áµã¡±(NameNode)£¬ ÁíÒ»Àà½Ð¡°´Ó½Úµã¡±£¨ Slave Node £©»òÕßÒ²±»³ÆÎª¡°Êý¾Ý½Úµã¡± (DataNode)

3£®ÊÔÊö HDFSÖеĿéºÍÆÕͨÎļþϵͳÖеĿéµÄÇø±ð¡£

´ð£ºÔÚ´«Í³µÄÎļþϵͳÖУ¬ÎªÁËÌá¸ß´ÅÅ̶ÁдЧÂÊ£¬Ò»°ãÒÔÊý¾Ý¿éΪµ¥Î»£¬¶ñÈç ²»ÊÇÒÔ×Ö½ÚΪµ¥Î»¡£

HDFSÖеĿ飬ĬÈÏÒ»¸ö¿é´óСΪ 64MB£¬¶øHDFSÖеÄÎļþ»á±»²ð·Ö³É¶à¸ö¿é£¬ ÿ¸ö¿é×÷Ϊ¶ÀÁ¢µÄµ¥Ôª½øÐд洢¡£ HDFSÔÚ¿éµÄ´óСµÄÉè¼ÆÉÏÃ÷ÏÔÒª´óÓÚÆÕͨÎÄ ¼þϵͳ¡£

4£®ÊÔÊö HDFSÖеÄÃû³Æ½ÚµãºÍÊý¾Ý½ÚµãµÄ¾ßÌ幦ÄÜ¡£ ´ð£ºÃû³Æ½Úµã¸ºÔð¹ÜÀí·Ö²¼Ê½ÎļþϵͳϵͳµÄÃüÃû¿Õ¼ä£¬ µÄÿ¸öÎļþÖи÷¸ö¿éËùÔÚµÄÊý¾Ý½ÚµãµÄλÖÃÐÅÏ¢£»

Êý¾Ý½ÚµãÊÇ·Ö²¼Ê½Îļþϵͳ HDFSµÄ¹¤×÷½Úµã£¬¸ºÔðÊý¾ÝµÄ´æ´¢ºÍ¶ÁÈ¡£¬»á ¸ù¾Ý¿Í»§¶Ë»òÕßÊÇÃû³Æ½ÚµãµÄµ÷¶ÈÀ´½øÐÐÊý¾ÝµÄ´æ´¢ºÍ¼ìË÷£¬ ·¢ËÍ×Ô¼ºËù´æ´¢µÄ¿éµÄÁÐ±í¡£

²¢ÏòÃû³Æ½Úµã¶¨ÆÚ ¼Ç¼·Ö²¼Ê½ÎļþϵͳÖÐ

hadoop fs -ls ÏÔʾָ¶¨µÄÎļþµÄÏêϸÐÅÏ¢

ÍêÃÀ WORD¸ñʽ±à¼­

***

***

רҵ×ÊÁÏÕûÀí·ÖÏí

hadoop fs -cat

½«Ö¸¶¨µÄÎļþµÄÄÚÈÝÊä³öµ½±ê×¼Êä³ö

hadoop fs -mkdir ´´½¨Ö¸¶¨µÄÎļþ¼Ð

hadoop fs -get [-ignorecrc] [-crc]

µ½±¾µØÎļþϵͳ Ö¸¶¨µÄÎļþ»òÎļþ¼Ð¡£ -ignorecrc Ñéʧ°ÜµÄÎļþ¡£Ê¹Óà -crc Ñ¡Ïî¸´ÖÆÎļþÒÔ¼° CRCÐÅÏ¢¡£

¸´ÖÆÖ¸¶¨µÄÎļþ Ñ¡Ïî¸´ÖÆ CRCУ

hadoop fs -put ´Ó±¾µØÎļþϵͳÖи´ÖÆ Ö¸¶¨µÄµ¥

¸ö»ò¶à¸öÔ´Îļþµ½ Ö¸¶¨µÄÄ¿±êÎļþϵͳÖС£ Ò²Ö§³Ö´Ó±ê×¼ÊäÈë (stdin) ÖжÁ È¡ÊäÈëдÈëÄ¿±êÎļþϵͳ¡£

hadoop fs -rmr ɾ³ýÖ¸¶¨µÄÎļþ¼Ð¼°ÆäµÄËùÓÐÎļþ

µÚËÄÕÂ

17. ÊÔÊöÔÚ HadoopÌåϵ¼Ü¹¹ÖÐ HBaseÓëÆäËû×é³É²¿·ÖµÄÏ໥¹ØÏµ¡£

´ð£º HBaseÀûÓà Hadoop MapReduceÀ´´¦Àí HBaseÖеĺ£Á¿Êý¾Ý£¬ÊµÏÖ¸ßÐÔÄÜ¼Æ Ë㣻ÀûÓà Zookeeper ×÷ΪЭͬ·þÎñ£¬ÊµÏÖÎȶ¨·þÎñºÍʧ°Ü»Ö¸´£»Ê¹Óà ¸ß¿É¿¿µÄµ×²ã´æ´¢£¬ÀûÓÃÁ®¼Û¼¯ÈºÌṩº£Á¿Êý¾Ý´æ´¢ÄÜÁ¦

HDFS×÷Ϊ

; SqoopΪHBaseµÄµ×

²ãÊý¾Ýµ¼È빦ÄÜ£¬Pig ºÍ Hive Ϊ HBaseÌṩÁ˸߲ãÓïÑÔÖ§³Ö£¬ HBaseÊÇ BigTable µÄ¿ªÔ´ÊµÏÖ¡£

ÍêÃÀ WORD¸ñʽ±à¼­

***