中文在线免费看视频_国产成人精品亚洲日本在线观看_亚洲精品第一综合99久久_国产亚洲精品日韩综合网

當(dāng)前位置: 首頁(yè) / 技術(shù)干貨 / 正文
MapReduce的運(yùn)行流程(一)

2022-11-17

計(jì)算 數(shù)據(jù) 分布式 mapreduce

  為什么要學(xué)習(xí)MapReduce

  2004年,谷歌發(fā)表了一篇名為《MapReduce》的論文,主要介紹了如何在分布式的存儲(chǔ)系統(tǒng)上對(duì)數(shù)據(jù)進(jìn)行高效率的計(jì)算。2005年,Nutch團(tuán)隊(duì)使用Java語(yǔ)言實(shí)現(xiàn)了這個(gè)技術(shù),并命名為MapReduce。時(shí)至今日,MapReduce是Apache Hadoop的核心模塊之一,是運(yùn)行在HDFS上的分布式運(yùn)算程序的編程框架,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。其中的概念,"Map(映射)"和"Reduce(歸約)",是它們的主要思想,都是從函數(shù)式編程語(yǔ)言里借來的,還有從矢量編程語(yǔ)言里借來的特性。

  在過去的很長(zhǎng)一段時(shí)間里,CPU的性能都會(huì)遵循”摩爾定律“,在性能上每隔18個(gè)月左右就是提高一倍。那個(gè)時(shí)候,不需要對(duì)程序做任何改變,僅僅通過使用更優(yōu)秀的CPU,就可以進(jìn)行性能提升。但是現(xiàn)在,在CPU性能提升的道路上,人類已經(jīng)到達(dá)了制作工藝的瓶頸,因此,我們不能再把希望寄托在性能更高的CPU身上了。

  現(xiàn)在這個(gè)時(shí)候,大規(guī)模數(shù)據(jù)存儲(chǔ)在分布式文件系統(tǒng)上,人們也開始采用分布式并行編程來提高程序的性能。分布式程序運(yùn)行在大規(guī)模計(jì)算機(jī)集群上,集群是大量的廉價(jià)服務(wù)器,可以并行執(zhí)行大規(guī)模數(shù)據(jù)處理任務(wù),這樣就獲得了海量的計(jì)算能力

  分布式并行編程比傳統(tǒng)的程序有明顯的區(qū)別,它運(yùn)行在大量計(jì)算機(jī)構(gòu)成的集群上,可以充分利用集群的并行處理能力;同時(shí),通過向集群中增加新的計(jì)算節(jié)點(diǎn),就可以很容易的實(shí)現(xiàn)集群計(jì)算能力的擴(kuò)展。

  MapReduce主要解決的是分布式文件存儲(chǔ)系統(tǒng)上,數(shù)據(jù)的分布式計(jì)算的問題。在上述導(dǎo)讀部分我們介紹過一個(gè)WordCount的案例,就是一個(gè)非常典型的分布式計(jì)算的案例。如果我們將所有的需要處理的數(shù)據(jù)移動(dòng)到一個(gè)節(jié)點(diǎn)上進(jìn)行處理,那么只是在數(shù)據(jù)傳輸?shù)倪^程中就得消耗大量的時(shí)間,而且還可能在一臺(tái)節(jié)點(diǎn)存不下這大量的數(shù)據(jù)。就算是能夠存儲(chǔ)下,也能夠接受數(shù)據(jù)移動(dòng)所帶來的時(shí)間消耗,集群中其他節(jié)點(diǎn)的計(jì)算資源也都是在閑置的,不能高效率的利用集群。

  因此我們就需要進(jìn)行分布式的計(jì)算,將計(jì)算程序分發(fā)給不同的節(jié)點(diǎn)。在每一個(gè)節(jié)點(diǎn)上處理自己節(jié)點(diǎn)的數(shù)據(jù),最后將每一個(gè)節(jié)點(diǎn)的數(shù)據(jù)處理結(jié)果匯總在一起。而在分布式計(jì)算的過程中會(huì)遇到很多的分布式計(jì)算的細(xì)節(jié)問題,這些問題都是需要開發(fā)人員去考慮的。那么如何去解決這些問題呢?

  MapReduce是一個(gè)開源的、分布式的計(jì)算框架,封裝了分布式計(jì)算程序的實(shí)現(xiàn)細(xì)節(jié),使得開發(fā)人員不需要了解分布式計(jì)算底層實(shí)現(xiàn)的情況下,就可以去開發(fā)一個(gè)分布式的計(jì)算程序。開發(fā)人員只需要將重心放在業(yè)務(wù)邏輯的實(shí)現(xiàn)即可,不需要關(guān)注分布式開發(fā)的底層細(xì)節(jié)。因此,對(duì)于開發(fā)人員來說,可以簡(jiǎn)化不少的工作量,提交程序開發(fā)的效率!

  MapReduce的核心思想

  MapReduce設(shè)計(jì)的一個(gè)理念是“計(jì)算向數(shù)據(jù)靠攏”(移動(dòng)計(jì)算),而不是“數(shù)據(jù)向計(jì)算靠攏”(移動(dòng)數(shù)據(jù))

  將用戶編寫的業(yè)務(wù)邏輯代碼和自帶默認(rèn)組件整合成一個(gè)完整的分布式運(yùn)算程序,移動(dòng)到有數(shù)據(jù)存儲(chǔ)的集群節(jié)點(diǎn)上,一是可以減少節(jié)點(diǎn)間的數(shù)據(jù)移動(dòng)開銷。二是在存儲(chǔ)節(jié)點(diǎn)上可以并行計(jì)算,大大提高計(jì)算效率問題。 因?yàn)橐苿?dòng)數(shù)據(jù)需要大量的網(wǎng)絡(luò)傳輸開銷,尤其是在大規(guī)模數(shù)據(jù)環(huán)境下,這種開銷尤為驚人,所以移動(dòng)計(jì)算要比移動(dòng)數(shù)據(jù)更加經(jīng)濟(jì)。

  MapReduce一個(gè)完整的運(yùn)算分為Map和Reduce兩個(gè)部分。Map會(huì)處理本節(jié)點(diǎn)的原始數(shù)據(jù),產(chǎn)生的數(shù)據(jù)會(huì)臨時(shí)存儲(chǔ)到本地磁盤。Reduce會(huì)跨節(jié)點(diǎn)fetch屬于自己的數(shù)據(jù),并進(jìn)行處理,產(chǎn)生的數(shù)據(jù)會(huì)存儲(chǔ)到HDFS上。

  Hadoop的MapReduce核心技術(shù)起源于谷歌在2004年發(fā)表的關(guān)于MapReduce系統(tǒng)的論文介紹。論文中有這么一句話:Our abstraction is inspired by the map and reduce primitives present in Lisp and many other functional languages。這句話提到了MapReduce思想來源,大致意思是,MapReduce的靈感來源于函數(shù)式語(yǔ)言(比如Lisp)中的內(nèi)置函數(shù)map(映射)和reduce(規(guī)約)。

  簡(jiǎn)單來說,在函數(shù)式語(yǔ)言里,map表示對(duì)一個(gè)列表(List)中的每個(gè)元素做計(jì)算,reduce表示對(duì)一個(gè)列表中的每個(gè)元素做迭代計(jì)算。它們具體的計(jì)算是通過傳入的函數(shù)來實(shí)現(xiàn)的,map和reduce提供的是計(jì)算的框架。我們想一下,reduce既然能做迭代計(jì)算,那就表示列表中的元素是相關(guān)的(比如我想對(duì)列表中的所有元素做相加求和,那么列表中至少都應(yīng)該是數(shù)值吧)。而map是對(duì)列表中每個(gè)元素做單獨(dú)處理的,這表示列表中可以是雜亂無章的數(shù)據(jù)。

  這樣看來,就有點(diǎn)聯(lián)系了。在MapReduce里,Map處理的是原始數(shù)據(jù),自然是雜亂無章的,每條數(shù)據(jù)之間互相沒有關(guān)系;到了Reduce階段,數(shù)據(jù)是以key后面跟著若干個(gè)value來組織的,這些value有相關(guān)性,至少它們都在一個(gè)key下面,于是就符合函數(shù)式語(yǔ)言里map和reduce的基本思想了。

image

  MapReduce的運(yùn)行流程

 

cbccd895-a2d4-41e8-a650-ab9ac5e55809

 

好程序員公眾號(hào)

  • · 剖析行業(yè)發(fā)展趨勢(shì)
  • · 匯聚企業(yè)項(xiàng)目源碼

好程序員開班動(dòng)態(tài)

More+
  • HTML5大前端 <高端班>

    開班時(shí)間:2021-04-12(深圳)

    開班盛況

    開班時(shí)間:2021-05-17(北京)

    開班盛況
  • 大數(shù)據(jù)+人工智能 <高端班>

    開班時(shí)間:2021-03-22(杭州)

    開班盛況

    開班時(shí)間:2021-04-26(北京)

    開班盛況
  • JavaEE分布式開發(fā) <高端班>

    開班時(shí)間:2021-05-10(北京)

    開班盛況

    開班時(shí)間:2021-02-22(北京)

    開班盛況
  • Python人工智能+數(shù)據(jù)分析 <高端班>

    開班時(shí)間:2021-07-12(北京)

    預(yù)約報(bào)名

    開班時(shí)間:2020-09-21(上海)

    開班盛況
  • 云計(jì)算開發(fā) <高端班>

    開班時(shí)間:2021-07-12(北京)

    預(yù)約報(bào)名

    開班時(shí)間:2019-07-22(北京)

    開班盛況
IT培訓(xùn)IT培訓(xùn)
在線咨詢
IT培訓(xùn)IT培訓(xùn)
試聽
IT培訓(xùn)IT培訓(xùn)
入學(xué)教程
IT培訓(xùn)IT培訓(xùn)
立即報(bào)名
IT培訓(xùn)

Copyright 2011-2023 北京千鋒互聯(lián)科技有限公司 .All Right 京ICP備12003911號(hào)-5 京公網(wǎng)安備 11010802035720號(hào)

中文在线免费看视频_国产成人精品亚洲日本在线观看_亚洲精品第一综合99久久_国产亚洲精品日韩综合网

            久久一区二区三区四区| 亚洲综合一区二区| 91精品国产美女浴室洗澡无遮挡| 一本大道av伊人久久综合| 国模大尺度一区二区三区| 丝袜诱惑制服诱惑色一区在线观看| 国产精品美女久久久久久久网站| 久久亚洲二区三区| 欧美精品一区二区久久婷婷| 日韩一卡二卡三卡| 国产一区三区三区| 精久久久久久久久久久| 老司机午夜精品99久久| 美女性感视频久久| 国产精品国产三级国产普通话99| 国产日韩欧美一区二区三区综合| 国产亚洲精品精华液| 久久精品在线免费观看| 久久免费视频色| 久久久精品免费免费| 国产丝袜欧美中文另类| 亚洲国产岛国毛片在线| 中文幕一区二区三区久久蜜桃| 91久久人澡人人添人人爽欧美| 色综合久久久久网| 在线看日本不卡| 欧美精品乱码久久久久久| 欧美精品久久99久久在免费线| 91精品国产福利在线观看 | 色综合天天综合在线视频| 9人人澡人人爽人人精品| 色哟哟国产精品免费观看| 久久狠狠亚洲综合| 国产在线视频精品一区| jiyouzz国产精品久久| 色综合久久久久网| 欧美精品黑人性xxxx| 欧美mv日韩mv亚洲| 日本一区免费视频| 亚洲精选免费视频| 裸体健美xxxx欧美裸体表演| 国产精品一区二区在线观看不卡| jizzjizzjizz欧美| 欧美日韩一区三区四区| 欧美精品一区二区久久久| 国产精品久久久久久久久快鸭 | 亚洲欧洲国产日本综合| 亚洲一区自拍偷拍| 麻豆精品在线播放| 成人少妇影院yyyy| 在线观看视频欧美| 日韩精品一区二区三区中文不卡 | 欧美成人一区二区三区在线观看| 久久久不卡网国产精品一区| 亚洲精选视频免费看| 久久国产精品免费| 色婷婷av久久久久久久| 精品国免费一区二区三区| 亚洲视频一区二区在线| 毛片av一区二区| 日本韩国欧美在线| 2021中文字幕一区亚洲| 亚洲最大色网站| 国产成人亚洲综合a∨猫咪| 欧美日韩午夜在线| 国产精品拍天天在线| 日本在线观看不卡视频| 波多野结衣欧美| 日韩午夜在线观看视频| 亚洲人成在线观看一区二区| 国模娜娜一区二区三区| 欧美精选一区二区| 中文字幕字幕中文在线中不卡视频| 免费人成在线不卡| 日韩av不卡在线观看| 91原创在线视频| 久久人人爽爽爽人久久久| 香蕉成人伊视频在线观看| av在线综合网| 成人三级伦理片| 精品国产91洋老外米糕| 午夜视频一区在线观看| 91视频免费看| 国产精品天美传媒| 国内久久精品视频| 日韩女优制服丝袜电影| 亚洲aaa精品| 在线观看日韩高清av| 日韩毛片精品高清免费| 国产剧情av麻豆香蕉精品| 精品欧美一区二区三区精品久久| 亚洲国产精品综合小说图片区| www.色综合.com| 久久综合狠狠综合久久综合88 | 国产高清亚洲一区| 欧美一级艳片视频免费观看| 亚洲成av人片www| 91高清视频免费看| 一区二区三区在线观看动漫| av亚洲产国偷v产偷v自拍| 国产欧美中文在线| 国产很黄免费观看久久| 久久伊99综合婷婷久久伊| 麻豆精品久久久| 日韩午夜激情视频| 蜜臀av性久久久久蜜臀aⅴ流畅| 欧美片在线播放| 五月天久久比比资源色| 欧美三级视频在线观看| 亚洲大片精品永久免费| 在线视频国内自拍亚洲视频| 亚洲男女一区二区三区| 色94色欧美sute亚洲线路一ni| 国产精品伦理在线| 97精品超碰一区二区三区| 国产精品久久久久久亚洲伦| a级精品国产片在线观看| 国产精品成人一区二区三区夜夜夜 | 日韩欧美成人激情| 老司机午夜精品| 久久综合九色综合久久久精品综合| 寂寞少妇一区二区三区| 久久久久97国产精华液好用吗| 国产精品综合网| 中文一区一区三区高中清不卡| 丁香天五香天堂综合| 亚洲欧洲99久久| 色悠悠久久综合| 亚洲成人久久影院| 日韩三区在线观看| 国产精选一区二区三区| 国产精品久久久久影院老司| 91原创在线视频| 亚洲成人福利片| 日韩欧美中文字幕精品| 国产在线不卡一区| 综合分类小说区另类春色亚洲小说欧美| 一本到不卡免费一区二区| 亚洲伊人伊色伊影伊综合网| 日韩欧美一级在线播放| 国产成人av自拍| 亚洲激情一二三区| 91精品国产91热久久久做人人 | 欧美伊人久久久久久久久影院| 日本不卡视频在线观看| 久久精品一区蜜桃臀影院| 91在线云播放| 日本aⅴ精品一区二区三区| 久久精品免费在线观看| 一本大道久久精品懂色aⅴ| 久久成人久久爱| 亚洲视频香蕉人妖| 欧美日韩国产片| 国产毛片精品一区| 一区二区三区中文字幕精品精品 | 久久影院视频免费| 91在线观看成人| 麻豆精品一区二区三区| 亚洲精品欧美综合四区| 日韩免费电影网站| 91视频精品在这里| 中文字幕一区二区三| 91精品综合久久久久久| 成人黄色免费短视频| 日韩中文字幕1| 亚洲天堂网中文字| 欧美成人video| 色悠久久久久综合欧美99| 激情综合五月天| 亚洲成人av电影在线| 国产精品美女一区二区在线观看| 91精品国产综合久久精品| 北条麻妃一区二区三区| 久久疯狂做爰流白浆xx| 亚洲欧洲中文日韩久久av乱码| 精品国产一区二区三区不卡| 在线观看国产日韩| 国产91露脸合集magnet| 日韩高清在线不卡| 亚洲欧美日韩精品久久久久| 久久精品一二三| 678五月天丁香亚洲综合网| 美女视频第一区二区三区免费观看网站| 亚洲欧美综合网| 国产欧美一区二区三区鸳鸯浴| 在线成人免费视频| av午夜精品一区二区三区| 国产一区二区三区免费看 | 成人毛片视频在线观看| 老色鬼精品视频在线观看播放| 一区二区免费看| 中文字幕精品—区二区四季| 久久综合av免费| 日韩一区二区视频| 国产一区二区三区在线观看免费 | 国产麻豆精品在线观看| 日韩av二区在线播放| 午夜成人免费电影| 亚洲午夜在线视频| 亚洲黄色免费网站|