其他分享
首页 > 其他分享> > MIT6.824 2020 Lab1 MapReduce 实现

MIT6.824 2020 Lab1 MapReduce 实现

作者:互联网

准备工作

实验地址:http://nil.csail.mit.edu/6.824/2020/labs/lab-mr.html

论文地址:mapreduce

实验环境可以在实验地址里面找到具体的搭建方式。

系统总览

MapReduce 系统是由一个 master 进程和多个 worker 进程组成。

Master 负责任务状态的记录以及任务的分发。

Worker 负责不断向 master 请求任务,并根据任务的类型(map/reduce)进行处理,最后将任务结果发送给 master。

系统框架图如下:

process

系统流程图如下:

程序基本逻辑

Master

Worker

Worker 调用 GetTask RPC 接口不断向 master 请求任务。当接收到任务,根据任务的类型分类处理。处理完后,调用 CompleteTask 接口告知 master 任务执行完毕。

代码结构

Master 的结构如下:

// master.go

type Task struct {
	// Pending, Running and Completed
	phase    string
	taskID   int
	taskType string
	// for map, input path has only one element
	inputPaths []string
	// for reduce, output path has only one element
	outputPaths []string
}

type Master struct {
	nReduce                    int
	mapTasks                   []*Task
	reduceTasks                []*Task
	incompletedMapTaskCount    int
	incompletedReduceTaskCount int
	reduceInitialized          bool
	mux                        sync.Mutex
}

Worker 主要是处理逻辑,官方实验文档以及 main/mrsequential.go 里面有例子。

RPC 的结构如下:

// rpc.go

type GetTaskRequest struct{}

type GetTaskResponse struct {
	TaskType   string
	TaskID     int
	TaskInputs []string
	NReduce    int
}

type CompleteTaskRequest struct {
	TaskType    string
	TaskID      int
	TaskOutputs []string
}

type CompleteTaskResponse struct{}

以上是代码的结构,具体的代码细节在 github 上面。

踩过的坑

这里最主要的应该是对于并发的控制,以及 crash 的处理。

并发控制加锁可以完成。

crash 的处理是靠 master 的超时机制,以及在 worker 处理的时候,生成一个临时文件,在处理结束后再 rename 成最终的文件。

为了方便 debug,推荐使用 github.com/sirupsen/logrus 这个库。可以将 debug 等级设为 debug level 来输出自己的 debug 信息。

import (
    log "github.com/sirupsen/logrus"
)

log.SetOutput(os.Stdout)
// log.SetLevel(log.DebugLevel)
log.SetLevel(log.WarnLevel)
log.SetFormatter(&log.TextFormatter{
    FullTimestamp: true,
})

最终结果

这里的 FATAL 是 master 检测到所有任务完成后退出,worker 连接不上 master 而抛出的错误,是预期的。

结语

这个实验虽然只是一个小玩具,但还是有收获的。特别是看过论文后进行实验,对 mapreduce 一些细节的实现有更深的了解。有兴趣的同学可以自己完成一遍。

标签:map,string,int,任务,Lab1,2020,master,MIT6.824,log
来源: https://www.cnblogs.com/fightfordream/p/14521593.html