# 进程和线程的区别


## 经典面试题

- 进程与线程之间有什么区别？

扩展

- 什么是缓冲区溢出？
- 进程之间如何进行交互？
- 线程之间如何进行交互？

面试时不可避免会被问到这个问题，Milo将自己的理解记录一下。

## 类比理解

**1**.计算机的核心是CPU，它承担了所有的计算任务。它就像一座工厂，时刻在运行。

**2**.假定工厂的电力有限，一次只能供给一个车间使用。也就是说，一个车间开工的时候，其他车间都必须停工。背后的含义就是，单个CPU一次只能运行一个任务。

**3**.进程就好比工厂的车间，它代表CPU所能处理的单个任务。任一时刻，CPU总是运行一个进程，其他进程处于非运行状态。

**4**.一个车间里，可以有很多工人。他们协同完成一个任务。

**5**.线程就好比车间里的工人。一个进程可以包括多个线程。

**6**.车间的空间是工人们共享的，比如许多房间是每个工人都可以进出的。这象征一个进程的内存空间是共享的，每个线程都可以使用这些共享内存。

**7**.可是，每间房间的大小不同，有些房间最多只能容纳一个人，比如厕所。里面有人的时候，其他人就不能进去了。这代表一个线程使用某些共享内存时，其他线程必须等它结束，才能使用这一块内存。

**8**.一个防止他人进入的简单方法，就是门口加一把锁。先到的人锁上门，后到的人看到上锁，就在门口排队，等锁打开再进去。这就叫"互斥锁"（Mutual exclusion，缩写 Mutex），防止多个线程同时读写某一块内存区域。

**9**.还有些房间，可以同时容纳n个人，比如厨房。也就是说，如果人数大于n，多出来的人只能在外面等着。这好比某些内存区域，只能供给固定数目的线程使用。

**10**.这时的解决方法，就是在门口挂n把钥匙。进去的人就取一把钥匙，出来时再把钥匙挂回原处。后到的人发现钥匙架空了，就知道必须在门口排队等着了。这种做法叫做"信号量"（Semaphore），用来保证多个线程不会互相冲突。

不难看出，mutex是semaphore的一种特殊情况（n=1时）。也就是说，完全可以用后者替代前者。但是，因为mutex较为简单，且效率高，所以在必须保证资源独占的情况下，还是采用这种设计。

**11**.操作系统的设计，因此可以归结为三点：

- 以多进程形式，允许多个任务同时运行；
- 以多线程形式，允许单个任务分成不同的部分运行；
- 提供协调机制，一方面防止进程之间和线程之间产生冲突，另一方面允许进程之间和线程之间共享资源。

## 面试回答

- 进程是程序在执行过程中分配和管理资源的基本单位，每一个进程都有自己的地址空间，至少有5种基本状态：初始态、执行态、等待状态、就需状态和终止状态

- 线程是CPU调度和分派的基本单位，它可与同属一个进程的其他线程共享进程所拥有的全部资源

#### 联系

- 线程是进程的一部分，一个线程只能属于一个进程，而一个进程可以有多个线程

#### 区别

- 进程是操作系统分配和管理资源的基本单位，线程是任务调度和执行的基本单位

- 进程有独立的地址空间，而线程只能共享所属进程的资源
- 进程之间的切换开销大，线程之间的切换开销小

- 线程是为了在系统层面实现并发，提高硬件利用率
- 进程是为隔离资源，保障一些资源崩溃了后被回收，不影响其他程序

#### 扩展

- 缓冲区溢出：我们有个地方要输入用户名，本来是用来存数据的地方。 然后黑客把数据输入的特别长。这个长度超出了我们给数据存储的内存区，这时候跑到了 我们给程序分配的一部分内存中。黑客就可以通过这种办法将他所要运行的代码 写入到用户名框中，来植入进来。我们的解决方法就是，用用户名的长度来限制不要超过 用户名的缓冲区的大小来解决。

- 进程之间通过TCP/IP的端口来进行交互

- 线程的通信就比较简单，有一大块共享的内存，只要大家的指针是同一个就可以看到各自的内存

  

  
  
