进程 & 线程相关知识

首页 > 代码库 > 进程 & 线程相关知识

2024-08-25 11:19:56 220人阅读

不管Java，C++都有进程、线程相关的内容。在这里统一整理吧。

Python的线程，其实是伪线程，不能真正的并发。下面也有讲。

线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈)。

多个线程共享内存。

参考了这篇文章：http://www.cnblogs.com/qiaoconglovelife/p/5319779.html

进程与PCB

　　　　进程：进程是程序的一次执行过程，是系统进行资源分配和调度的一个独立单位。

　　　　进程实体（进程映像）：由程序段、相关数据段和PCB三部分构成。进程是动态的，进程实体是静态的。

　　　　PCB（进程控制块）：系统利用PCB来描述进程的基本情况和运行状态，进而控制和管理进程；所谓创建进程，实际上是创建进程映像中的PCB；PCB是进程存在的唯一标志。

进程有5种状态，其中前3种是基本状态：

运行态、就绪态、阻塞态（等待态）。另两种是新建态和终止态。

进程的创建过程

　　　　（1）分配ID与PCB：为新进程分配一个唯一的进程标识号，并申请一个空白的PCB（PCB是有限的）。若PCB申请失败则创建失败。

　　　　（2）分配资源：为新进程的程序和数据、以及用户栈分配必要的内存空间（在PCB 中体现）。注意：这里如果资源不足（比如内存空间），并不是创建失败，而是处于阻塞态。

　　　　（3）初始化PCB：主要初始化（1）标志信息（2）处理机状态信息（3）处理机控制信息，以及（4）设置进程的优先级等。

　　　　（4）调度：如果进程就绪队列能够接纳新进程，就将新进程插入到就绪队列，等待被调度运行。

　　　　注意，进程的创建是一个原子操作，执行期间不允许中断，它是一个不可分割的基本单位。

进程的终止

　　　　引起进程终止的事件主要有：

　　　　（1）正常结束

　　　　（2）异常结束：如存储区越界、非法指令、I/O故障等

　　　　（3）外界干预：如操作员或操作系统干预、父进程请求、父进程终止。

　　　　操作系统终止进程的过程如下：

　　　　（1）根据被终止进程的ID，检索PCB，从中读出该进程的状态

　　　　（2）若被终止进程处于执行状态，立即终止该进程的执行，将处理机资源分配给其他进程

　　　　（3）若该进程还有子进程，则应将其所有的子进程终止

　　　　（4）将该进程所拥有的资源，或归还给其父进程或归还给操作系统

　　　　（5）将该PCB从所在队列（链表）中删除。

进程之间的切换

　　　　（1）保存处理机上下文，包括程序计数器和其他寄存器。

　　　　（2）更新PCB信息。

　　　　（3）把进程的PCB移入相应的队列，如就绪、在某事件阻塞等队列。

　　　　（4）选择另一个进程执行，并更新其PCB。

　　　　（5）更新内存管理的数据结构。

　　　　（6）恢复处理机上下文。

　　　　注意：“调度”和“切换”的区别：调度是指决定资源分配给哪个进程的行为，是一种决策行为；切换是指实际分配的行为，是执行行为。一般来说，等有资源的调度，再有进程的切换。

线程

　　　　线程是轻量化的进程，是程序执行流的最小单位；由线程ID、程序计数器、寄存器集合和堆栈组成；线程自己不拥有系统资源，只拥有一点在运行中必不可少的资源，但它可与同属一个进程的其他线程共享进程所拥有的全部资源。

进程与线程区别

　　　　（1）一个程序至少有一个进程,一个进程至少有一个线程。线程(Thread)是进程的一个实体，是CPU调度和分派的基本单位；

　　　　（2）进程拥有独立的内存单元，而多个线程共享内存。从而线程效率更高；

　　　　（3）进程有独立的地址空间，一个进程崩溃后，在保护模式下不会对其它进程产生影响，而线程没有单独的地址空间，一个线程死掉就等于整个进程死掉，所以多进程的程序要比多线程的程序健壮；

　　　　（4）进程切换时，耗费资源较大，效率要差一些；

　　　　（5）进程是系统资源分配的基本单位，线程是调度的基本单位。

线程独有的内容：线程上下文，包括线程ID、栈、栈指针、PC（程序计数器）、通用目的寄存器、条件码。

线程共享的内容：文件描述符和整个用户虚拟地址空间，包括只读文本（代码）、静态变量、堆、所有的共享库代码和数据区域组成。

相比进程，线程有什么好处

　　　　（1）易于调度。

　　　　（2）提高并发性。通过线程可方便有效地实现并发性。进程可创建多个线程来执行同一程序的不同部分。

　　　　（3）开销少。创建线程比创建进程要快，所需开销很少。。

　　　　（4）利于充分发挥多处理器的功能。

相比进程，线程有什么缺点

　　　　（1）线程之间的同步和加锁控制比较麻烦

　　　　（2）一个线程的崩溃影响到整个程序的稳定性

　　　　（3）线程多了之后，线程本身的调度也是一个麻烦事儿，需要消耗较多的CPU

分离线程
- 线程可以是可结合的，或者是可分离的；
- 可结合的线程能够被其他线程收回其资源和杀死。在被其他线程回收之前，它的存储器资源（例如栈）是没有被释放的，相反一个分离的线程是不能被其他线程回收或杀死的。它的存储器资源在它终止时由系统自动释放；
- 为避免存储器泄漏，每个可结合线程都应该被其他线程显式地收回，要么通过调用pthread_detach函数被分离；(对应于Java就是 Thread.join和Thread.detach )
- 默认情况下，线程被创建成可结合的。(注意：可结合是一种状态，要调用join方法来进行结合/释放)

来一个例子：

package com.company;


import static java.lang.Thread.sleep;

class Solution {

}

class MyRunnable implements Runnable {

    int x = 5;
    @Override
    public void run() {
        synchronized(this) {
            for (int i = 0; i < 5; i++) {
                System.out.println("hi " + Thread.currentThread().getName() + ":" + x--);
            }
        }
        System.out.println("here to sleep");
        try {
            sleep(5000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

public class Main {

    public static void main(String[] args) throws InterruptedException {

        MyRunnable mr = new MyRunnable();
        Thread t1 = new Thread(mr, "1");
        Thread t2 = new Thread(mr, "2");
        Thread t3 = new Thread(mr, "3");

        t1.start();
        t2.start();
        t3.start();

        System.out.println();

    }

}

打印结果：

hi 1:5
hi 1:4
hi 1:3
hi 1:2
hi 1:1
here to sleep
hi 3:0
hi 3:-1
hi 3:-2
hi 3:-3
hi 3:-4
here to sleep

hi 2:-5
hi 2:-6
hi 2:-7
hi 2:-8
hi 2:-9
here to sleep

三个线程，同时sleep了5秒钟，然后整个程序才结束。

如果synchronized加在函数上，那么是每个线程分别sleep 5秒钟，一共sleep 15秒钟。

IPC方式（进程间通信方式）

　　　　（1）管道：半双工；用于父子、兄弟之间。

　　　　（2）命名管道（FIFO）

　　　　（2）消息队列：消息链表存于内核，每个消息队列由消息队列标识符标识；于管道不同的是，消息队列存放在内核中，只有在内核重启时才能删除一个消息队列；消息队列的大小受限制。

　　　　（3）信号量（semophore）：常用来处理临界资源的访问同步问题。临界资源：为某一时刻只能由一个进程或线程操作的资源。

　　　　（4）共享内存：可以说是最有用的进程间通信方式，也是最快的IPC形式。

　　　　（5）套接字：也可用于不同机器之间。

　　　　（6）信号（Signal）

线程同步方式

　　　　（1）临界区：当多个线程访问一个独占性共享资源时，可以使用临界区对象。拥有临界区的线程可以访问被保护起来的资源或代码段，其他线程若想访问，则被挂起，直到拥有临界区的线程放弃临界区为止。

（注：Java的synchronized代码段，也勉强可以算作临界区，只是语言标记互斥的实现方式；要访问代码段，需要获得传给synchronized的Object这个对象的锁。注意，每个java对象都隐含有一把锁。

Java GC需要的safe point，为了让多个线程都停下来，标记的区域-其他线程不进来，里面的线程出来了，就开始GC- 跟临界区的思想也有一点像）

　　　　（2）互斥量-mutex：互斥对象和临界区对象非常相似，只是其允许在进程间使用，而临界区只限制与同一进程的各个线程之间使用。

　　　　（3）条件变量：一个线程被挂起，直到某件事件发生。

　　　　（4）信号量：当需要一个计数器来限制可以使用某共享资源的线程数目时，可以使用“信号量”对象。CSemaphore类对象保存了对当前访问某一个指定资源的线程的计数值，该计数值是当前还可以使用该资源的线程数目。如果这个计数达到了零，则所有对这个CSemaphore类对象所控制的资源的访问尝试都被放入到一个队列中等待，直到超时或计数值不为零为止。

　　　　（5）事件：允许一个线程在处理完一个任务后，主动唤醒另外一个线程执行任务。

　　　　（6）套接字

感觉上面这篇文章不错，有一定深度。可以多看看这个博客：http://www.cnblogs.com/qiaoconglovelife/

再来聊一下Python的线程

简单地说就是作为可能是仅有的支持多线程的解释型语言（perl的多线程是残疾，PHP没有多线程），Python的多线程是有compromise的，在任意时间只有一个Python解释器在解释Python bytecode。Ruby也是有thread支持的，而且至少Ruby MRI是有GIL的。

单独开了一篇文章来写，详细内容可以看这篇文章：http://www.cnblogs.com/charlesblc/p/6135819.html

进程 & 线程相关知识

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 进程 & 线程相关知识