Liam W
封面

C#.NET拾遗补漏 | 11-你必须知道的线程基础知识

作者
王亮·发表于 4 年前

线程的知识太多,知识点有深有浅,往深的研究会涉及操作系统、CPU、内存,往浅了说就是一些语法。没有一定的知识积累,很难把线程的知识写得全面,当然我也没有这个能力。所以想到一个点写一个点,尽量总结一些有用的知识点。线程是个大话题,这个系列可能会有好几遍关于线程的,先从基础的开始,热热身。

一些基础概念

线程(Thread)是操作系统能够进行运算调度的最小单位。它是进程中的实际运作单位,一个进程中可以启动多个线程,每个线程可以并行执行不同的任务。严格意义上来说,同一时间可以并行运行的线程数取决于 CPU 的核数。

根据线程运行模式,可以把线程分为前台线程、后台线程和守护(Daemon)线程:

  • 前台线程:主程序必须等待线程执行完毕后才可退出程序。C# 中的 Thread 默认为前台线程,也可以设置为后台线程。

  • 后台线程:主程序执行完毕立即跟随退出,不管线程是否执行完毕。C# 的 ThreadPool 管理的线程默认为后台线程。

  • 守护线程:守护线程拥有自动结束自己生命周期的特点,它通常被用来执行一些后台任务。

每次开启一个新的线程都要消耗一定的内存,即使线程什么也不做,也会至少消耗 1M 左右的内存。

多线程并行(Parallelism)和并发(Concurrency)的区别:

  • 并行:同一时刻有多条指令在多个处理器上同时执行,无论从宏观还是微观上都是同时发生的。
  • 并发:是指在同一时间段内,宏观上看多个指令看起来是同时执行,微观上看是多个指令进程在快速的切换执行,同一时刻可能只有一条指令被执行。

PS:以上概念来源 Google 的多个搜索结果,稍加整理。

Thread、ThreadPool 和 Task

对 C# 开发者来说,不可不理解清楚 Thread、ThreadPool 和 Task 这三个概念。这也是面试频率很高的话题,在 StackOverflow 可以找到有很多不错的回答,我总结整理了一下。

Thread

Thread 是一个实际的操作系统级别的线程(OS 线程),有自己的栈和内核资源。Thread 允许最高程度的控制,你可以 Abort、Suspend 或 Resume 一个线程,你还可以监听它的状态,设置它的堆栈大小和 Culture 等属性。Thread 的开销成本很高,你的每一个线程都会为它的堆栈消耗相对较多的内存,并且在线程之间的处理器上下文切换时会增加额外的 CPU 开销。

ThreadPool

ThreadPool(线程池)是一堆线程的包装器,由 CLR 维护。你对线程池中的线程没有任何控制权,你甚至无法知道线程池什么时候开始执行你提交的任务,你只能控制线程池的大小。简单来说,线程池调用线程的机制是,它首先调用已创建的空闲线程来执行你的任务,如果当前没有空闲线程,可能会创建新线程,也可能会等待。

使用 ThreadPool 可以避免创建太多线程的开销。但是,如果你向 ThreadPool 提交了太多长时间运行的任务,它可能会被填满,这时你提交的后面的任务可能最终会等待前面的长时间运行的任务执行完成。此外,线程池没有提供任何方法来检测一个工作任务何时完成(不像 Thread.Join()),也没有方法来获取结果。因此,ThreadPool 最好用于调用者不需要结果的短时操作。

Task

Task 是 TPL(Task Parallel Library)提供一个类,它在 Thread 和 TheadPool 之间提供了两全其美的解决方案。和 ThreadPool 一样,Task 并不创建自己的OS 线程。相反,Task 是由 TaskScheduler 调度器执行的,默认的调度器只是在 ThreadPool 上运行。

与 ThreadPool 不同的是,Task 还允许你知道它完成的时间,并获取返回一个结果。你可以在现有的 Task 上调用 ContinueWith(),使它在任务完成后运行更多的代码(如果它已经完成,就会立即运行回调)。

你也可以通过调用 Wait() 来同步等待一个任务的完成(或者,通过获取它的 Result 属性)。与 Thread.Join() 一样,这将阻塞调用线程,直到任务完成。通常不建议同步等待任务执行完成,它使调用线程无法进行任何其他工作。如果当前线程要等待其它线程任务执行完成,建议使用 async/await 异步等待,这样当前线程可以空闲出来去处理其它任务,比如在 await Task.Delay() 时,并不占用线程资源。

由于任务仍然在 ThreadPool 上运行,因此不应该将其用于长时任务的执行,因为它们会填满线程池并阻塞新的工作任务。相反,Task 提供了一个 LongRunning 选项,它将告诉 TaskScheduler 启用一个新的线程,而不是在 ThreadPool 上运行。

所有较新的上层多线程 API,包括 Parallel.ForEach()、PLINQ、async/await 等,都是建立在 Task 上的。

Thread 和 Task 简单示例

下面通过一个简单示例演示 Thread 和 Task 的使用,注意他们是如何创建、传参、执行和等待执行完成的。

static void Main(string[] args)
{
    // 创建两个新的 Thread
    var thread1 = new Thread(new ThreadStart(() => PerformAction("Thread", 1)));
    var thread2 = new Thread(new ThreadStart(() => PerformAction("Thread", 2)));

    // 开始执行线程任务
    thread1.Start();
    thread2.Start();

    // 等待两个线程执行完成
    thread1.Join();
    thread2.Join();

    Console.WriteLine("Theads done!");

    Console.WriteLine("===我是分隔线===");

    // 创建两个新的 Task
    var task1 = Task.Run(() => PerformAction("Task", 1));
    var task2 = Task.Run(() => PerformAction("Task", 2));

    // 执行并等待两个 Task 执行完成
    Task.WaitAll(new[] { task1, task2 });

    Console.WriteLine("Tasks done!");

    Console.ReadKey();
}

static void PerformAction(string threadOrTask, int id)
{
    var rnd = new Random(id);
    for (int i = 0; i < 5; i++)
    {
        Console.WriteLine($"{threadOrTask}: {id}: {i}", id, i);
        Thread.Sleep(rnd.Next(0, 1000));
    }
}

运行效果:

注意到,相比之下 Task 比 Thread 好用得多,加上前文 Task 和 Thread 的对比,对我们编码的指导意义是:大多数情况我们应该使用 Task,而不要直接使用 Thread,除非你明确知道你需要一个独立的线程来执行一个长耗时的任务。

小结

本篇内容很基础,整理了 C# 线程编程有关的重要概念,简单演示了 Thread 和 Task 的使用。Thread 和 Task 是高频面试话题,尤其是 Thread 和 Task 的区别,Thread 更底层,Task 更抽象,回答好这类面试题的关键点在 ThreadPool。