被神话的Linux, 一文带你看清Linux在多核可扩展性设计上的不足

发布时间：2019-10-15 16:52:59 所属栏目：Windows 来源：Android资深架构师

导读：我其实并不想讨论微内核的概念，也并不擅长去阐述概念，这是百科全书的事，但无奈最近由于鸿蒙的发布导致这个话题过火，也就经不住诱惑，加上我又一直比较喜欢操作系统这个话题，就来个老生常谈吧。说起微内核，其性能往往因为IPC饱受诟

我们看到，在模拟微内核的代码中，用多线程执行并行访问共享数据curr时，开销不会随着线程数量的变化而变化，而模拟宏内核的代码中，总时间随着线程数的增加而线性增加，显然，这部分开销是自旋锁的开销。当今流行的CPU cache结构已经排队自旋锁的开销符合这种线性增长。

那么为什么微内核的模拟代码中的锁开销没有随着线程数量的增加而增加呢?

因为在类似宏内核的同步任务中，由于并发上下文的相互隔离，整个任务必须被一个锁保护，比如 Linux内核的tcp_v4_rcv 里面的：

bh_lock_sock_nested(sk); 
 // 这部分耗时时间不确定，因此CPU空转率不确定，低效，浪费！ 
 ret = 0; 
 if (!sock_owned_by_user(sk)) { 
 if (!tcp_prequeue(sk, skb))  
 ret = tcp_v4_do_rcv(sk, skb); 
 } else if (unlikely(sk_add_backlog(sk, skb, 
 sk->sk_rcvbuf + sk->sk_sndbuf))) { 
 bh_unlock_sock(sk); 
 NET_INC_STATS_BH(net, LINUX_MIB_TCPBACKLOGDROP); 
 goto discard_and_relse; 
 } 
 bh_unlock_sock(sk);

然而，在微内核的代码中，类似上面的任务被打包统一交给单独的服务线程去调度执行了，大大减少了锁区里的延时。

宏内核的隔离上下文并发抢锁场景需要锁整个任务，造成抢锁开销巨大，而微内核只要锁任务队列的入队出队操作即可，这部分开销和具体任务无关，完全可预期的开销。

接下来让我们对比一下执行同样的任务，在不同CPU数量的约束下，两种模式的时间开销对比图：