为什么程序员大多数都会脱发?( ConcurrentHashMap 并发)
作者:互联网
为什么程序员大多数都会脱发?
其实这是一种误解,来看看现状数据说话,真实情况是这样的。
据脉脉统计出来的《程序员真相大调研2019》中,71.2%的程序员是不脱发的,仅有28.8%的程序员存在秃头情况。
为什么很多人印象中程序员=秃头?有些还没进入职业的大学生,都开始担忧自己的头发。
来自2018年中国程序员薪资生存现状调查报告
你可能觉得,这对于秃头有什么关系。但其实男性脱发多是以雄激素脱发为主,这是最具杀伤力的一种脱发类型。
而且这类90%以上的脱发类型——雄激素脱发,男性数量多于女性,常在20至30岁开始脱发,随着年龄的增长发病率逐渐升高。
据统计,在我国男性患病率约为21.3%,女性患病率约为 6.0%。
这意味着你进入程序猿的环境中男多女少,看见脱发的男程序猿几率大大增加。
生活状态习惯加速脱发
生存不易,精神压力大、熬夜、吸烟等程序员常态生活状态和习惯,加速加重脱发进程。
雄激素脱发,也称为遗传性脱发。家有脱发遗传基因的程序员要注意了,熬夜、吸烟、精神压力大等,会加重有脱发基因的人脱发。
你在一边熬夜,一边吸烟的同时,脱发也在悄无声息地开始。
在精神压力下,自主神经或中枢神经机能紊乱,造成头部血液循环障碍,导致毛发生长机能受到抑制,压力过大引起皮脂腺分泌增加头垢,头发生存环境降低,从而加重脱发。
w
高强度加班后,很多人莫名其妙掉头发(不仅仅是雄秃,斑秃也有可能),就是这么产生的。
程序猿脱发并不可怕,秃了现代医学也是可以解决的。
小揽身边有200多个同事都有脱发经历,他们有的擦药、有的吃药、有的植发都恢复了,所以大家不要害怕积极去看医生改善就可以了。
给程序员贴的刻板印象到底从哪里来的?
先入为主的印象
可能是历史上诸位编程大牛们,让大众对程序员有容易秃头这种印象:
Java之父 James Gosling
C语言之父 Dennis Ritchie ↓
Swift之父 Chris Lattner ↓
GO语言之父 Rob Pike
C++之父 Bjarne Stroustrup
大佬们的头发都比较稀疏,可见牛逼的人都有一样的特征。
现实我国男女比例失衡
在程序员群体中,男女性别比例失衡更加明显,于是进入程序员职业看见脱发的几率是很大的。
言归正传( ConcurrentHashMap 并发)
4.1.20.1. 减小锁粒度
减小锁粒度是指缩小锁定对象的范围,从而减小锁冲突的可能性,从而提高系统的并发能力。减
小锁粒度是一种削弱多线程锁竞争的有效手段,这种技术典型的应用是 ConcurrentHashMap(高
性能的 HashMap)类的实现。对于 HashMap 而言,最重要的两个方法是 get 与 set 方法,如果我
们对整个 HashMap 加锁,可以得到线程安全的对象,但是加锁粒度太大。Segment 的大小也被
称为 ConcurrentHashMap 的并发度。
4.1.20.2. ConcurrentHashMap 分段锁
ConcurrentHashMap,它内部细分了若干个小的 HashMap,称之为段(Segment)。默认情况下
一个 ConcurrentHashMap 被进一步细分为 16 个段,既就是锁的并发度。
如果需要在 ConcurrentHashMap 中添加一个新的表项,并不是将整个 HashMap 加锁,而是首
先根据 hashcode 得到该表项应该存放在哪个段中,然后对该段加锁,并完成 put 操作。在多线程
环境中,如果多个线程同时进行 put操作,只要被加入的表项不存放在同一个段中,则线程间可以
做到真正的并行。
121623125152125125
ConcurrentHashMap 是由 Segment 数组结构和 HashEntry 数组结构组成
ConcurrentHashMap 是由 Segment 数组结构和 HashEntry 数组结构组成。Segment 是一种可
重入锁 ReentrantLock,在 ConcurrentHashMap 里扮演锁的角色,HashEntry 则用于存储键值
对数据。一个 ConcurrentHashMap 里包含一个 Segment 数组,Segment 的结构和 HashMap
类似,是一种数组和链表结构, 一个 Segment 里包含一个 HashEntry 数组,每个 HashEntry 是
一个链表结构的元素, 每个 Segment 守护一个 HashEntry 数组里的元素,当对 HashEntry 数组的
数据进行修改时,必须首先获得它对应的 Segment 锁。
4.1.21. Java 中用到的线程调度
4.1.21.1. 抢占式调度:
抢占式调度指的是每条线程执行的时间、线程的切换都由系统控制,系统控制指的是在系统某种
运行机制下,可能每条线程都分同样的执行时间片,也可能是某些线程执行的时间片较长,甚至
某些线程得不到执行的时间片。在这种机制下,一个线程的堵塞不会导致整个进程堵塞。
4.1.21.2. 协同式调度:
协同式调度指某一线程执行完后主动通知系统切换到另一线程上执行,这种模式就像接力赛一样,
一个人跑完自己的路程就把接力棒交接给下一个人,下个人继续往下跑。线程的执行时间由线程
本身控制,线程切换可以预知,不存在多线程同步问题,但它有一个致命弱点:如果一个线程编
写有问题,运行到一半就一直堵塞,那么可能导致整个系统崩溃。
4.1.21.3. JVM 的线程调度实现(抢占式调度)
java 使用的线程调使用抢占式调度,Java 中线程会按优先级分配 CPU 时间片运行,且优先级越高
越优先执行,但优先级高并不代表能独自占用执行时间片,可能是优先级高得到越多的执行时间
片,反之,优先级低的分到的执行时间少但不会分配不到执行时间。
4.1.21.4. 线程让出 cpu 的情况:
-
当前运行线程主动放弃 CPU,JVM 暂时放弃 CPU 操作(基于时间片轮转调度的 JVM 操作系
统不会让线程永久放弃 CPU,或者说放弃本次时间片的执行权),例如调用 yield()方法。 -
当前运行线程因为某些原因进入阻塞状态,例如阻塞在 I/O 上。
-
当前运行线程结束,即运行完 run()方法里面的任务。
4.1.22. 进程调度算法
4.1.22.1. 优先调度算法 -
先来先服务调度算法(FCFS)
当在作业调度中采用该算法时,每次调度都是从后备作业队列中选择一个或多个最先进入该队
列的作业,将它们调入内存,为它们分配资源、创建进程,然后放入就绪队列。在进程调度中采
用 FCFS 算法时,则每次调度是从就绪队列中选择一个最先进入该队列的进程,为之分配处理机,使之投入运行。该进程一直运行到完成或发生某事件而阻塞后才放弃处理机,特点是:算法比较
简单,可以实现基本上的公平。 -
短作业(进程)优先调度算法
短作业优先(SJF)的调度算法是从后备队列中选择一个或若干个估计运行时间最短的作业,将它们
调入内存运行。而短进程优先(SPF)调度算法则是从就绪队列中选出一个估计运行时间最短的进程,
将处理机分配给它,使它立即执行并一直执行到完成,或发生某事件而被阻塞放弃处理机时再重
新调度。该算法未照顾紧迫型作业。
4.1.22.2. 高优先权优先调度算法
为了照顾紧迫型作业,使之在进入系统后便获得优先处理,引入了最高优先权优先(FPF)调度
算法。当把该算法用于作业调度时,系统将从后备队列中选择若干个优先权最高的作业装入内存。
当用于进程调度时,该算法是把处理机分配给就绪队列中优先权最高的进程。 -
非抢占式优先权算法
在这种方式下,系统一旦把处理机分配给就绪队列中优先权最高的进程后,该进程便一直执行下
去,直至完成;或因发生某事件使该进程放弃处理机时。这种调度算法主要用于批处理系统中;
也可用于某些对实时性要求不严的实时系统中。 -
抢占式优先权调度算法
在这种方式下,系统同样是把处理机分配给优先权最高的进程,使之执行。但在其执行期间,只
要又出现了另一个其优先权更高的进程,进程调度程序就立即停止当前进程(原优先权最高的进程)
的执行,重新将处理机分配给新到的优先权最高的进程。显然,这种抢占式的优先权调度算法能
更好地满足紧迫作业的要求,故而常用于要求比较严格的实时系统中,以及对性能要求较高的批
处理和分时系统中。
2.高响应比优先调度算法
在批处理系统中,短作业优先算法是一种比较好的算法,其主要的不足之处是长作业的运行
得不到保证。如果我们能为每个作业引入前面所述的动态优先权,并使作业的优先级随着等待时
间的增加而以速率 a 提高,则长作业在等待一定的时间后,必然有机会分配到处理机。该优先权的
变化规律可描述为:
(1) 如果作业的等待时间相同,则要求服务的时间愈短,其优先权愈高,因而该算法有利于
短作业。
(2) 当要求服务的时间相同时,作业的优先权决定于其等待时间,等待时间愈长,其优先权
愈高,因而它实现的是先来先服务。
(3) 对于长作业,作业的优先级可以随等待时间的增加而提高,当其等待时间足够长时,其
优先级便可升到很高,从而也可获得处理机。简言之,该算法既照顾了短作业,又考虑了作业到
达的先后次序,不会使长作业长期得不到服务。因此,该算法实现了一种较好的折衷。当然,在
利用该算法时,每要进行调度之前,都须先做响应比的计算,这会增加系统开销。
4.1.22.3. 基于时间片的轮转调度算法 -
时间片轮转法
在早期的时间片轮转法中,系统将所有的就绪进程按先来先服务的原则排成一个队列,每次调度
时,把 CPU 分配给队首进程,并令其执行一个时间片。时间片的大小从几 ms 到几百 ms。当执行
的时间片用完时,由一个计时器发出时钟中断请求,调度程序便据此信号来停止该进程的执行,
并将它送往就绪队列的末尾;然后,再把处理机分配给就绪队列中新的队首进程,同时也让它执
行一个时间片。这样就可以保证就绪队列中的所有进程在一给定的时间内均能获得一时间片的处
理机执行时间。 -
多级反馈队列调度算法
(1) 应设置多个就绪队列,并为各个队列赋予不同的优先级。第一个队列的优先级最高,第二
个队列次之,其余各队列的优先权逐个降低。该算法赋予各个队列中进程执行时间片的大小也各
不相同,在优先权愈高的队列中,为每个进程所规定的执行时间片就愈小。例如,第二个队列的
时间片要比第一个队列的时间片长一倍,……,第 i+1 个队列的时间片要比第 i 个队列的时间片长
一倍。
(2) 当一个新进程进入内存后,首先将它放入第一队列的末尾,按 FCFS 原则排队等待调度。当
轮到该进程执行时,如它能在该时间片内完成,便可准备撤离系统;如果它在一个时间片结束时
尚未完成,调度程序便将该进程转入第二队列的末尾,再同样地按 FCFS 原则等待调度执行;如果
它在第二队列中运行一个时间片后仍未完成,再依次将它放入第三队列,……,如此下去,当一个
长作业(进程)从第一队列依次降到第 n 队列后,在第 n 队列便采取按时间片轮转的方式运行。
(3) 仅当第一队列空闲时,调度程序才调度第二队列中的进程运行;仅当第 1~(i-1)队列均空时,
才会调度第 i 队列中的进程运行。如果处理机正在第 i 队列中为某进程服务时,又有新进程进入优
先权较高的队列(第 1~(i-1)中的任何一个队列),则此时新进程将抢占正在运行进程的处理机,即
由调度程序把正在运行的进程放回到第 i 队列的末尾,把处理机分配给新到的高优先权进程。
在多级反馈队列调度算法中,如果规定第一个队列的时间片略大于多数人机交互所需之处理时间
时,便能够较好的满足各种类型用户的需要。
4.1.23. 什么是 CAS(比较并交换-乐观锁机制-锁自旋)
4.1.23.1. 概念及特性
CAS(Compare And Swap/Set)比较并交换,CAS 算法的过程是这样:它包含 3 个参数
CAS(V,E,N)。V 表示要更新的变量(内存值),E 表示预期值(旧的),N 表示新值。当且仅当 V 值等于 E 值时,才会将 V 的值设为 N,如果 V 值和 E 值不同,则说明已经有其他线程做了更新,则当
前线程什么都不做。最后,CAS 返回当前 V 的真实值。
CAS 操作是抱着乐观的态度进行的(乐观锁),它总是认为自己可以成功完成操作。当多个线程同时
使用 CAS 操作一个变量时,只有一个会胜出,并成功更新,其余均会失败。失败的线程不会被挂
起,仅是被告知失败,并且允许再次尝试,当然也允许失败的线程放弃操作。基于这样的原理,
CAS 操作即使没有锁,也可以发现其他线程对当前线程的干扰,并进行恰当的处理。
4.1.23.2. 原子包 java.util.concurrent.atomic(锁自旋)
JDK1.5 的原子包:java.util.concurrent.atomic 这个包里面提供了一组原子类。其基本的特性就
是在多线程环境下,当有多个线程同时执行这些类的实例包含的方法时,具有排他性,即当某个
线程进入方法,执行其中的指令时,不会被其他线程打断,而别的线程就像自旋锁一样,一直等
到该方法执行完成,才由 JVM 从等待队列中选择一个另一个线程进入,这只是一种逻辑上的理解。
相对于对于 synchronized 这种阻塞算法,CAS 是非阻塞算法的一种常见实现。由于一般 CPU 切
换时间比 CPU 指令集操作更加长, 所以 J.U.C 在性能上有了很大的提升。如下代码:
public class AtomicInteger extends Number implements java.io.Serializable {
private volatile int value;
public final int get() {
return value;
}
public final int getAndIncrement() {
for (;;) { //CAS 自旋,一直尝试,直达成功
int current = get();
int next = current + 1;
if (compareAndSet(current, next))
return current;
}
}
public final boolean compareAndSet(int expect, int update) {
return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
}
}
getAndIncrement 采用了 CAS 操作,每次从内存中读取数据然后将此数据和+1 后的结果进行
CAS 操作,如果成功就返回结果,否则重试直到成功为止。而 compareAndSet 利用 JNI 来完成
CPU 指令的操作。
4.1.23.3. ABA 问题
CAS 会导致“ABA 问题”。CAS 算法实现一个重要前提需要取出内存中某时刻的数据,而在下时
刻比较并替换,那么在这个时间差类会导致数据的变化。
比如说一个线程 one 从内存位置 V 中取出 A,这时候另一个线程 two 也从内存中取出 A,并且
two 进行了一些操作变成了 B,然后 two 又将 V 位置的数据变成 A,这时候线程 one 进行 CAS 操
作发现内存中仍然是 A,然后 one 操作成功。尽管线程 one 的 CAS 操作成功,但是不代表这个过
程就是没有问题的。
部分乐观锁的实现是通过版本号(version)的方式来解决 ABA 问题,乐观锁每次在执行数据的修
改操作时,都会带上一个版本号,一旦版本号和数据的版本号一致就可以执行修改操作并对版本
号执行+1 操作,否则就执行失败。因为每次操作的版本号都会随之增加,所以不会出现 ABA 问
题,因为版本号只会增加不会减少。
4.1.24. 什么是 AQS(抽象的队列同步器)
AbstractQueuedSynchronizer 类如其名,抽象的队列式的同步器,AQS 定义了一套多线程访问
共享资源的同步器框架,许多同步类实现都依赖于它,如常用的
ReentrantLock/Semaphore/CountDownLatch。
它维护了一个 volatile int state(代表共享资源)和一个 FIFO 线程等待队列(多线程争用资源被
阻塞时会进入此队列)。这里 volatile 是核心关键词,具体 volatile 的语义,在此不述。state 的
访问方式有三种:
getState()
setState()
compareAndSetState()
AQS 定义两种资源共享方式
Exclusive 独占资源-ReentrantLock
Exclusive(独占,只有一个线程能执行,如 ReentrantLock)
Share 共享资源-Semaphore/CountDownLatch
Share(共享,多个线程可同时执行,如 Semaphore/CountDownLatch)。
AQS 只是一个框架,具体资源的获取/释放方式交由自定义同步器去实现,AQS 这里只定义了一个
接口,具体资源的获取交由自定义同步器去实现了(通过 state 的 get/set/CAS)之所以没有定义成
abstract ,是 因 为独 占模 式 下 只 用实现 tryAcquire-tryRelease ,而 共享 模 式 下 只用 实 现
tryAcquireShared-tryReleaseShared。如果都定义成abstract,那么每个模式也要去实现另一模
式下的接口。不同的自定义同步器争用共享资源的方式也不同。自定义同步器在实现时只需要实
现共享资源 state 的获取与释放方式即可,至于具体线程等待队列的维护(如获取资源失败入队/
唤醒出队等),AQS 已经在顶层实现好了。自定义同步器实现时主要实现以下几种方法:
1.isHeldExclusively():该线程是否正在独占资源。只有用到 condition 才需要去实现它。
2.tryAcquire(int):独占方式。尝试获取资源,成功则返回 true,失败则返回 false。
3.tryRelease(int):独占方式。尝试释放资源,成功则返回 true,失败则返回 false。
4.tryAcquireShared(int):共享方式。尝试获取资源。负数表示失败;0 表示成功,但没有剩余
可用资源;正数表示成功,且有剩余资源。
5.tryReleaseShared(int):共享方式。尝试释放资源,如果释放后允许唤醒后续等待结点返回
true,否则返回 false。
同步器的实现是 ABS 核心(state 资源状态计数)
同步器的实现是 ABS 核心,以 ReentrantLock 为例,state 初始化为 0,表示未锁定状态。A 线程
lock()时,会调用 tryAcquire()独占该锁并将 state+1。此后,其他线程再 tryAcquire()时就会失
败,直到 A 线程 unlock()到 state=0(即释放锁)为止,其它线程才有机会获取该锁。当然,释放
锁之前,A 线程自己是可以重复获取此锁的(state 会累加),这就是可重入的概念。但要注意,
获取多少次就要释放多么次,这样才能保证 state 是能回到零态的。
以 CountDownLatch 以例,任务分为 N 个子线程去执行,state 也初始化为 N(注意 N 要与
线程个数一致)。这 N 个子线程是并行执行的,每个子线程执行完后 countDown()一次,state
会 CAS 减 1。等到所有子线程都执行完后(即 state=0),会 unpark()主调用线程,然后主调用线程
就会从 await()函数返回,继续后余动作。
ReentrantReadWriteLock 实现独占和共享两种方式
一般来说,自定义同步器要么是独占方法,要么是共享方式,他们也只需实现 tryAcquiretryRelease、tryAcquireShared-tryReleaseShared 中的一种即可。但 AQS 也支持自定义同步器
同时实现独占和共享两种方式,如 ReentrantReadWriteLock。
标签:脱发,ConcurrentHashMap,队列,调度,程序员,算法,线程,进程 来源: https://blog.csdn.net/weixin_49802371/article/details/120372466