Java 線程和操作系統(tǒng)的線程有啥區(qū)別?
想看解釋的小伙伴可直接翻到文末尋找答案。
1. 用戶空間和內(nèi)核空間
關(guān)于內(nèi)核態(tài)和用戶態(tài)我們?cè)?span id="nkk2ynw" class="Apple-converted-space">
了解操作系統(tǒng)的那些事兒,從這篇文章開始 這篇文章中已經(jīng)詳細(xì)介紹過,這里不再過多贅述。至于什么是系統(tǒng)空間和用戶空間也非常好理解:在操作系統(tǒng)中,內(nèi)存通常會(huì)被分成用戶空間(User space)與內(nèi)核空間(Kernel space)這兩個(gè)部分。當(dāng)進(jìn)程/線程運(yùn)行在用戶空間時(shí)就處于用戶態(tài),運(yùn)行在內(nèi)核空間時(shí)就處于內(nèi)核態(tài):
- 運(yùn)行在內(nèi)核態(tài)的程序可以訪問用戶空間和內(nèi)核空間,或者說它可以訪問計(jì)算機(jī)的任何資源,不受限制,為所欲為,例如協(xié)調(diào) CPU 資源,分配內(nèi)存資源,提供穩(wěn)定的環(huán)境供應(yīng)用程序運(yùn)行等
- 而應(yīng)用程序基本都是運(yùn)行在用戶態(tài)的,或者說用戶態(tài)就是提供應(yīng)用程序運(yùn)行的空間。運(yùn)行在用戶態(tài)的程序只能訪問用戶空間
那為什么要區(qū)分用戶態(tài)和內(nèi)核態(tài)呢?
其實(shí)早期操作系統(tǒng)是不區(qū)分用戶態(tài)和內(nèi)核態(tài)的,也就是說應(yīng)用程序可以訪問任意內(nèi)存空間,如果程序不穩(wěn)定常常會(huì)讓系統(tǒng)崩潰,比如清除了操作系統(tǒng)的內(nèi)存數(shù)據(jù)。為此大佬們?cè)O(shè)計(jì)出了一套規(guī)則:對(duì)于那些比較危險(xiǎn)的操作需要切到內(nèi)核態(tài)才能運(yùn)行,比如 CPU、內(nèi)存、設(shè)備等資源管理器程序就應(yīng)該在內(nèi)核態(tài)運(yùn)行,否則安全性沒有保證。
舉個(gè)例子,對(duì)于文件系統(tǒng)和數(shù)據(jù)來說,文件系統(tǒng)數(shù)據(jù)和管理就必須放在內(nèi)核態(tài),但是用戶的數(shù)據(jù)和管理可以放在用戶態(tài)。
用戶態(tài)的程序不能隨意操作內(nèi)核地址空間,這樣有效地防止了操作系統(tǒng)程序受到應(yīng)用程序的侵害。
那如果處于用戶態(tài)的程序想要訪問內(nèi)核空間的話怎么辦呢?就需要進(jìn)行系統(tǒng)調(diào)用從用戶態(tài)切換到內(nèi)核態(tài)。
2. 操作系統(tǒng)線程① 在用戶空間中實(shí)現(xiàn)線程在早期的操作系統(tǒng)中,所有的線程都是在用戶空間下實(shí)現(xiàn)的,操作系統(tǒng)只能看到線程所屬的進(jìn)程,而不能看到線程。
從我們開發(fā)者的角度來理解用戶級(jí)線程就是說:在這種模型下,我們需要自己定義線程的數(shù)據(jù)結(jié)構(gòu)、創(chuàng)建、銷毀、調(diào)度和維護(hù)等,這些線程運(yùn)行在操作系統(tǒng)的某個(gè)進(jìn)程內(nèi),然后操作系統(tǒng)直接對(duì)進(jìn)程進(jìn)行調(diào)度。
這種方式的好處一目了然,首先第一點(diǎn),就是即使操作系統(tǒng)原生不支持線程,我們也可以通過庫函數(shù)來支持線程;第二點(diǎn),線程的調(diào)度只發(fā)生在用戶態(tài),避免了操作系統(tǒng)從內(nèi)核態(tài)到用戶態(tài)的轉(zhuǎn)換開銷。
當(dāng)然缺點(diǎn)也很明顯:由于操作系統(tǒng)看不見線程,不知道線程的存在,而 CPU 的時(shí)間片切換是以進(jìn)程為維度的,所以如果進(jìn)程中某個(gè)線程進(jìn)行了耗時(shí)比較長的操作,那么由于用戶空間中沒有時(shí)鐘中斷機(jī)制,就會(huì)導(dǎo)致此進(jìn)程中的其它線程因?yàn)榈貌坏?CPU 資源而長時(shí)間的持續(xù)等待;另外,如果某個(gè)線程進(jìn)行系統(tǒng)調(diào)用時(shí)比如缺頁中斷而導(dǎo)致了線程阻塞,此時(shí)操作系統(tǒng)也會(huì)阻塞住整個(gè)進(jìn)程,即使這個(gè)進(jìn)程中其它線程還在工作。
② 在內(nèi)核空間中實(shí)現(xiàn)線程所謂內(nèi)核級(jí)線程就是運(yùn)行在內(nèi)核空間的線程, 直接由內(nèi)核負(fù)責(zé),只能由內(nèi)核來完成線程的調(diào)度。
幾乎所有的現(xiàn)代操作系統(tǒng),包括 Windows、Linux、Mac OS X 和 Solaris 等,都支持內(nèi)核線程。
每個(gè)內(nèi)核線程可以視為內(nèi)核的一個(gè)分身,這樣操作系統(tǒng)就有能力同時(shí)處理多件事情,支持多線程的內(nèi)核就叫做多線程內(nèi)核(Multi-Threads Kernel)。
從我們開發(fā)者的角度來理解內(nèi)核級(jí)線程就是說:我們可以直接使用操作系統(tǒng)中已經(jīng)內(nèi)置好的線程,線程的創(chuàng)建、銷毀、調(diào)度和維護(hù)等,都是直接由操作系統(tǒng)的內(nèi)核來實(shí)現(xiàn),我們只需要使用系統(tǒng)調(diào)用就好了,不需要像用戶級(jí)線程那樣自己設(shè)計(jì)線程調(diào)度等。
上圖畫的是 1:1 的線程模型,所謂線程模型,也就是用戶線程和內(nèi)核線程之間的關(guān)聯(lián)方式,線程模型當(dāng)然不止 1:1 這一種,下面我們來詳細(xì)解釋以下這三種多線程模型:
下文翻譯自 https://www.cs.uic.edu/~jbell/CourseNotes/OperatingSystems/4_Threads.html
1)多對(duì)一線程模型:
- 在多對(duì)一模型中,多個(gè)用戶級(jí)線程映射到某一個(gè)內(nèi)核線程上
- 線程管理由用戶空間中的線程庫處理,這非常有效
- 但是,如果進(jìn)行了阻塞系統(tǒng)調(diào)用,那么即使其他用戶線程能夠繼續(xù),整個(gè)進(jìn)程也會(huì)阻塞
- 由于單個(gè)內(nèi)核線程只能在單個(gè) CPU 上運(yùn)行,因此多對(duì)一模型不允許在多個(gè) CPU 之間拆分單個(gè)進(jìn)程
從并發(fā)性角度來總結(jié)下,雖然多對(duì)一模型允許開發(fā)人員創(chuàng)建任意多的用戶線程,但是由于內(nèi)核只能一次調(diào)度一個(gè)線程,所以并未增加并發(fā)性。現(xiàn)在已經(jīng)幾乎沒有操作系統(tǒng)來使用這個(gè)模型了,因?yàn)樗鼰o法利用多個(gè)處理核。
2)一對(duì)一線程模型:
- 一對(duì)一模型克服了多對(duì)一模型的問題
- 一對(duì)一模型創(chuàng)建一個(gè)單獨(dú)的內(nèi)核線程來處理每個(gè)用戶線程
- 但是,管理一對(duì)一模型的開銷更大,涉及更多開銷和減慢系統(tǒng)速度
- 此模型的大多數(shù)實(shí)現(xiàn)都限制了可以創(chuàng)建的線程數(shù)
從并發(fā)性角度來總結(jié)下,雖然一對(duì)一模型提供了更大的并發(fā)性,但是開發(fā)人員應(yīng)注意不要在應(yīng)用程序內(nèi)創(chuàng)建太多線程(有時(shí)系統(tǒng)可能會(huì)限制創(chuàng)建線程的數(shù)量),因?yàn)楣芾硪粚?duì)一模型的開銷更大。Windows (從 Win95 開始) 和 Linux 都實(shí)現(xiàn)了線程的一對(duì)一模型。
3)多對(duì)多線程模型:
- 多對(duì)多模型將任意數(shù)量的用戶線程復(fù)用到相同或更少數(shù)量的內(nèi)核線程上,結(jié)合了一對(duì)一和多對(duì)一模型的最佳特性
- 用戶對(duì)創(chuàng)建的線程數(shù)沒有限制
- 阻止內(nèi)核系統(tǒng)調(diào)用不會(huì)阻止整個(gè)進(jìn)程
- 進(jìn)程可以分布在多個(gè)處理器上
- 可以為各個(gè)進(jìn)程分配可變數(shù)量的內(nèi)核線程,具體取決于存在的 CPU 數(shù)量和其他因素
在進(jìn)入 Java 線程主題之前,有必要講解一下線程庫 Thread library 的概念。
在上面的模型介紹中,我們提到了通過線程庫來創(chuàng)建、管理線程,那么什么是線程庫呢?
線程庫就是為開發(fā)人員提供創(chuàng)建和管理線程的一套 API。
當(dāng)然,線程庫不僅可以在用戶空間中實(shí)現(xiàn),還可以在內(nèi)核空間中實(shí)現(xiàn)。前者涉及僅在用戶空間內(nèi)實(shí)現(xiàn)的 API 函數(shù),沒有內(nèi)核支持。后者涉及系統(tǒng)調(diào)用,也就是說調(diào)用庫中的一個(gè) API 函數(shù)將會(huì)導(dǎo)致對(duì)內(nèi)核的系統(tǒng)調(diào)用,并且需要具有線程庫支持的內(nèi)核。
下面簡單介紹下三個(gè)主要的線程庫:
1)POSIX Pthreads:可以作為用戶或內(nèi)核庫提供,作為 POSIX 標(biāo)準(zhǔn)的擴(kuò)展
2)Win32 線程:用于 Window 操作系統(tǒng)的內(nèi)核級(jí)線程庫
3)Java 線程:Java 線程 API 通常采用宿主系統(tǒng)的線程庫來實(shí)現(xiàn),也就是說在 Win 系統(tǒng)上,Java 線程 API 通常采用 Win API 來實(shí)現(xiàn),在 UNIX 類系統(tǒng)上,采用 Pthread 來實(shí)現(xiàn)。
下面我們來詳細(xì)講解 Java 線程:
事實(shí)上,在 JDK 1.2 之前,Java 線程是基于稱為 "綠色線程"(Green Threads)的用戶級(jí)線程實(shí)現(xiàn)的,也就是說程序員大佬們?yōu)?JVM 開發(fā)了自己的一套線程庫或者說線程管理機(jī)制。
而在 JDK 1.2 及以后,JVM 選擇了更加穩(wěn)定且方便使用的操作系統(tǒng)原生的內(nèi)核級(jí)線程,通過系統(tǒng)調(diào)用,將線程的調(diào)度交給了操作系統(tǒng)內(nèi)核。而對(duì)于不同的操作系統(tǒng)來說,它們本身的設(shè)計(jì)思路基本上是完全不一樣的,因此它們各自對(duì)于線程的設(shè)計(jì)也存在種種差異,所以 JVM 中明確聲明了:虛擬機(jī)中的線程狀態(tài),不反應(yīng)任何操作系統(tǒng)中的線程狀態(tài)。
也就是說,在 JDK 1.2 及之后的版本中,Java 的線程很大程度上依賴于操作系統(tǒng)采用什么樣的線程模型,這點(diǎn)在不同的平臺(tái)上沒有辦法達(dá)成一致,JVM 規(guī)范中也并未限定 Java 線程需要使用哪種線程模型來實(shí)現(xiàn),可能是一對(duì)一,也可能是多對(duì)多或多對(duì)一。
總結(jié)來說,回答下文題,現(xiàn)今 Java 中線程的本質(zhì),其實(shí)就是操作系統(tǒng)中的線程,其線程庫和線程模型很大程度上依賴于操作系統(tǒng)(宿主系統(tǒng))的具體實(shí)現(xiàn),比如在 Windows 中 Java 就是基于 Wind32 線程庫來管理線程,且 Windows 采用的是一對(duì)一的線程模型。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。