當(dāng)前位置:首頁 > 公眾號(hào)精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]話說Java中String是有長(zhǎng)度限制的,聽到這里很多人不禁要問,String還有長(zhǎng)度限制?

前言

話說Java中String是有長(zhǎng)度限制的,聽到這里很多人不禁要問,String還有長(zhǎng)度限制?是的有,而且在JVM編譯中還有規(guī)范,而且有的家人們?cè)诿嬖嚨臅r(shí)候也遇到了,本人就遇到過面試的時(shí)候問這個(gè)的,而且在之前開發(fā)的中也真實(shí)地遇到過這個(gè)String長(zhǎng)度限制的場(chǎng)景(將某固定文件轉(zhuǎn)碼成Base64的形式用字符串存儲(chǔ),在運(yùn)行時(shí)需要的時(shí)候在轉(zhuǎn)回來,當(dāng)時(shí)文件比較大),那這個(gè)規(guī)范限制到底是怎么樣的,咱們?cè)挷欢嗾f先??去。

String

首先要知道String的長(zhǎng)度限制我們就需要知道String是怎么存儲(chǔ)字符串的,String其實(shí)是使用的一個(gè)char類型的數(shù)組來存儲(chǔ)字符串中的字符的。

面試官:String長(zhǎng)度有限制嗎?是多少?

存儲(chǔ)String的容器原來是它

那么String既然是數(shù)組存儲(chǔ)那數(shù)組會(huì)有長(zhǎng)度的限制嗎?是的有限制,但是是在有先提條件下的,我們看看String中返回length的方法。

面試官:String長(zhǎng)度有限制嗎?是多少?

String類中的length方法

由此我們看到返回值類型是int類型,Java中定義數(shù)組是可以給數(shù)組指定長(zhǎng)度的,當(dāng)然不指定的話默認(rèn)會(huì)根據(jù)數(shù)組元素來指定:

int[] arr1 = new int[10]; // 定義一個(gè)長(zhǎng)度為10的數(shù)組 int[] arr2 = {1,2,3,4,5}; // 那么此時(shí)數(shù)組的長(zhǎng)度為5

整數(shù)在java中是有限制的,我們通過源碼來看看int類型對(duì)應(yīng)的包裝類Integer可以看到,其長(zhǎng)度最大限制為2^31 -1,那么說明了數(shù)組的長(zhǎng)度是0~2^31-1,那么計(jì)算一下就是(2^31-1 = 2147483647 = 4GB)

面試官:String長(zhǎng)度有限制嗎?是多少?

Integer的取值范圍

看到這我們嘗試通過編碼來驗(yàn)證一下上述觀點(diǎn)。

面試官:String長(zhǎng)度有限制嗎?是多少?

以字面量形式定義字符串

以上是我通過定義字面量的形式構(gòu)造的10萬個(gè)字符的字符串,編譯之后虛擬機(jī)提示報(bào)錯(cuò),說我們的字符串長(zhǎng)度過長(zhǎng),不是說好了可以存21億個(gè)嗎?為什么才10萬個(gè)就報(bào)錯(cuò)了呢?
其實(shí)這里涉及到了JVM編譯規(guī)范的限制了,其實(shí)JVM在編譯時(shí),如果我們將字符串定義成了字面量的形式,編譯時(shí)JVM是會(huì)將其存放在常量池中,這時(shí)候JVM對(duì)這個(gè)常量池存儲(chǔ)String類型做出了限制,接下來我們先看下手冊(cè)是如何說的。

面試官:String長(zhǎng)度有限制嗎?是多少?

java虛擬機(jī)規(guī)范截圖

常量池中,每個(gè) cp_info 項(xiàng)的格式必須相同,它們都以一個(gè)表示 cp_info 類型的單字節(jié) “tag”項(xiàng)開頭。后面 info[]項(xiàng)的內(nèi)容 由tag 的類型所決定。

面試官:String長(zhǎng)度有限制嗎?是多少?

java虛擬機(jī)規(guī)范手冊(cè)常量類型表

我們可以看到 String類型的表示是 CONSTANT_String ,我們來看下CONSTANT_String具體是如何定義的。

面試官:String長(zhǎng)度有限制嗎?是多少?

這里定義的 u2 string_index 表示的是常量池的有效索引,其類型是CONSTANT_Utf8_info 結(jié)構(gòu)體表示的,這里我們需要注意的是其中定義的length我們看下面這張圖。

面試官:String長(zhǎng)度有限制嗎?是多少?

在class文件中u2表示的是無符號(hào)數(shù)占2個(gè)字節(jié)單位,我們知道1個(gè)字節(jié)占8位,2個(gè)字節(jié)就是16位 ,那么2個(gè)字節(jié)能表示的范圍就是2^16- 1 = 65535 。范中class文件格式對(duì)u1、u2的定義的解釋做了一下摘要:

這里對(duì)java虛擬機(jī)規(guī)摘要部分
1、class文件中文件內(nèi)容類型解釋
定義一組私有數(shù)據(jù)類型來表示 Class 文件的內(nèi)容,它們包括 u1,u2 和 u4,分別代
表了 1、2 和 4 個(gè)字節(jié)的無符號(hào)數(shù)。
每個(gè) Class 文件都是由 8 字節(jié)為單位的字節(jié)流組成,所有的 16 位、32 位和 64 位長(zhǎng)度的數(shù)
據(jù)將被構(gòu)造成 2 個(gè)、4 個(gè)和 8 個(gè) 8 字節(jié)單位來表示。

2、程序異常處理的有效范圍解釋
start_pc 和 end_pc 兩項(xiàng)的值表明了異常處理器在 code[]數(shù)組中的有效范圍。
start_pc 必須是對(duì)當(dāng)前 code[]數(shù)組中某一指令的操作碼的有效索引,end_pc 要
么是對(duì)當(dāng)前 code[]數(shù)組中某一指令的操作碼的有效索引,要么等于 code_length
的值,即當(dāng)前 code[]數(shù)組的長(zhǎng)度。start_pc 的值必須比 end_pc 小。
當(dāng)程序計(jì)數(shù)器在范圍[start_pc, end_pc)內(nèi)時(shí),異常處理器就將生效。即設(shè) x 為
異常句柄的有效范圍內(nèi)的值,x 滿足:start_pc ≤ x < end_pc。
實(shí)際上,end_pc 值本身不屬于異常處理器的有效范圍這點(diǎn)屬于 Java 虛擬機(jī)歷史上
的一個(gè)設(shè)計(jì)缺陷:如果 Java 虛擬機(jī)中的一個(gè)方法的 code 屬性的長(zhǎng)度剛好是 65535
個(gè)字節(jié),并且以一個(gè) 1 個(gè)字節(jié)長(zhǎng)度的指令結(jié)束,那么這條指令將不能被異常處理器
所處理。不過編譯器可以通過限制任何方法、實(shí)例初始化方法或類初始化方法的
code[]數(shù)組最大長(zhǎng)度為 65534,這樣可以間接彌補(bǔ)這個(gè) BUG。

注意:這里對(duì)個(gè)人認(rèn)為比較重要的點(diǎn)做了標(biāo)記,首先第一個(gè)加粗說白了就是說數(shù)組有效范圍就是【0-65565】但是第二個(gè)加粗的地方又解釋了,因?yàn)樘摂M機(jī)還需要1個(gè)字節(jié)的指令作為結(jié)束,所以其實(shí)真正的有效范圍是【0-65564】,這里要注意這里的范圍僅限編譯時(shí)期,如果你是運(yùn)行時(shí)拼接的字符串是可以超出這個(gè)范圍的。

接下來我們通過一個(gè)小實(shí)驗(yàn)來測(cè)試一下我們構(gòu)建一個(gè)長(zhǎng)度為65534的字符串,看看是否就能編譯通過。
首先通過一個(gè)for循環(huán)構(gòu)建65534長(zhǎng)度的字符串,在控制臺(tái)打印后,我們通過自己度娘的一個(gè)在線字符統(tǒng)計(jì)工具計(jì)算了一下確實(shí)是65534個(gè)字符,如下:

面試官:String長(zhǎng)度有限制嗎?是多少?

面試官:String長(zhǎng)度有限制嗎?是多少?

然后我們將字符復(fù)制后以定義字面量的形式賦值給字符串,可以看到我們選擇這些字符右下角顯示的確實(shí)是65534,于是乎運(yùn)行了一波,果然成功了。

面試官:String長(zhǎng)度有限制嗎?是多少?

面試官:String長(zhǎng)度有限制嗎?是多少?

看到這里我們來總結(jié)一下:
問:字符串有長(zhǎng)度限制嗎?是多少?

答:首先字符串的內(nèi)容是由一個(gè)字符數(shù)組 char[] 來存儲(chǔ)的,由于數(shù)組的長(zhǎng)度及索引是整數(shù),且String類中返回字符串長(zhǎng)度的方法length() 的返回值也是int ,所以通過查看java源碼中的類Integer我們可以看到Integer的最大范圍是2^31 -1,由于數(shù)組是從0開始的,所以數(shù)組的最大長(zhǎng)度可以使【0~2^31-1】通過計(jì)算是大概4GB。

但是通過翻閱java虛擬機(jī)手冊(cè)對(duì)class文件格式的定義以及常量池中對(duì)String類型的結(jié)構(gòu)體定義我們可以知道對(duì)于索引定義了u2,就是無符號(hào)占2個(gè)字節(jié),2個(gè)字節(jié)可以表示的最大范圍是2^16 -1 = 65535。
其實(shí)是65535,但是由于JVM需要1個(gè)字節(jié)表示結(jié)束指令,所以這個(gè)范圍就為65534了。超出這個(gè)范圍在編譯時(shí)期是會(huì)報(bào)錯(cuò)的,但是運(yùn)行時(shí)拼接或者賦值的話范圍是在整形的最大范圍。

解析到這里就告一段落了,如果覺得在下講得對(duì)你有幫助的可以點(diǎn)一波贊或者在看,如果發(fā)現(xiàn)有講的不好的或者有什么遺漏的,歡迎評(píng)論區(qū)留言相互學(xué)習(xí)交流。

PS:如果覺得我的分享不錯(cuò),歡迎大家隨手點(diǎn)贊、在看。





			
			
		
		
		


			
			
		
		
		

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉