JDK源码解析之 Java.lang.String

String 类代表字符串。Java 程序中的所有字符串字面值(如 “abc” )都作为此类的实例实现。
字符串是常量;它们的值在创建之后不能更改。字符串缓冲区支持可变的字符串。因为 String 对象是不可变的,所以可以共享。

一、类定义

public final class Stringimplements java.io.Serializable, Comparable<String>, CharSequence{...}

实现的三个接口:

  • java.io.Serializable:可被序列化的标志接口
  • Comparable:强行对实现它的每个类的对象进行整体排序
  • CharSequence:用来表示一个有序字符的集合

String类是一个被final修饰的常量类,常量类的特性为不可被任何类所继承,一旦String对象被创建,该对象是无法被改变的,直至该对象被销毁(特殊情况除外:如暴力反射)。

二、成员变量

//存储字段串
private final char value[];//缓存哈希值
private int hash; // Default to 0//用于序列化和反序列化之间的ID比对
private static final long serialVersionUID = -6849794470754667710L;//Class String is special cased within the Serialization Stream Protocol.
private static final ObjectStreamField[] serialPersistentFields = new ObjectStreamField[0];

从源码看出String底层使用一个字符数组来维护的。通过成员变量可以知道 String类 的值是 final 类型的,不能被改变的,所以只要一个值改变就会生成一个新的 String 类型对象,存储 String 数据也不一定从数组的第0个元素开始的,而是从 offset 所指的元素开始。

三、构造方法

//初始化一个新创建的 String 对象,使其表示一个空字符序列。 
public String() {
}//初始化一个新创建的 String 对象,使其表示一个与参数相同的字符序列;换句话说,新创建的字符串是该参数字符串的副本。
public String(String original) {
}//分配一个新的 String,使其表示字符数组参数中当前包含的字符序列。
public String(char value[]) {
}//分配一个新的 String,它包含取自字符数组参数一个子数组的字符。 
public String(char value[], int offset, int count) {
}//分配一个新的 String,它包含 Unicode 代码点数组参数一个子数组的字符。
public String(int[] codePoints, int offset, int count) {
}@Deprecated
public String(byte ascii[], int hibyte, int offset, int count) {
}@Deprecated
public String(byte ascii[], int hibyte) {
}//通过使用指定的字符集解码指定的 byte 子数组,构造一个新的 String。
public String(byte bytes[], int offset, int length, String charsetName)throws UnsupportedEncodingException {
}//通过使用指定的 charset 解码指定的 byte 子数组,构造一个新的 String。 
public String(byte bytes[], int offset, int length, Charset charset) {
}//通过使用指定的 charset 解码指定的 byte 数组,构造一个新的 String。 
public String(byte bytes[], String charsetName)throws UnsupportedEncodingException {
}//通过使用指定的 charset 解码指定的 byte 数组,构造一个新的 String。
public String(byte bytes[], Charset charset) {
}//通过使用平台的默认字符集解码指定的 byte 子数组,构造一个新的 String。
public String(byte bytes[], int offset, int length) {
}//通过使用平台的默认字符集解码指定的 byte 数组,构造一个新的 String。 
public String(byte bytes[]) {
}//分配一个新的字符串,它包含字符串缓冲区参数中当前包含的字符序列。
public String(StringBuffer buffer) {
}//分配一个新的字符串,它包含字符串生成器参数中当前包含的字符序列。
public String(StringBuilder builder) {
}/*
* Package private constructor which shares value array for speed.
* this constructor is always expected to be called with share==true.
* a separate constructor is needed because we already have a public
* String(char[]) constructor that makes a copy of the given char[].
*/
String(char[] value, boolean share) {
}

四、普通方法

1、equals(Object anObject)方法

比较字符串的内容是否相同

 public boolean equals(Object anObject) {if (this == anObject) {return true;}if (anObject instanceof String) {String anotherString = (String)anObject;int n = value.length;if (n == anotherString.value.length) {char v1[] = value;char v2[] = anotherString.value;int i = 0;while (n-- != 0) {if (v1[i] != v2[i])return false;i++;}return true;}}return false;}

String类里重写了Object里的equals方法,首先比较对象地址判断是否是两个相等的对象,若不相等再通过instanceof关键字比对传入对象是否是String的实例,若是则一一比对字符串的每一个字符;

2、hashCode()方法

String类的hashCode算法很简单,使用数字31作为乘数;

   public int hashCode() {int h = hash;if (h == 0 && value.length > 0) {char val[] = value;for (int i = 0; i < value.length; i++) {h = 31 * h + val[i];}hash = h;}return h;
}
3、charAt(int index) 方法

该方法的作用是得到字符串的指定索引位置的字符元素;

public char charAt(int index) {if ((index < 0) || (index >= value.length)) {throw new StringIndexOutOfBoundsException(index);}return value[index];
}
4、compareTo(String anotherString)方法

该方法是按字母顺序比较两个字符串中每个字符的 Unicode 值

 public int compareTo(String anotherString) {int len1 = value.length;int len2 = anotherString.value.length;int lim = Math.min(len1, len2);char v1[] = value;char v2[] = anotherString.value;int k = 0;while (k < lim) {char c1 = v1[k];char c2 = v2[k];if (c1 != c2) {return c1 - c2;}k++;}return len1 - len2;
}

当两个字符串某个位置的字符不同时,返回的是这一位置的字符 Unicode 值之差,当两个字符串都相同时,返回两个字符串长度之差。此外还有个compareToIgnoreCase()方法,该方法是在 compareTo() 方法的基础上忽略大小写。

5、concat(String str)方法

该方法的作用的将指定字符串拼接到原字符串末尾

public String concat(String str) {int otherLen = str.length();if (otherLen == 0) {return this;}int len = value.length;char buf[] = Arrays.copyOf(value, len + otherLen);str.getChars(buf, len);return new String(buf, true);}

首先判断要拼接字符串长度,若长度为0则返回原字符串,不为0则利用工具类Arrays中的静态方法copyOf来构建一个长度为原字符串和要拼接字符串的之和的字符数组 ,并将原字符串填充到字符数组前面,后面为空,再利用getChars方法将要拼接字符串放入字符数组后面为空的位置,最后返回一个拼接后的新字符串。

6、indexOf(int ch, int fromIndex) 方法

该方法的作用是从指定索引位置开始查找指定字符第一次出现的位置

public int indexOf(int ch, int fromIndex) {final int max = value.length;// 指定索引值小于0,默认从0开始搜索if (fromIndex < 0) {fromIndex = 0;} else if (fromIndex >= max) {// 指定索引值大于等于字符串长度,直接返回-1return -1;}// 一个char占用两个字节,如果ch小于2的16次方(65536),绝大多数字符都在此范围内if (ch < Character.MIN_SUPPLEMENTARY_CODE_POINT) {final char[] value = this.value;for (int i = fromIndex; i < max; i++) {if (value[i] == ch) {return i;}}return -1;} else {//当字符大于 65536时,处理的少数情况,该方法会首先判断是否是有效字符,然后依次进行比较return indexOfSupplementary(ch, fromIndex);}}

首先进行一系列的逻辑判断,最后for循环逐一判断对比,相等返回下标索引值,循环结束没有相等的就返回-1。

7、split(String regex, int limit) 方法

该方法的作用是将字符串分隔成指定正则表达式匹配后的字符串数组

   public String[] split(String regex, int limit) {/* 1、单个字符,且不是".$|()[{^?*+\\"其中一个* 2、两个字符,第一个是"\",第二个大小写字母或者数字*/char ch = 0;if (((regex.value.length == 1 &&".$|()[{^?*+\\".indexOf(ch = regex.charAt(0)) == -1) ||(regex.length() == 2 &&regex.charAt(0) == '\\' &&(((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 &&((ch-'a')|('z'-ch)) < 0 &&((ch-'A')|('Z'-ch)) < 0)) &&(ch < Character.MIN_HIGH_SURROGATE ||ch > Character.MAX_LOW_SURROGATE)){int off = 0;int next = 0;boolean limited = limit > 0;//大于0,limited==true,反之limited==falseArrayList<String> list = new ArrayList<>();while ((next = indexOf(ch, off)) != -1) {//当参数limit<=0 或者 集合list的长度小于 limit-1if (!limited || list.size() < limit - 1) {list.add(substring(off, next));off = next + 1;} else {//判断最后一个list.size() == limit - 1list.add(substring(off, value.length));off = value.length;break;}}//如果没有一个能匹配的,返回一个新的字符串,内容和原来的一样if (off == 0)return new String[]{this}; // 当 limit<=0 时,limited==false,或者集合的长度 小于 limit是,截取添加剩下的字符串if (!limited || list.size() < limit)list.add(substring(off, value.length));// 当 limit == 0 时,如果末尾添加的元素为空(长度为0),则集合长度不断减1,直到末尾不为空int resultSize = list.size();if (limit == 0) {while (resultSize > 0 && list.get(resultSize - 1).length() == 0) {resultSize--;}}String[] result = new String[resultSize];return list.subList(0, resultSize).toArray(result);
}
return Pattern.compile(regex).split(this, limit);
}
limit的取值存在三种情况:
  • limit>0,拆分limit-1次
String str = "a,b,c";
String[] c1 = str.split(",", 2);
System.out.println(c1.length);//2
System.out.println(Arrays.toString(c1));//{"a","b,c"}
1234
  • limit=0,拆分无限次且忽略原字符串后面的空白部分
String str = "a,b,c,,";
String[] c1 = str.split(",", 0);
System.out.println(c1.length);//3
System.out.println(Arrays.toString(c1));//{"a","b","c"}
1234
  • limit<0,拆分无限次
String str = "a,b,c,,";
String[] c1 = str.split(",", 0);
System.out.println(c1.length);//5
System.out.println(Arrays.toString(c1));//{"a","b","c","",""}
8、String replaceAll(String regex, String replacement) 方法

该方法的作用是将原字符串中符合正则表达式的都替换成指定的字符串

 public String replaceAll(String regex, String replacement) {return Pattern.compile(regex).matcher(this).replaceAll(replacement);}

此外还有个replace(char oldChar, char newChar)方法,作用是将所有olfChar都替换成newCher。

9、substring(int beginIndex, int endIndex) 方法

该方法的作用是返回从索引 beginIndex 到 endIndex 的子字符串

public String substring(int beginIndex, int endIndex) {if (beginIndex < 0) {//起始索引小于0抛出异常throw new StringIndexOutOfBoundsException(beginIndex);}if (endIndex > value.length) {//起始索引大于字符串长度抛出异常throw new StringIndexOutOfBoundsException(endIndex);}int subLen = endIndex - beginIndex;//起始索引大于截止索引抛出异常if (subLen < 0) {throw new StringIndexOutOfBoundsException(subLen);}return ((beginIndex == 0) && (endIndex == value.length)) ? this: new String(value, beginIndex, subLen);}
123456789101112131415

此外还有个重载方法substring(int beginIndex),作用是返回从索引 beginIndex 开始一直到结尾的子字符串。

五、拓展

1、常量池

JVM里有一块区域叫做常量池,常量池中的数据是那些在编译期间被确定,并被保存在已编译的.class文件中的一些数据。除了包含所有的8种基本数据类型(char、byte、short、int、long、float、double、boolean)外,还有String及其数组的常量值,另外还有一些以文本形式出现的符号引用。

我们声明字符串对象有两种常用的方式:
  • 通过"字面值"的形式直接赋值
String str="abc";
  • 通过构造函数构建对象
String str=new String("abc");
那么这两种方式有什么区别呢?我们来测试一下:
String str1 = "hello";
String str2 = "hello";
String str3 = new String("hello");
String str4 = new String("hello");
System.out.println(str1==str2);//true
System.out.println(str1==str3);//fasle
System.out.println(str3==str4);//fasle
通过上面这个例子充分说明了以下规律:

①、字面量创建字符串会先在字符串池中找,看是否有相等的对象,没有的话就在字符串池创建该对象;有的话则直接用池中的引用,避免重复创建对象。
②、new关键字创建时,直接在堆中创建一个新对象,变量所引用的都是这个新对象的地址。

实际在日常我们也很经常用表达式来拼接字符串,这些的字符串对象又是怎么得到的呢?
String str1 = "hello";
String str2 = "helloworld";
String str3 = str1+"world";//编译器不能确定为常量(会在堆区创建一个String对象)
String str4 = "hello"+"world";//编译器确定为常量,直接到常量池中引用
System.out.println(str2==str3);//fasle
System.out.println(str2==str4);//true
System.out.println(str3==str4);//fasle

从开头我们可以知道常量池保存的是在编译期间被确定一些数据,这些数据绝对不能是变量,因此我们可以很清楚的知道上面的这些例子为什么是这样的结果了。

2、关于String不可变

从开始我们就知道String类被final修饰,因此我们把它当做是不可变对象,它的值是同样被final修饰的字符数组:

private final char value[];

在java 中使用字符串最重要的一个规则必须记住,一个字符串对象一旦被创建,它的内容就是固定不变的

 public static String str = "abc";

这个声明会创建一个长度为3,内容为abc的字符串对象,您无法改变这个字符串对象的内容。

str = "1111";

不要以为这样就改变了字符串对象的内容,事实上。上面那段代码中产生了两个字符串对象,一个是abc字符串对象,长度为3;一个是1111字符串对象,长度为4,两个不同的字符串对象。您不不是在abc 字符串改为1111字符串,而是让str 引用名称从新引用1111字符串,而不在引用abc 字符串但abc字符串在内存中还是存在的,只是现在没有被引用。

String类为什么要被设置成不可变呢?
  • 安全
    • 引发安全问题,譬如,数据库的用户名、密码都是以字符串的形式传入来获得数据库的连接,或者在socket编程中,主机名和端口都是以字符串的形式传入。因为字符串是不可变的,所以它的值是不可改变的,否则黑客们可以钻到空子,改变字符串指向的对象的值,造成安全漏洞。
    • 保证线程安全,在并发场景下,多个线程同时读写资源时,会引竞态条件,由于 String 是不可变的,不会引发线程的问题而保证了线程。
    • HashCode,当 String 被创建出来的时候,hashcode也会随之被缓存,hashcode的计算与value有关,若 String 可变,那么 hashcode 也会随之变化,针对于 Map、Set 等容器,他们的键值需要保证唯一性和一致性,因此,String 的不可变性使其比其他对象更适合当容器的键值。
  • 性能
    • 当字符串是不可变时,字符串常量池才有意义。字符串常量池的出现,可以减少创建相同字面量的字符串,让不同的引用指向池中同一个字符串,为运行时节约很多的堆内存。若字符串可变,字符串常量池失去意义,基于常量池的String.intern()方法也失效,每次创建新的 String 将在堆内开辟出新的空间,占据更多的内存。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/535792.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

看到一个blog的标语,有意思!

"上世纪80年代勇气&#xff0c;90年代靠关系&#xff0c;现在必须靠知识能力&#xff01;挣钱靠1、兴趣广泛&#xff1b; 2、感觉敏锐&#xff1b; 3、集中力强&#xff1b; 4、个性不脆弱&#xff08;坚韧性&#xff09;&#xff1b; 5、能在瞬间了解因果关系&#xff1b…

JDK源码解析之 Java.lang.AbstractStringBuilder

这个抽象类是StringBuilder和StringBuffer的直接父类&#xff0c;而且定义了很多方法&#xff0c;因此在学习这两个类之间建议先学习 AbstractStringBuilder抽象类 该类在源码中注释是以JDK1.5开始作为前两个类的父类存在的&#xff0c;可是直到JDK1.8的API中&#xff0c;关于S…

RHEL下安装配置基于2台服务器的MYSQL集群

一、介绍这篇文档旨在介绍如何在RHEL下安装配置基于2台服务器的MySQL集群。并且实现任意一台服务器出现问题或宕机时MySQL依然能够继续运行。 注意&#xff01;虽然这是基于2台服务器的MySQL集群&#xff0c;但也必须有额外的第三台服务器作为管理节点&#xff0c;但这台服务器…

JDK源码解析之 Java.lang.StringBuffer

StringBuffer类表示一个可变的字符序列。StringBuffer的API与StringBuilder互相兼容&#xff0c;但是StringBuffer是线程安全的。在可能的情况下&#xff0c;建议优先使用StringBuilder&#xff0c;因为在大多数实现中它比StringBuffer更快。 一、类定义 public final class S…

redo和undo

这是在网上看到的对redo和undo的探讨&#xff1a; 1. redo 记录所有做过的事情&#xff0c;用于恢复 undo 记录事务的前镜相&#xff0c;用于回滚2. redo&#xff0c;恢复数据库时&#xff0c;按照重做日志文件来恢复你之前的操作 undo&#xff0c;撤消你做过的操作&#xff0…

JDK源码解析之 Java.lang.StringBuilder

StringBuilder类表示一个可变的字符序列。StringBuilder的API与StringBuffer互相兼容&#xff0c;但是StringBuilder是非线程安全的&#xff0c;在大多数实现中它比StringBuffer更快。 一、类定义 public final class StringBufferextends AbstractStringBuilderimplements ja…

从映射观点看索引

信息检索主要有“检”与“索&#xff08;办手续&#xff09;”两个动作。在图书馆借书时&#xff0c;一般而言&#xff0c; 找书的时间比办理手续的时间长得多&#xff0c;因而缩短检查时间是提高效率的关键。数据库中检 索信息也与此类似。 在没有索引文件时&#xff0c;DBM…

JDK源码解析之 Java.lang.Boolean

Boolean 类是将 boolean 基本类型进行包装。类型为 Boolean 的对象包含一个单一属性 value&#xff0c;其类型为 boolean。 此外还提供了许多将 boolean 转换为 String、String 转换为 boolean&#xff0c;以及其他一些方法。 一、类定义 public final class Boolean implemen…

MYSQL的集群的安装与配置(mysql-5.1.21)

具体安装与配置&#xff1a;1&#xff09;准备工作&#xff1a;6台机器&#xff0c;IP地址分别为192.168.0.&#xff08;231-236&#xff09;MGM节点&#xff1a;192.168.0.231(232)SQL 节点&#xff1a;192.168.0.233-234NDBD 节点&#xff1a;192.168.0.235-236系统都是REDHA…

JDK源码解析之 Java.lang.Byte

byte&#xff0c;即字节&#xff0c;由8位的二进制组成。在Java中&#xff0c;byte类型的数据是8位带符号的二进制数,以二进制补码表示的整数 取值范围&#xff1a;默认值为0&#xff0c;最小值为-128&#xff08;-27&#xff09;;最大值是127&#xff08;27-1&#xff09; Byt…

在命令行模式下管理SELinux

作者&#xff1a; Oslad.com (原创&#xff01;转载请注明出处) 2006-07-14 在 GUI 图形界面模式下&#xff0c;要更改 SELinux 的策略使用方式&#xff0c;只需依次点击“应用程序”&#xff0c;“系统设置”&#xff0c;“安全级别”&#xff1b;然后在“安全级别配置”对…

JDK源码解析之 Java.lang.Double

Double类是原始类型double的包装类&#xff0c;它包含若干有效处理double值的方法&#xff0c;如将其转换为字符串表示形式&#xff0c;反之亦然。Double类的对象可以包含一个double值。 Double类包装原始类型的值 double中的对象。类型的对象 Double包含一个类型为的字段 doub…

网页搜索帮助-禁止搜索引擎收录的方法

什么是robots.txt文件?搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时&#xff0c;会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件。您可以在您的网站中创建一个纯文本文件robots.txt&#xff0c;在文件中声明该网站…

JDK源码解析之 Java.lang.Float

Float类是原始类型float的包装类&#xff0c;它包含若干有效处理浮点值的方法&#xff0c;如将其转换为字符串表示形式&#xff0c;反之亦然。Float类的一个对象可以包含一个浮点值 一、类定义 public final class Float extends Number implements Comparable<Float> {…

FTP两种工作模式:主动模式(Active FTP)和被动模式(Passive FTP)

在主动模式下&#xff0c;FTP客户端随机开启一个大于1024的端口N向服务器的21号端口发起连接&#xff0c;然后开放N1号端口进行监听&#xff0c;并向服务器发出PORT N 1命令。服务器接收到命令后&#xff0c;会用其本地的FTP数据端口&#xff08;通常是20&#xff09;来连接客户…

JDK源码解析之 java.lang.Integer

teger 基本数据类型int 的包装类 Integer 类型的对象包含一个 int 类型的字段 一、类定义 public final class Integer extends Number implements Comparable<Integer>{}类被声明为final的,表示不能被继承;继承了Number抽象类,可以用于数字类型的一系列转换;实现了Comp…

Loadrunner的基本概念

1)vuser_init(only one &#xff0c;重复执行脚本的时候&#xff0c;此部分只会执行一次 ) %G< rJc*P 2)action( 一个或者多个 , 重复执行脚本的时候&#xff0c;只有该部分会按重复的次数重复执行 ) z*Xfjy(Mj 3)vuser_end(only one, 重复执行脚本的时候&#xff0c;此…

JDK源码解析之 java.lang.Long

Long 与Integer 是数值类型中使用频率最高的两个,也是提供支持方法最多的两个 他们提供出来的方法功能也是高度的相似 一、类定义 public final class Long extends Number implements Comparable<Long> {}类被声明为final的,表示不能被继承;继承了Number抽象类,可以用于…

sed教程入门与实例练习(一)

UNIX 世界中有很多文本编辑器可供我们选择。思考一下 — vi、emacs 和 jed 以及很多其它工具都会浮现在脑海中。我们都有自己已逐渐了解并且喜爱的编辑器&#xff08;以及我们喜爱的组合键&#xff09;。有了可信赖的编辑器&#xff0c;我们可以轻松处理任何数量与 UNIX 有关的…

JDK源码解析之 Java.lang.Short

Short类是基本类型short 的包装类&#xff0c;它包含几种有效处理短值的方法&#xff0c;如将其转换为字符串表示形式&#xff0c;反之亦然。Short类的对象可以包含单个短值。 一、类定义 public final class Short extends Number implements Comparable<Short> {}类被…