FunTester Java 删除空字符:Java8 & Java11

FunTester · 2020年09月08日 · 719 次阅读

操作字符串是编程时经常遇到的,常用的比如在字符串中处理空格。到目前为止,Java提供了很多从字符串中删除空格的不同方法,即trimreplaceAll。但是,Java 11通过诸如stripstripLeadingstripTrailing之类的方法对这些方法进行了一些功能性的拓展。

在大多数情况下,我们只使用trim()方法删除空格。有时候不禁停下来想一想是否有更好的方法来满足我们的需求?当然,trim()在大多数情况下都能很好地工作,但是java中有许多不同的方法。每种都有自己的优点和缺点。

在本文中,将详细介绍在Java中从字符串中删除空格的不同方法

  • trim():从字符串中删除前缀和后缀空格
  • strip():删除字符串开头和结尾的空格。strip()方法支持Unicode字符集
  • trim vs striptrimstrip方法之间的差异
  • stripLeading():仅从字符串开头删除空格
  • stripTrailing():仅从字符串末尾删除空格
  • replace():用新字符替换所有目标字符
  • replaceAll():将所有正则匹配的字符替换为新字符
  • replaceFirst():使用新替换字符串替换第一次匹配成功的子字符串

  • 需要注意的最重要一点是,在Java中,字符串对象是不可变的。这意味着我们无法修改字符串,因此所有方法都将通过所有转换返回新字符串。

trim() 方法

trim()Java开发人员最常用的删除前导和尾随空格的方法。对于trim()方法,空格字符是指ASCII 值小于或等于 32('U + 0020')的任何字符。

public class FunTester {

    public static void main(String[] args) {
        String string = "    one    two    three    ";
        System.out.println("原始字符串: \"" + string +"\"");
        System.out.println("处理结果: \"" + string.trim() +"\"");
   }
}

控制台输出:

原始字符串: "    one    two    three    "
处理结果: "one    two    three"

strip() 方法

Java 11发行版中,添加了新的strip()方法以从String中删除前缀和后缀空格。

添加此方法的原因是,根据Unicode标准,存在各种空格字符,其ASCII 值大于 32('U + 0020')。例如:8193(U + 2001)。为了识别这些空格字符,Java 1.5Character类中添加了新方法isWhitespace(int)。此方法使用unicode识别空格字符。strip()方法使用此Character.isWhitespace(int)方法覆盖广泛的空白字符并将其删除。

public class StringStripTest {
    public static void main(String[] args) {
        String string = "    one    two    three    ";
        System.out.println("原始字符串: \"" + string+"\"");
        System.out.println("处理结果: \"" + string.strip()+"\"");
    }
}

控制台输出:

原始字符串: "    String    with    space    "
处理结果: "one    two    three"

Java 中 trim 和 strip 方法之间的区别

trim() strip()
从 Java 1 从 Java 11
使用 ASCII 值 使用 Unicode 值
删除前缀和后缀字符 (空格) 删除前缀和后缀字符 (空格)
删除 ASCII 值小于或等于'U+0020'或'32'的字符 根据 Unicode 删除所有空格字符
  • 让我们看一下使用大于32('U+0020')unicode的空白字符。
public class StringTrimVsStripTest {
    public static void main(String[] args) {
        String string = '\u2001'+"one    two    three"+ '\u2001';
        System.out.println("原始字符串: \"" + string+"\"");
        System.out.println("处理结果: \"" + string.trim()+"\"");
        System.out.println("处理结果: \"" + string.strip()+"\"");
   }
}

控制台输出:

原始字符串: "  one    two    three  "
处理结果: " one    two    three "
处理结果: "one    two    three"

在上面的示例中,我们可以看到trim()方法无法删除由'\u2001'Unicode字符添加的空格字符。

  • 注意:如果在 Windows 计算机上运行,​​则由于限制了unicode设置,可能看不到类似的输出。

stripLeading() 方法

Java 11中添加了stripLeading()方法,可从String中删除所有前缀空格。与strip()方法类似,stripLeading()也使用Character.isWhitespace(int)识别空白字符。

public class StringStripLeadingTest {
    public static void main(String[] args) {
        String string = "    one    two    three    ";
        System.out.println("原始字符串: \"" + string+"\"");
        System.out.println("处理结果 : \"" + string.stripLeading()+"\"");
    }
}

控制台输出:

原始字符串: "    one    two    three    "
处理结果 : "one    two    three    "

stripTrailing() 方法

Java 11中增加了stripTrailing()方法,可从String中删除所有后缀空格。与stripLeading()方法类似,stripTrailing()也使用Character.isWhitespace(int)识别空白。

public class StringStripTrailingTest {

    public static void main(String[] args) {
      String string = "    one    two    three    ";
      System.out.println("原始字符串: \"" + string+"\"");
        System.out.println("处理结果 : \"" + string.stripTrailing()+"\"");
    }
}

控制台输出:

原始字符串:"    one    two    three    "
处理结果 :"    one    two    three"

replace(CharSequence target, CharSequence replacement):

Java 1.5中添加,此方法用于将每个目标子字符串替换为指定的替换字符串。此方法替换所有匹配的目标字符。

  • 注意: java中的String类中提供了另一种方法replace(char oldChar,char newChar)。区别在于该方法参数是字符,而不是字符串。
public class StringReplaceTest {

    public static void main(String[] args) {
        String string = "    one    two    three    ";
        System.out.println("原始字符串 : \"" + string + "\"");
        System.out.println("处理结果: \"" + string.replace(" ", "") + "\"");
    }
}

控制台输出:

原始字符串  : "    one    two    three    "
处理结果 : "onetwothree"

replaceAll(String regex, String replacement)

Java 1.4中添加,这是最强大的字符串处理方法之一。使用replaceAll()方法,我们可以使用给定的替换字符串替换每个匹配的正则表达式子字符串。例如,删除所有空格,删除前导空格,删除尾随空格等等。我们只需要创建带有正确替换参数的正确正则表达式即可。参考:Java 和 Groovy 正则使用

  • 在 Java 中添加'/',我们必须使用转义字符,因此对于\s+,必须使用\\s+
public class StringReplaceAllTest {
    public static void main(String[] args) {
        String string = "    one    two    three    ";
        System.out.println("原始字符串 : \"" + string+"\"");
        System.out.println("处理结果 : \"" + string.replaceAll(" ", "") + "\"");
        System.out.println("处理结果 : \"" + string.replaceAll("\\s+", "") + "\"");
        System.out.println("处理结果  : \"" + string.replaceAll("^\\s+", "") + "\""); 
        System.out.println("处理结果 : \"" + string.replaceAll("\\s+$", "") + "\"");
    }
}

控制台输出:

原始字符串 : "    one    with    three    "
处理结果 : "onetwothree"
处理结果 : "onetwothree"
处理结果   : "one    two    three    "
处理结果  : "    one    two    three"

replaceFirst(String regex, String replacement)

Java 1.4中添加了replaceFirst()方法,只用替换字符串替换给定正则表达式的第一个匹配项,用于替换一个第一次出现的位置。例如,如果我们只需要删除前缀空格,则可以使用\\s+^\\s+。还可以使用此方法通过使用\\s+$正则表达式删除后缀空格。

public class StringReplaceFistTest {
      public static void main(String[] args) {
      String string = "    one    two    three    ";
      System.out.println("原始字符串   : \"" + string+"\"");
        System.out.println("处理结果  : \"" + string.replaceFirst("three", "four") + "\"");
        System.out.println("处理结果  : \"" + string.replaceFirst("\\s+", "") + "\"");
        System.out.println("处理结果 : \"" + string.replaceFirst("\\s+$", "") + "\"");    }
}

控制台输出:

原始字符串   : "    one    two    three    "
处理结果  : "    one    two    four    "
处理结果  : "one    two    three    "
处理结果 : "    one    two    three"

公众号FunTester首发,原创分享爱好者,腾讯云和掘金社区首页推荐,知乎七级原创作者,欢迎关注、交流,禁止第三方擅自转载。

FunTester 热文精选

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册