今天想通过和大家分享如何删除字符串最后一个字符的N种实现方法,来回顾一些基础知识点。
这类方法是通过string类型自身方法直接实现。
相信大多数人第一个想到的可能就是这个方法。Substring方法是字符串内置方法,可以通过指定起始索引位置为0以及长度为字符串长度减1,直接截取指定长度的子字符串,从而达到删除最后一个字符目的。
示例代码如下:
public static string StringSubstring(string source)
{
return source.Substring(0, source.Length - 1);
}
这个方法可以说是最简洁的方法,可能大家用的不是很多。范围运算符是从C# 8开始支持的。它的形式如:variate[start..end],指定某一索引范围的开头和末尾作为其操作数。左侧操作数是范围的包含性开头。右侧操作数是范围的不包含性末尾。任一操作数都可以是序列开头或末尾的索引。
下面列举了表达集合范围的各种方法:
范围运算符也适用于字符串,实现代码如下:
public static string StringRangeOperator(string source)
{
return source[..^1];
}
Remove方法是字符串内置方法,可以删除从指定起始索引位置起到结尾的所有字符,因此可以把起始索引定为最后一个字符,从而达到删除最后一个字符目的。
示例代码如下:
public static string StringRemove(string source)
{
return source.Remove(source.Length - 1);
}
Create方法是字符串的静态方法,这个方法相信大家用的比较少,其作用是创建一个具有特定长度的新字符串,并在创建后使用指定的回调对其进行初始化。下面我们直接看下实现代码:
public static string StringCreate(string source)
{
return string.Create(source.Length - 1, source, (span, state) =>
{
for (var i = 0; i < state.Length - 1; i++)
{
span[i] = state[i];
}
});
}
下面对上面代码做个简单解释,第一个参数source.Length – 1是创建比原字符串长度少1位的目标字符串;第二个参数source是把原字符串当作参数传入,用于给第三个参数使用;第三个参数是一个两个参数无返回值委托,其中span参数表示目标字符串对应的Span
,state参数表示原字符串即第二个参数值,for循环即是把原字符串字符循环赋值给目标字符串。
上面四种方法主要是使用了字符串自身的内置方法进行操作,下面我们对四个方法进行三组对比性能测试,每组分别为长度为100、1000、10000的字符串。
通过测试结果不难发现,除了Create方法,其他三个方法差别不大,综合来看可以说Remove最优。
如果需要对大量字符串操作,相信大家会立即想到用StringBuilder来进行性能优化,下面简单介绍两种使用StringBuilder方式来删除字符串最后一个字符。
字符串就相当于字符数组,因此我们可以循环字符串,然后使用StringBuilder的Append方法进行拼接,实现代码如下:
public static string StringBuilderAppend(string source)
{
var sb = new StringBuilder();
for (var i = 0; i < source.Length - 1; i++)
{
sb.Append(source[i]);
}
return sb.ToString();
}
相信大家看到这个标题应该比较疑惑,这是什么意思,我们先看代码再讲解:
public static string StringBuilderLength(string source)
{
var sb = new StringBuilder(source);
sb.Length--;
return sb.ToString();
}
首先第一行代码表示通过原字符串创建一个可变字符串;重点就在第二行,直接对StringBuilder长度执行减1操作;最后再把StringBuilder转为字符串返回。
首先StringBuilder的Length属性表示当前可变字符串包含的字符数,当对其进行减1操作时,相当于告诉StringBuilder对象忽略最后一个字符,其内部并没有真的删除任何字符,被忽略的字符仍包含再StringBuilder对象内部,只是不再将其视为字符串的一部分,因此在调用.ToString方法时返回的就是我们想要的字符串。
下面我们对两个方法进行三组对比性能测试,每组分别为长度为100、1000、10000的字符串。
通过这组测试结果很容易发现,直接操作Length属性性能显著优越于Append方法,但是和字符串直接操作的方式相比还差了不少。
上面我们提到字符串相当于字符数组,因此我们可以直接使用数组相应的方法。
我们可以直接构建一个目标字符数组,然后把原字符串中相应的字符复制到新字符数组中,最后把新字符数组转成字符串返回即可,代码如下:
public static string ArrayFor(string source)
{
var chars = new char[source.Length - 1];
for (var i = 0; i < chars.Length; i++)
{
chars[i] = source[i];
}
return new string(chars);
}
这个方法大家可能用的比较少,它可以把数组元素个数更改为指定的大小。其思想有点像上面StringBuilder对象直接修改Length属性。下面直接看看代码:
public static string ArrayResize(string source)
{
var chars = source.ToCharArray();
Array.Resize(ref chars, chars.Length - 1);
return new string(chars);
}
这个方法相信大家应该有点影响,我们前面的文章也有提到过。简单来说就是把原数组复制到目标数组中,代码如下:
public static string ArrayCopyTo(string source)
{
var chars = new char[source.Length - 1];
source.CopyTo(0, chars, 0, chars.Length);
return new string(chars);
}
String方式是值当把原字符串转换为字符数组后,直接使用String构造方法从字符数组中指定位置处开始并指定长度,来获取我们想要的结果。代码如下:
public static string ArrayString(string source)
{
var chars = source.ToCharArray();
return new string(chars, 0, chars.Length - 1);
}
其中字符串构造函数第一个参数表示字符数组,第二个参数表示从字符数组第0个索引开始,第三个参数表示取字符数组的元素个数。
同样对上面四种方法进行三组对比性能测试,每组分别为长度为100、1000、10000的字符串。
通过测试结果不难发现,CopyTo方法和String方式相对较好,比之StringBuilder方式还要好些。
Linq方式的核心思想是通过Linq方法获取目标字符串对应的字符数组,然后再转为字符串返回。
Take方法主要作用是从序列的开头返回指定数目的连续元素,因此代码实现如下:
public static string LinqTake(string source)
{
return new string(source.Take(source.Length - 1).ToArray());
}
SkipLast方法是从C# 8才开始有的,其作用是返回集合排除最后指定个数的元素外的所有元素。
public static string LinqSkipLast(string source)
{
return new string(source.SkipLast(1).ToArray());
}
Range方法相信大家用的也比较少,其作用是生成指定范围内的整数序列。我们先来看代码然后再做解释:
public static string LinqRange(string source)
{
return new string(Enumerable.Range(0, source.Length - 1).Select(i => source[i]).ToArray());
}
这里Range方法相当于生成了目标字符串索引序列,即[0.. source.Length – 1],然后再通过Seletc方法取原字符串相应的字符,最后得到结果。
同样对上面三种方法进行三组对比性能测试,每组分别为长度为100、1000、10000的字符串。
通过测试结果不难发现,Range + Select方法相对较好,但是比之前几类方法就差的太远了。
这类方法是通过Linq方法和字符串方法组合的方式实现。
Concat方法是字符串的静态方法可以连接多个字符成为一个新的字符串,然后通过Linq的SkipLast方法配合达到我们的目的,代码如下:
public static string LinqStringConcat(string source)
{
return string.Concat(source.SkipLast(1));
}
Join方法也是字符串的静态方法,主要作用是使用指定的分隔符连接集合的成员。因此也可以达到Concat类似的效果。
public static string LinqStringJoin(string source)
{
return string.Join("", source.SkipLast(1));
}
下面我们对两个方法进行三组对比性能测试,每组分别为长度为100、1000、10000的字符串。
通过这组测试结果说明两者相差不大,相对于之前的方法更差了。
数据视图方式的核心思想是通过Span、Memory和ArraySegment实现。
Span
是一个轻量级的、非托管的视图,用于表示连续的内存块。它可以直接操作栈上的内存。AsSpan方法可以通过指定起始索引和长度,直接在原字符串上获取到目标字符串视图,然后转成字符串返回,代码实现如下:
public static string Span(string source)
{
var span = source.AsSpan(0, source.Length - 1);
return new string(span);
}
Memory
也是一个内存视图,但与 Span
不同,它可以存储在 heap 上。AsMemory方法用法和AsSpan方法类似,代码如下:
public static string Memory(string source)
{
var memory = source.AsMemory(0, source.Length - 1);
return new string(memory.Span);
}
ArraySegment
封装了对数组的一部分的引用,并维护了该部分的起始位置和长度。
public static string ArraySegment(string source)
{
var segment = new ArraySegment<char>(source.ToCharArray(), 0, source.Length - 1);
return new string(segment.Array, segment.Offset, segment.Count);
}
同样对上面三种方法进行三组对比性能测试,每组分别为长度为100、1000、10000的字符串。
通过测试结果可以发现,三种方法性能都是相当高,当然其中ArraySegment方法相对要差一些。总统来说数据视图方式已经和第一类字符串方式不相上下了。
这里解释两种正则表达式实现的方法。
Replace方法是Regex的静态方法,代码如下:
public static string RegexReplace(string source)
{
return Regex.Replace(source, ".$", "");
}
Match方法也是Regex的静态方法,代码如下:
public static string RegexMatch(string source)
{
var match = Regex.Match(source, @"^(.*).$");
return match.Groups[1].Value;
}
下面我们对两个方法进行三组对比性能测试,每组分别为长度为100、1000、10000的字符串。
通过这组测试结果说明两者相差不大,相对于之前的方法性能差别居中。
从整体来看,使用第一类字符串方式性能又高代码又简洁是最优选,而列举了那么多种方法主要目的还是熟悉一些基础方法,虽然在这个案例里不是最优解,但是说不定在其他地方就用的恰到好处。
我们都知道做同样一件事件可能有很多种方法,然后可以选择出一种最优的方法,但是这个前提是你要知道这些方法是什么,你才能有的选。
注
:测试方法代码以及示例源码都已经上传至代码库,有兴趣的可以看看。
https://gitee.com/hugogoos/Planner