无论c++还是c语言,字符串都是最常见的类之一。我们日常当中写的程序必然要存储数据。
我们的内置类型只能表示基础的信息,无法表示一些复杂的信息,比如int, double.但我们要表示身份证、住址那就表示不了了。
C语言用字符数组来表示字符串,但是这里有一个巨大的缺陷。
1.不够好用
2.不能够很好的管理
比如:用字符数组来存储地址,但是地址的长度要修改呢?这就很麻烦。
所以c++提供了一个管理字符串的一个类,string,你可以把它想象成存储字符的顺序表。
string的底层是一个字符数组,但是你可以把它想象成可以增删查改的数组。
string (const string& str);
为什么可以这样构造?
本质是类型转换,把const char* 转换成string.
它是先构造再拷贝构造,然后优化成了构造。
string (const string& str, size_t pos, size_t len = npos);
这里给了一个参数,npos,并且npos=-1;
-1代表什么,这里其实是无符号,所以-1表示42亿九千万。
npos很大意味着取到结束
容量没有把’0’算进去。
size和length
size和length有什么差异?
没有什么差异。
** 那为什么同时会有这两个东西呢?**
跟STL的发展历史有关。平时用size就可以了。
reserve
** 那假如我知道要开多少空间呢?**
我们可以调用这样一个接口,reserve
知道需要开多少空间,提前开空间,减少扩容,提高效率。
注意,你要100的空间,它不一定给你100的空间,它可能为了一些对齐等等的原因,可能开的比100大一些。
resize
resize和reserve功能相似,但也有很大区别。
resize除了开空间它还帮助初始化
那初始化填了什么值呢?
填的是0;
那我想填其他的值怎么办呢?
比size小,删除数据,保留前5个
但是它不会缩容。
这里提一个点,为什么编译器不会轻易的缩容?
缩容其实是不支持原地缩的,原地缩荣的话,那以为这要delete一部分空间,这增加了内存管理的难度。
真正缩荣都是开好另一块空间,然后将需要保留的数据拷贝过去。这也意味着缩容肯定会带来性能上的消耗。一般来说不要轻易的缩容。
resize可以删除数据
string 最好用的地方就是不用去管空间。
尾插
插入字符
插入字符串
但是我们不管是插入字符还是插入字符串都不喜欢这样写,我们喜欢用运算符重载+=;
不过+=底层还是调用了push_back和append.
insert
如果我们再头部或者中间插入一个数据,我们就可以用insert;
中间插入
不推荐经常使用,能不用就不用。因为要挪动数据,影响性能。
erase
删除一个字符
删除多个字符
不推荐经常使用,能不用就不用。因为要挪动数据,影响性能。
replace
将hello world 中间空格,替换成%%d
replace 能不用就不用,为什么?
1.空间不够就要扩容
2.需要挪动数据
有个题目,把hello world i love you 中的所有空格替换成%20
那上面的代码能不能优化一下呢?
每次都是从0的位置开始找,其实没必要。
还有一个点就是,replace可能会扩容。
再给大家看个好玩的东西
这个是以空间换时间的方式,不需要挪动数据。
如果不用[]加下标怎么访问string对象呢,这里要用到迭代器。
bein()表示第一个字符的地址,end()表示最后一个字符下一个位置的地址。
它是左闭右开。
其实还可以用范围for来访问,不过范围for的底层原理还是迭代器
swap
看下面的代码有什么区别?
s1.swap()和swap()有什么区别?
我们知道swap()是类模板,所有类型都可以交换,是泛型模板。
s1.swap()和swap()谁的效率高?
很明显s1.swap()的效率更高,s1和s2两段空间,只需要交换两段空间指针的指向就可以了。
而swap()要产生一个临时对象,需要调用拷贝构造,还是深拷贝,然后又需要两次赋值。
c_str
两者都可以打印数据,那它们的区别是什么?
s1.c_str()是遇到‘0’结束,而cout << s1 << endl;则是根据s1.size()来打印的。
c_str的主要作用还是,为c的接口提供兼容
find
find其实前面已经见过了,再看一个例子,怎样取文件名的后缀。
如果文件有多个点怎么样找后缀?
倒着找
除了正着访问string,还可以反着访问,这里要用到反向迭代器。
写成这样为什么会报错?
为什么要有返回const的迭代器呢?
不允许被修改。
普通迭代器和 const迭代器的区别?
能不能写的问题。
正向的普通迭代器和const迭代器一共就有4种,我们可以用auto来优化一下迭代器的写法。