Python 切片字符串


在 Python 中,字符串是 Unicode 字符的有序序列。字符串中的每个字符在序列中都有唯一的索引。索引从 0 开始。字符串中的第一个字符的位置索引为 0。索引不断向字符串末尾递增。

如果字符串变量声明为 var="HELLO PYTHON",则字符串中每个字符的索引如下 -

字符串变量

Python 允许您通过索引访问字符串中的任何单个字符。在本例中,0 是字符串的下界,11 是字符串的上限。因此,var[0] 返回 H,var[6] 返回 P。如果方括号中的索引超出上限,Python 会引发 IndexError。

>>> var="HELLO PYTHON"
>>> var[0]
'H'
>>> var[7]
'Y'
>>> var[11]
'N'
>>> var[12]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: string index out of range

Python 序列类型(因此也是字符串对象)的独特功能之一是它还具有负索引方案。在上面的示例中,使用正索引方案,其中索引从左到右递增。在负索引的情况下,末尾的字符具有-1索引,并且索引从右到左递减,因此第一个字符H具有-12索引。

负索引

让我们使用负索引来获取 N、Y 和 H 字符。

>>> var[-1]
'N'
>>> var[-5]
'Y'
>>> var[-12]
'H'
>>> var[-13]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: string index out of range

再次,如果索引超出范围,则会遇到 IndexError。

因此,我们可以使用正索引或负索引从字符串中检索字符。

>>> var[0], var[-12]
('H', 'H')
>>> var[7], var[-5]
('Y', 'Y')
>>> var[11], var[-1]
('N', 'N')

在Python中,字符串是一个不可变的对象。如果对象一旦存储在某个内存位置就无法就地修改,则该对象是不可变的。您可以借助索引从字符串中检索任何字符,但不能用其他字符替换它。在我们的示例中,字符 Y 位于 HELLO PYTHON 中的索引 7 处。尝试用 y 替换 Y 并看看会发生什么。

var="HELLO PYTHON"
var[7]="y"
print (var)

它将产生以下输出-

Traceback (most recent call last):
 File "C:\Users\users\example.py", line 2, in <module>
  var[7]="y"
  ~~~^^^
TypeError: 'str' object does not support item assignment

TypeError 是因为字符串是不可变的。

Python 将“:”定义为字符串切片运算符。它从原始字符串返回一个子字符串。它的一般用法是 -

substr=var[x:y]

“:”运算符需要两个整数操作数(这两个操作数都可以省略,我们将在后续示例中看到)。第一个操作数 x 是所需切片的第一个字符的索引。第二个操作数 y 是所需字符串中最后一个字符旁边的字符的索引。因此 var(x:y] 将原始字符串中第 x 个位置到第 (y-1) 个位置的字符分隔开。

var="HELLO PYTHON"

print ("var:",var)
print ("var[3:8]:", var[3:8])

它将产生以下输出-

var: HELLO PYTHON
var[3:8]: LO PY

负索引也可以用于切片。

var="HELLO PYTHON"
print ("var:",var)
print ("var[3:8]:", var[3:8])
print ("var[-9:-4]:", var[-9:-4])

它将产生以下输出-

var: HELLO PYTHON
var[3:8]: LO PY
var[-9:-4]: LO PY

Python 的 Slice 运算符的两个操作数都是可选的。第一个操作数默认为零,这意味着如果我们不给出第一个操作数,切片将从第 0 个索引处的字符开始,即第一个字符。它将最左边的子字符串切成“y-1”个字符。

var="HELLO PYTHON"
print ("var:",var)
print ("var[0:5]:", var[0:5])
print ("var[:5]:", var[:5])

它将产生以下输出-

var: HELLO PYTHON
var[0:5]: HELLO
var[:5]: HELLO

同样,y 操作数也是可选的。默认情况下,它是“-1”,这意味着字符串将从第 x 个位置到字符串末尾进行切片。

var="HELLO PYTHON"
print ("var:",var)
print ("var[6:12]:", var[6:12])
print ("var[6:]:", var[6:])

它将产生以下输出 -

var: HELLO PYTHON
var[6:12]: PYTHON
var[6:]: PYTHON

当然,如果两个操作数都没有使用,则切片将等于原始字符串。这是因为“x”是0,“y”默认是最后一个索引+1(或-1)。

var="HELLO PYTHON"
print ("var:",var)
print ("var[0:12]:", var[0:12])
print ("var[:]:", var[:])

它将产生以下输出-

var: HELLO PYTHON
var[0:12]: HELLO PYTHON
var[:]: HELLO PYTHON

左侧操作数必须小于右侧操作数,才能获取原始字符串的子字符串。Python 不会引发任何错误,如果左操作数更大,则 bu 返回空字符串。

var="HELLO PYTHON"
print ("var:",var)
print ("var[-1:7]:", var[-1:7])
print ("var[7:0]:", var[7:0])

它将产生以下输出-

var: HELLO PYTHON
var[-1:7]:
var[7:0]:

切片返回一个新字符串。您可以很好地执行字符串操作,例如连接或对切片字符串进行切片。

var="HELLO PYTHON"

print ("var:",var)
print ("var[:6][:2]:", var[:6][:2])

var1=var[:6]
print ("slice:", var1)
print ("var1[:2]:", var1[:2])

它将产生以下输出-

var: HELLO PYTHON
var[:6][:2]: HE
slice: HELLO
var1[:2]: HE