SQL - 聚集索引


数据库中的索引是一种数据结构,有助于提高从表和视图中检索特定数据的速度

表中的数据以称为“堆”的无序数据结构的形式存储,其中行的放置没有任何特定的顺序。因此,当从表中检索数据时,查询优化器必须扫描整个表以找到所请求的行。这个过程可能非常耗时,尤其是当我们处理大型表时。为了加快数据检索的速度,SQL 提供了一种称为索引的数据对象,它以特定的方式存储和组织表数据,从而允许更快的数据访问。

SQL聚集索引

SQL 中的聚集索引是一种索引,它确定数据值在表中存储的物理顺序。

当在特定列上定义聚集索引时,在创建新表期间,数据将按排序顺序插入到该列中。这有助于更快地检索数据,因为数据是以特定顺序存储的。

  • 建议一张表只拥有一个聚集索引。如果我们在同一个表上创建多个聚集索引,则该表将不得不以多个顺序存储相同的数据,这是不可能的。
  • 当我们尝试在表上创建主键约束时,会自动在表上创建唯一聚集索引。但是,聚集索引与主键不同。主键是对一列或一组列施加唯一性的约束,而聚集索引则确定表中数据的物理顺序。
MySQL 数据库没有单独规定聚集索引和非聚集索引。当在表上定义 PRIMARY KEY 时,会自动创建聚集索引。当未定义 PRIMARY KEY 时,第一个 UNIQUE NOT NULL 键将被视为聚集索引。

句法

以下是使用 SQL Server 创建聚集索引的语法 -

CREATE INDEX index_name ON table_name(column_name [asc|desc])

在哪里,

  • index_name:指定要为正在创建的索引指定的名称。
  • column_name:指定将按指定顺序建立索引的列。
  • asc|desc:指定数据应排序的顺序(asc - 升序,desc - 降序)。默认排序顺序为升序。

例子

在此示例中,让我们在 SQL Server 中的表上创建聚集索引。为此,我们需要首先使用以下查询创建一个名为CUSTOMERS的表 -

CREATE TABLE CUSTOMERS( 
   ID INT NOT NULL, 
   NAME VARCHAR (20) NOT NULL, 
   AGE  INT NOT NULL, 
   ADDRESS CHAR (25), 
   SALARY DECIMAL (20, 2)
);

现在,使用以下查询将一些值插入到 CUSTOMERS 表中 -

INSERT INTO CUSTOMERS VALUES
(7, 'Muffy', '24', 'Indore', 5500),
(1, 'Ramesh', '32', 'Ahmedabad', 2000),
(6, 'Komal', '22', 'Hyderabad', 9000),
(2, 'Khilan', '25', 'Delhi', 1500),
(4, 'Chaitali', '25', 'Mumbai', 6500),
(5, 'Hardik','27', 'Bhopal', 8500),
(3, 'Kaushik', '23', 'Kota', 2000);

该表已在 SQL Server 数据库中成功创建。

ID 姓名 年龄 地址 薪水
7 莫菲 24 印多尔 5500.00
1 拉梅什 32 艾哈迈达巴德 2000.00
6 科马尔 22 海得拉巴 9000.00
2 基兰 25 德里 1500.00
4 柴塔利 25 孟买 6500.00
5 哈迪克 27 博帕尔 8500.00
3 考希克 23 科塔 2500.00

现在,让我们使用以下查询在名为ID的列上创建聚集索引-

CREATE CLUSTERED INDEX CLU_ID ON CUSTOMERS(ID ASC);

输出

执行上述查询时,输出显示如下 -

Commands Completed Successfully.

确认

要验证 ID 列上是否定义了聚集索引,请通过使用以下查询检索 CUSTOMERS 表的记录来检查它们是否已排序 -

SELECT * FROM CUSTOMERS;

表中的记录根据名为 ID 的列中的值按升序排序。

ID 姓名 年龄 地址 薪水
1 拉梅什 32 艾哈迈达巴德 2000.00
2 基兰 25 德里 1500.00
3 考希克 23 科塔 2500.00
4 柴塔利 25 孟买 6500.00
5 哈迪克 27 博帕尔 8500.00
6 科马尔 22 海得拉巴 9000.00
7 莫菲 24 印多尔 5500.00

在多列上创建聚集索引

通过以下示例,让我们了解在表的多个列上创建聚集索引时如何工作。

不要创建新表,而是考虑之前创建的 CUSTOMERS 表,并使用以下查询在此表的多个列(例如 AGE 和 SALARY)上定义聚集索引 -

CREATE CLUSTERED INDEX MUL_CLUS_ID 
ON CUSTOMERS (AGE, SALARY ASC);

输出

当我们执行上述查询时,获得的输出如下 -

Commands Completed Successfully.

确认

现在,让我们验证AGESALARY列中的值是否已排序 -

SELECT * FROM CUSTOMERS;

如下表所示,记录仅根据 AGE 列中的值排序,而不根据 SALARY 列中的值排序。因此,建议一张表只拥有一个聚集索引。

ID 姓名 年龄 地址 薪水
6 科马尔 22 海得拉巴 9000.00
3 考希克 23 科塔 2500.00
7 莫菲 24 印多尔 5500.00
2 基兰 25 德里 1500.00
4 柴塔利 25 孟买 6500.00
5 哈迪克 27 博帕尔 8500.00
1 拉梅什 32 艾哈迈达巴德 2000.00