SAS - 数据集


可供 SAS 程序分析的数据称为 SAS 数据集。它是使用 DATA 步骤创建的。SAS 可以读取各种文件作为其数据源,例如CSV、Excel、Access、SPSS 以及原始数据。它还具有许多可供使用的内置数据源。

  • 如果数据集被 SAS 程序使用,然后在会话运行后被丢弃,则称为临时数据集。

  • 但如果它被永久存储以供将来使用,则称为永久数据集。所有永久数据集都存储在特定的库下。

SAS 数据集以行和列的形式存储,也称为 SAS 数据表。下面我们看到永久数据集的示例,这些数据集是内置的以及来自外部源的红色。

SAS 内置数据集

这些数据集已在安装的 SAS 软件中可用。可以探索和使用它们来制定数据分析的样本表达式。要探索这些数据集,请转至Libraries -> My Libraries -> SASHELP。展开它后,我们会看到所有可用内置数据集的名称列表。

data_sets_1_explore

让我们向下滚动找到名为CARS的数据集。双击该数据集将在右侧窗格中打开它,我们可以在其中进一步探索它。我们还可以使用右侧窗格下的最大化视图按钮来最小化左侧窗格。

数据集_2_CARS

我们可以使用底部的滚动条向右滚动以浏览表中的所有列及其值。

data_sets_3_CARS_explore

导入外部数据集

我们可以使用 SAS Studio 中提供的导入功能将自己的文件导出为数据集。但这些文件必须在 SAS 服务器文件夹中可用。因此,我们必须使用“服务器文件和文件夹”下的上传选项将源数据文件上传到 SAS 文件夹。

data_sets_4_1_loacl_files_to_server

接下来,我们通过导入在 SAS 程序中使用上述文件。为此,我们使用选项“任务”->“实用程序”->“导入数据”,如下所示。双击“导入数据”按钮,将在右侧打开窗口,为数据集选择文件。

接下来单击右窗格中导入数据程序下的选择文件按钮。以下是可以导入的文件类型的列表。

data_sets_5_import_files

我们选择存储在本地系统中的“employee.txt”文件并导入该文件,如下所示。

data_sets_4_2_import_utility

查看导入的数据

我们可以通过运行使用“运行”选项生成的默认导入代码来查看导入的数据

data_sets_6_view_imported_data

我们可以使用与上述相同的方法导入任何其他文件类型,并在各种 SAS 程序中使用它。