维卡是什么?


WEKA - 一款开源软件,提供数据预处理工具、多种机器学习算法的实现以及可视化工具,以便您可以开发机器学习技术并将其应用于现实世界的数据挖掘问题。下图总结了 WEKA 提供的功能 -

威卡总结

如果您观察图像流的开始,您就会明白处理大数据有很多阶段,以使其适合机器学习 -

首先,您将从现场收集的原始数据开始。该数据可能包含多个空值和不相关的字段。您可以使用 WEKA 中提供的数据预处理工具来清理数据。

然后,您可以将预处理后的数据保存在本地存储中以应用机器学习算法。

接下来,根据您尝试开发的 ML 模型的类型,您可以选择选项之一,例如Classify、ClusterAssociate。属性选择允许自动选择特征以创建简化的数据集。

请注意,在每个类别下,WEKA 都提供了多种算法的实现。您可以选择一种算法,设置所需的参数并在数据集上运行它。

然后,WEKA 将为您提供模型处理的统计输出。它为您提供了一个可视化工具来检查数据。

不同的模型可以应用于同一数据集。然后,您可以比较不同模型的输出,并选择最适合您的目的的模型。

因此,总体而言,使用 WEKA 可以加快机器学习模型的开发速度。

现在我们已经了解了 WEKA 是什么及其用途,在下一章中让我们学习如何在本地计算机上安装 WEKA。