Weka - 启动资源管理器


在本章中,让我们研究一下浏览器为处理大数据而提供的各种功能。

当您单击应用程序选择器中的资源管理器按钮时,它将打开以下屏幕 -

资源管理器按钮

在顶部,您将看到此处列出的几个选项卡 -

  • 预处理
  • 分类
  • 联系
  • 选择属性
  • 可视化

在这些选项卡下,有几种预先实现的机器学习算法。现在让我们详细研究一下它们。

预处理选项卡

最初,当您打开资源管理器时,仅启用“预处理”选项卡。机器学习的第一步是预处理数据。因此,在“预处理”选项中,您将选择数据文件,对其进行处理并使其适合应用各种机器学习算法。

分类选项卡

“分类”选项卡为您提供了多种用于数据分类的机器学习算法。举几个例子,您可以应用线性回归、逻辑回归、支持向量机、决策树、随机树、随机森林、NaiveBayes 等算法。该列表非常详尽,并提供有监督和无监督的机器学习算法。

集群选项卡

Cluster选项卡下,提供了多种聚类算法 - 例如 SimpleKMeans、FilteredClusterer、HierarchicalClusterer 等。

关联选项卡

Associate选项卡下,您将找到 Apriori、FilteredAssociator 和 FPGrowth。

选择属性选项卡

选择属性允许您基于多种算法(例如 ClassifierSubsetEval、PrincipalComponents 等)进行功能选择。

可视化选项卡

最后,“可视化”选项允许您可视化处理后的数据以进行分析。

正如您所注意到的,WEKA 提供了几种即用型算法来测试和构建机器学习应用程序。要有效地使用 WEKA,您必须充分了解这些算法、它们的工作原理、在什么情况下选择哪一种算法、在处理后的输出中查找什么内容等等。简而言之,您必须在机器学习方面拥有坚实的基础,才能有效地使用 WEKA 构建应用程序。

在接下来的章节中,您将深入研究资源管理器中的每个选项卡。