如果您浏览过谷歌News,您会注意到类似主题的文章被分组在一起。谷歌扫描新文章,然后分析文本以确定哪些文章讨论了相同的主题。这是聚类分析的一个例子,我们将在本教程中学习。
如果你浏览过谷歌News,你很可能已经注意到类似主题的新闻文章被分组在一起。谷歌扫描互联网上的新文章,然后分析每篇文章中的文本,以确定哪些文章谈论同一主题!这本质上是一个无监督机器学习算法的结果。聚类分析是无监督学习算法的一个例子。集群的另一个例子是Twitter上的热门话题。Twitter实时浏览新推文,以确定单词、标签以及它们的组合,从而确定什么引起了热议。
无监督学习涉及使用机器学习技术来寻找模式,并对未标记的数据进行推断。标签数据具有某种与之关联的标记,例如名称或属性。这个标签可以是分类数据,也可以是数值数据。未标记的数据不包含标签。回到谷歌News的例子,新闻文章是无标签数据的例子。一组新闻文章中有重复的相似词和词联想。
常见的无监督学习算法有聚类分析、异常检测和神经网络。聚类分析包括分析未标记的数据并将相似的数据点分组在一起。数据点是根据某些特征分组的。这些群体被称为集群.聚类的一个常见例子是客户细分。聚类分析可以根据类似客户的人口统计数据和消费模式对其进行分组,并帮助企业根据不同的集群以不同的方式提供产品。
在本教程中,我们将学习以下内容:
无限访问这个标题和600+其他在我们的图书馆
频繁添加新游戏
随时取消