知识图和Youtube
对于视频推荐,Youtube使用协作过滤,该过滤只是一个矩阵,其中包括每个用户和每个视频的列和行。 如果用户尚未观看,则该矩阵的单元格为null,或者用户喜欢/不喜欢的操作的值。 这样,Youtube会检查我的视频历史记录并从矩阵中查找用户也喜欢与我相同的视频,并向我推荐这些用户也喜欢但我尚未观看的任何视频。 但是,关于过滤矩阵存在一些问题。 由于它是一个巨大的矩阵,因此非常稀疏并且充满了空单元格。 用户可能只观看了这些视频的一小部分。 还有一个问题是冷启动问题,即如果用户或上传的视频是新的,则没有足够的信号来推荐某些东西。 为了解决这个问题,Youtube开始建议主题相似的视频。 如何理解和分类每个YouTube视频的内容? Youtube使用基于深度学习的主题确定器应用程序,该应用程序检查视频的图像和声音并尝试确定其主题。 尽管它在视频主题分类方面相当擅长,但它并不完美,而且根据消息来源,价格也非常昂贵。 由于可以在视频的标题和说明中找到大多数信息,因此Youtube还会从那里对视频主题进行分类。 由于有数百万个具有不同主题的视频,因此要找出主题,Youtube使用知识图作为词汇,我们需要大量资源,我们也可以通过收集含义来推荐相关主题。 什么是知识图? 知识图的主要座右铭是“一切都是事物,而不是字符串”。 从本质上来说,这是一个巨大的图,通过事物之间的关系将它们联系起来。 它是一种结构化的数据,使机器也可以读取它。 Wikidata(Wikipedia的开放源代码项目)是知识图的一个很好的来源。…