• 其他语言



确定管理数字音频内容的新方法
页面和feed选项
打印
收藏此页
Digg此页 | 添加到您的del.icio.us帐号
目录

确定内容
今天,人们如何管理数字音频内容?大多数内容是通过添加 ID3 标记或一些类似方法来进行管理。MPEG 层 I、II、III 不具备标识内容的内置方法,因此开发人员开发出了 ID3 标记方案。原始布局 ID3v1 的定义如下:

歌曲曲名30 个字符
演唱者30 个字符
专辑30 个字符
年份4 个字符
评论30 个字符
流派1 个字节
ID3 V1 标准

如您所见,在 ID3 的第一个版本中,内容类型和大小非常有限,由此诞生了 ID3v2。 该规范大大改进了早期规范,如将信息移至媒体内容前面并添加了可变长度字段和大量可选的内容帧(超过 50 个),如下表所示:

专辑/展示/电影拍数/分钟
作曲人内容类型
版权信息播放列表延迟
编码方式文件类型
曲名/歌曲名称首关键字
原始媒体类型原始文件名
ID3 V2 标准

但是,正因为ID3 规范中的信息是“标准化”信息,这就意味着我们无法进行互操作。实际实施与互操作大相径庭。实际上,来自不同内容供应商的标记信息可能截然不同。例如,某些媒体播放器将专辑图片置于同一个文件夹中或同一个“容器”中,并且按隐含名称(通常为全局唯一标识符 — GUID)唯一地标记图片。其它播放器则可能将图片直接嵌入内容中,这就导致文件变得更大,在某些情况下,这对于无法显示图片的播放器而言是一种缺陷。但优点是在不同的文件夹之间移动内容时,图片也会随内容一同移动。由内容提供商标记文件是一种内容管理方式;但是,在转换内容形式或者移动内容位置时,就会暴露出这种技术的不足之处。例如,您购买了 WMA 音频编码文件,但需要将文件从 WMA 转换为 MP3,因为您的手持设备只能播放 MP3 编码文件。MP3 播放器制造商可能提供了文件转换器,但是该转换器无法将标记正确地迁移到新格式中。或者也可能是,您将某个文件从一个文件夹移动到了另一个文件夹时,丢失了专辑图片关联。

提取 CD 内容时还会出现另一种常见的情况。标识内容的技术与收集 CD 的特征并在互联网上查找这些特征有关。这项技术通常包含查看 CD 上的曲目数量以及每个曲目的长度。系统会根据这些参数生成唯一的签名,并通过互联网将签名发送到中央数据库,以便查找 CD 信息。如果数据库中包含该内容,则这项技术的准确率可达 99.9%。但是,这项技术有几处缺陷。第一个最明显的缺陷表现在未连接到互联网数据库时出现的情况。CD 的内容会被转换为某些其他格式,并且可能会被移动到与演唱者 CD 结构不同的结构中,CD 与其内容的关联丢失意味着这项技术现在已经瓦解了。现在最终用户需要手动建立 CD 与其内容的关联。

在许多其他情况下也可能会丢失内容关联。那么,这为什么很重要呢?几年前,一种称为数字媒体适配器的电子消费设备投入了市场。此设备被寄予了很高的期望并在电子消费市场中占据前沿地位;但是,最初投入市场时的一个主要问题就是退货率太高。在某些情况下,退货率高达 50%。这与电视机正好相反,后者的退货率约为 3%。最近的研究表明高退货率的原因不在于缺陷,而是在于“易用性”,:即,不能满足消费者的期望。消费者易用性是电子消费产品体验的重要部分。从消费者角度看,设备必须简单易用且能顺畅工作。50% 的退货率不是在竞争激烈的消费电子市场上维持业务的可行比例。那么,我们应该采取哪些措施来改善用户体验呢?这就是本文所关注的问题。

确定曲调
童年时期,姐姐和我常玩一种叫“确定曲调”的游戏。我们会更换广播台,比赛看谁先能听出歌曲的名称和演唱者。通常都是她赢。此游戏与所讨论问题的相关性在于将内容与“信息”关联时所使用的技术。在游戏中,只是通过音乐来源(收音机)和本地数据库(在本例中是我们的记忆)将内容与演唱者和歌名关联起来。如果我们未将这些内容存入“本地数据库”中,就必须等到 DJ 通过宣布演唱者和/或歌名来“填充”这些信息。这就类似于延期的远程查找。能够将最少的内容(在本例中是速度最快)与本地数据库中的信息关联起来的一方通常会成为赢家。时间一长,将延期查找吸收到本地数据库的能力就会在“获胜”中发挥重要的作用。音频内容识别也是如此。内容来源应独立于编码方式和格式。本地数据库应该与内容无关,但使用标准方法可轻松地将它们关联在一起。本地数据库应该具备仅根据内容即可执行“延期查找”的能力。
内容识别
“内容识别”是贯穿本文的一个模糊术语,现在有必要让这个短语的意思清晰一些。或许,说成“内容标识”更好一些。在本文中,术语“内容识别”表示“能够根据最低且最常见的音频内容形式及数字脉冲代码调制格式来唯一标识音频内容的能力,以及能够提供完全唯一的标识签名的能力。”内容识别的质量很容易通过基于较大样本大小的准确性、被比较内容的大小以及比较后内容的大小进行衡量。这些参数以及标识或识别过程所用的速度在整个用户体验中起着重要作用。
上一部分1  2  3  4  5  下一部分

第 2 页, 共 8 页