33. 土豆的标签组织新方法　－　从凌波微步到步步生莲

土豆标签组织新方法，就是我们的哪吒计划。

我们想要解决的，是在土豆这样一个内容文件都相对较大的网站上，节目通过tag的浏览问题。最近看到许多讨论，都和tag有关。比如Keso, mak, Goodknight, travelway, hopesome, 还有看了忘了留记录的不少其他讨论。

和同样使用tag的flickr，del.icio.us比较，土豆上的内容有一个根本的不同。

先回顾一下Flickr和Delicious的标签组织方式。每个图片或者网页都有一个到多个的Tag。最常被使用的Tag在Flickr上有一个专门的页面，Tag被使用的多少决定Tag字体的大小。在Delicious上，常用的标签出现在首页的右侧。在Flickr和Delicious上，点击某一个Tag，都会列出所有带有这个标签的图片或者网页，同时这个标签下，还会列出由系统算出的与这个tag相关的其它Tag。

土豆网在最初设计的时候，考虑了多种的分类方式。采用tag来组织节目的原因有两个：
１．土豆网的节目由个人提供和使用。这点特性和Flickr，Delicious完全相同，使用tag是自然而然的。
２．节目数量的巨大和内容范围的分散。其中，尤其是内容范围的分散，决定了我们无法也不愿意去定一个分类，因为这样可能会从一开始就暗示性地限制了节目提供者的选题范围，导致个人创造性的降低。

土豆网上，tag是基础的节目组织方式，但是传统的分类方式依然存在，比如频道。使用传统分类是因为频道的特性：a. 数目相对少。b. 每个频道包含了多个节目，如果同样采用tag可能会导致频道和节目这两个不同概念的混淆。c. 频道可以被订阅。用户浏览频道的行为只是最初的一次性行为，订阅后，一般不再会随机地浏览。

但是，就算是节目本身，从一开始，tag分类就有一些问题。其中的有些问题，在实施过程中都一一地在某种程度上解决了。比如中文和英文标签的问题。有些是tag自身的特质问题，比如，标签的模糊性。用户自己添加的标签相对随意导致一些很常见的标签，对于其他用户来说，不是很有用，比如一些单纯描述性的tag，“DV” “MP3”等等。这些tag的特质问题，只能通过一些方式去尽量减少负面的影响而无法一次性地完全解决。

但是我们被一个很大的问题困扰：tag的浏览问题。

(全文放到里头了。写的比较多，这次）
[@more@]
所有目前已知的tag应用中，包括Flickr和Delicious，采用的tag基本排列方式都一样：最常被使用的tag最醒目。字体的大小也好，出现
在首页也好，用户最先看到的tag，都是其他用户所最常添加的tag。这些tags告诉你很多人用了这个tag，但是它们不能直接告诉你，这些tag中，
哪些图片或者网页精彩。

以flickr为例。一个随机的用户，在flickr上想要找到自己想找到的图片，他可能从flickr的常用tag页面开始，也可能从某个图片开
始，或者从tag搜索开始。假如我们跟踪这个用户在flickr上最终找到他所想找到的图片的整个过程，我们可以看到，他的行动中，大部分是随机的行为。
即使这个随机的Flickr用户是从tag搜索这个最有目的性的行为开始，
在flickr上，tag搜索可能产生数十个到数千个的搜索结果。在找到他想要最初搜索的图片之前，这个用户需要浏览许多的网页和许多的图片。

所以，如果我们对这个用户的整体浏览过程在大脑里画个路线图，我们可以说，这个路线图象是证券市场股票走向的Random Walk。一个大致方向上确定，但是每一具体步骤不可确定的路线图。

而对于flickr上的许多用户，这样的random
Walk从一开始就是个随机的点。许多用户，包括我，会很随机地点击一个图片，然后点击从这个图片引伸出的链接，让flickr这个无序的tag组织方式
把自己带到自己预先意想不到的图片上。这其中，有很多意外发现的喜悦（是，就算是工程师也喜欢意外发现的喜悦）。

所以，对于flickr和某种程度上来说的Delicious这两个网站，原本似乎无序的浏览方式，反而意外成为他们吸引人的一个原因。

但是，这样的一个random Walk，我们从一开始就一直觉得困扰。因为一个很简单的原因：

Flickr和Delicious都是内容”lite”的网站。Flickr的内容文件小，几百K的大小。而土豆则是内容”heavy”，我们的内容文件大，可能是数兆数十兆。

以我们的随机用户为例。在lite的网站上，比如Flickr，他点击任何一个标签后，只要网络速度正常，
会立刻出现一个网页，上面的几十个图片，都带有这个标签。图片虽然已经压缩得很小，普通用户依然可以立刻判断这些图片中，哪一幅是他想要看的。点击这
个小图后，大幅的图片很快在页面上出现。然后，他可以继续点击其他标签或者图片，继续他的random walk。　

这里的关键是，”Instant Gratification”。　我们的这个随机用户，能够在网页上立刻判断所出现的多张图片中是否有他喜欢的和想要的。如果有，点击小图后，他也能立刻获得他开始这个random walk的最终目的　－　图片本身。

我们的随机用户，他在flickr上的random walk，每一步都是即时的，轻松的，惬意休闲的。而在random walk中他走到了自己想走到的终点　－　图片。他的random walk简直就是段誉的凌波微步般惬意，而且有效。

而在土豆上，我们这个”heavy“的网站，这个随机的用户，他当然也可以从任何一个标签开始，直到找到想找的节目为止。但是，他的randome walk，步伐有所不同。

他走出的第一步，在点击了标签后，他看到的节目列表上的节目图片，并不象flickr上直接就代表了目的本身　－　图片。土豆的节目图片，是节目的提供者自己提供的。这张图片也许是视频节目的截图，也许是音频节目制作人的照片，也许根本就和节目无关。我们的随机用户能用来判断这个节目相关性的，是节目的标题和简介。这一步，已经有些偏了。这是间接的一步，而不是flickr上直接的一步。

他的第二步，在点击列表上的链接后，带他到了个节目页面。在这个节目页面上，有更多的关于节目的描述。更详细的简介，节目的大小，格式，播客，等等。但是，这些也还是间接的信息。又是间接的一步。

我们看到，这个随机用户，在到达了某个节目的页面后，他的凌波微步，就开始有些不顺了。他就象是天龙八部里的段誉，在磨坊里力斗假扮西夏高手的慕容复那一幕，东一脚踩到个箩筐，西一脚踩到个木头，开始不流畅。

他的第三步，也是我们的随机用户最关键的一步，他必须下载这个节目。

而在最后这个关键一步，他简直就是一脚踩到了个暂停的镜头：他必须花费时间和带宽，等待这个节目文件下载完成，而且要花点时间看完它，才算是走完这一步。

比起在flickr上的凌波微步，土豆网上有点象是沙滩漫步。

总结一下。这个随机用户，在Content Heavy和Content
Lite的土豆和flickr上，他的用户体验有很大的不同。虽然大伙儿对土豆的tag目前都是鼓掌为主，因为它确实非常适合土豆网节目。但是坦白地说，在同样的tag组织方
式下，尽管土豆网比起用传统方式组织的网站，已经有了很大的改善，但是，整体的用户体验，土豆网远远不如flickr。

Tag的最终目的是为了提高用户体验，不是用来好看或者用来引点眼球的。

过去的一个月里，我们一直都在思考怎么把这个缺口给补上。但是，我们面临的是一个无法逾越的物理问题：土豆网的节目文件大。大的节目需要更长的时间下载，更长的时间就意味在土豆网上的每一步都要花多很多的气力。

我们可以做很多事来间接直接地改善用户体验：增加组来让用户互相推荐节目，减少文件大小来更易下载，打分，写评论，等等等等。但是，我一直想找到一种可
以用电脑来运算的，尽量少由人来干预参与的方法，让一个随机的用户用Tag在土豆这个content
heavy的网站上获得至少和flickr相当的用户体验。

在苦思冥想了几个星期后，两个星期前一个夜里，忽然从梦里猛醒过来。Eureka!

我的随机用户，他在土豆的这个宛如沙滩的环境上走，是不能那样轻松地迈出每一步。我没辙，我没法把沙滩全给平了。但是，他能不能象佛那样，步步生莲？

他的Random Walk的每一步，虽然慢，但是都比较精彩。他每点击一个标签，都能很容易地找到他喜欢的节目。“精彩”，可以用来补过“慢”的缺口。Tag必须携带更多的信息。

所以，我们有了哪吒计划。让随机用户的每一步都比较精彩的一个计划。

哪吒计划的下一篇，细说如何让每一步都更精彩些。

——————————-

有个提议。把这些blog上写的，组织一下，到时候找个journal当个论文给投出去。大伙儿一起参与如何？试试看，这么一篇关于blog和social network，通过blog和social network共同写好的论文。

名字就叫：Practitioners and Bloggers’ Perspective on Organizing and Presenting Tags

写好了，可以最后再用wiki试试。哈哈。

33. 土豆的标签组织新方法 － 从凌波微步到步步生莲

33. 土豆的标签组织新方法　－　从凌波微步到步步生莲