1. 首页
  2. 互联网资讯

Mashable:浏览对于互联网内容发现的重要性

  北京时间9月7日消息,互联网内容发现和个性化平台Trapit的劳拉·拉塞尔(Laura Larsell)今日在科技博客Mashable撰文称,互联网作为一个超大型的图书馆,使人们可以跨越空间和时间,接触到大量信息,但有一点是现在的互联网无法提供的,那就是在传统图书馆随意浏览的感觉。


  拉塞尔指出,虽然传统图书馆的这种浏览看似毫无目的,但最后用户总会找到自己喜欢并且有用的东西。浏览是信息发现的重要组成部分,也是信息发现的重要手段。


  拉塞尔认为,目前网络上信息发现的主要手段是搜索,这需要用户事先知道自己想要什么,但很多情况下,用户并不清楚自己的需求;搜索得来的信息也不一定就是准确的。另外一种信息发现方式就是社交网络,但这种方式限制了用户的知识面,而且这种方式需要用户有刨根问底的研究精神,此外嘈杂的社交网络内容多为大众化,忽略了小众内容。


  拉塞尔表示,亚马逊和Netflix已经认识到了这一点,他们已经在网站上提供了分类浏览功能。实现浏览的就要对数据的有序分类,但以人力对互联网数据进行条目分类已经不可能,现在必须依靠新方法实现这一功能,机器学习的出现有可能使人们像浏览图书馆一样浏览互联网。搜索、社交网络和浏览三种信息发现方式在互联网上应该共存。


  全文概要如下:


  我爱图书馆和书店。我爱这些物理空间的触觉、嗅觉和社交体验。显然互联网可以给我们大量丰富和令人兴奋的机会,与大量的信息资源进行接触,但是有一方面需要我们还是只能在现实生活中获得,数字世界无法提供。


  抛开信息储藏室的红砖厚瓦,互联网有待实现的一种体验就是在它广阔的范围内轻松愉悦地进行浏览。浏览是信息发现的重要组成部分,它允许信息搜寻者有机扩大最初模糊不清,并且往往是无法表达的需求。


  试想下一头扎进本地图书馆浏览烹饪书的情景。你的眼睛扫过书架,一本制作泡菜的书引入眼帘。尽管一开始你并没有明确的要求,但这本书正是你想读的。


  这样的经验就是浏览的核心,以学科或类别为单位无目的地浏览,找到的东西让你意想不到,但最终能使你受益。浏览是信息资源发现的一种普遍手段。然而,今天占据网络的信息发现以搜索或社交为基础,浏览这种方式并没有获得很好的支持。


  我们如何失去浏览,转向了搜索


  搜索假设搜索者和搜索物之间有条直接的路径。具有讽刺意味的是,要让“搜索”发挥最佳作用,你必须很清楚自己在寻找什么,但大多数人在大部分时间根本不知道自己真正在寻找什么。


  Netflix认识到了这一点,亚马逊也一样。这两家网站提供以科目和类别浏览商品的功能。你可以想想什么时候需要用到搜索框,什么时候需要进行简单的浏览。搜索是用来找到已知的资源(我想看影片《最后一场电影》),浏览是以有组织和有意义的方式遇见不可知的资源(我想看一些搞笑的东西)。


  顺便说一下,搜索是伴随着支持浏览的主题索引一起出现的,但是由于主题一般要比关键词高一层次,所以它们无法被电脑精确地分配。换句话说,一篇包含有100个“猫”的文档,比起只包含有10个“猫”的文档,更会被认为是一篇与猫科动物有关文章。尽管我们认为这并不准确。主题编目需要人来筛选,网络增长速度过大过快,使这种编目变得不可行。


  这在过去和现在来说是不幸的,因为东西越多,浏览的用处就越大。


  用书架作比喻


  我家里的书架缺乏组织,但很适合我,因为它很小,我也很熟悉书架上的书。不过要是其他人的话就必须一本本地看过去,以便找出最佳选择。


  现在想象一下,我把我的藏书分为小说类和非小说类。一位对非小说更感兴趣的陌生人只要在非小说区域寻找。如果我把藏书以主题方式,做进一步细分和分组,我将能节约更多时间,并有机会发现书籍之间的关联性,而不是猛打瞎撞。对书籍进行整理不仅能提供书籍本身的信息,对浏览也大有益处。


  浏览在视觉上也可以是愉悦的体验,这是很重要的享受过程。随着我的目光扫过书架,我获得了一系列有关于书籍内容的视觉线索(类别、价格和信誉)。列表形式的搜索结果本身也提供线索,但很多时间点选链接时用户会犹豫,相关内容是否值得查看(谷歌已经认识到了这一点,因此在它们的搜索列表结果中添加了方便的预览功能)。


  互联网就像是我随便整理的书架升级版。尽管你的电脑帮你管理所有信息,但相关主题下有多少内容存在,你很难说清楚。以“历史”做关键词搜索和在图书馆的历史区浏览的体验完全不同。


  用给定的话题去发现网络上提供的内容,搜索是一个令人气馁的入口。大多数搜索返回的都是过时、复制和可疑的内容。除了搜索结果的第一页,用户很少会去看后面的内容。网络存在真正的问题是搜索需要方向。正如图书馆员芭芭拉·菲斯特(Barbara Fister)所指出的,当有信息需求时,大多数搜索者的主要评判标准就是方便。一个好答案是有价值的,但如果花了很大力气才找到就不值了。


  从搜索到社交


  当今新兴的发现模式是社交媒体。Facebook、Twitter和Google 等社交媒体的快速发展使得用户可以在点对点的基础上共享信息。这种分配方式依靠的是人们的推荐,而不是神秘莫测,有时候还容易出问题的算法搜索排名。


  在社交模式下,我的书架更加的杂乱无章,但我会给你一个建议。这样可以节省你为搜索所做的工作和时间。我的选择可能可以满足你,特别是因为在这种情况下,你是一个个体,而不是更广泛的社交网络观众。不过我提供的藏书也限制了你的知识。


  通过社交模式发现信息可以让搜寻者绕过搜索需要的主动权。“最好”的内容反而是通过动态汇总和趋势列表被推送给用户。它还围绕内容组织起对话,这使得发现过程更加新颖。但利用这种方式寻找信息需要用户是个努力的听众,很多人不愿意或没能力做到这一点,特别是我们的社交网络变得更加嘈杂。


  这种方式找到的信息也往往是模糊的。社交模式强调的是大众内容,但会忽视小众。对不喜欢刨根问底的搜索者来说,社交发现是在帮倒忙。


  但对于漫无目的和不知所措的信息搜寻者来说(我认为大多数人都是这样),真正的问题在于社交网络的结构由社交法则决定,而不是由美丽的主题层次或系统分类决定,这两种煞费苦心的人工组构形式可以让用户毫不费力、有机的进行游览。


  即使是浏览起来很不方便的Twitter,标签也允许对链接使用分众分类法分类。关注小众话题需要找出可供关注的相关专家。另一方面,许多Twitter列表很容易让人联想到图书馆资源指南。当然,高水平的学科专家发表的东西都是出自内心的,但是用户也必须知晓自己的动机目的。此外,社交网络中,用户的关系像是一座以不规则方式发展的大城市,而不是图书馆中排放整齐的书架和区域。


  为什么我们需要重拾浏览


  浏览是在一定范围内,让信息搜寻者更好的了解其中的内容存在,它是探索未知的简单入口。它还允许鲜为人知的作品与相关科目的权威之作进行竞争。


  但随着网络越来越大,以人力来制作索引,就像过去几百年图书馆那样的工作已经不可能。


  致力于纯人力索引的网络依然存在,其中开放目录项目(Open Directory Project)是最大的。但考虑到这些项目最终都将依靠众包,数码信息的快速扩展,以及缺乏对网络的书目控制,这些项目是想把所有的海水装到一个水桶中。


  真正由人力索引的开发网络,作为目标太过崇高,以这个目标为追求的人们是在盲目的沿袭旧世界的做法。无论如何,我们必须找到更好的方法,对大型数据进行组织架构,因为信息超载的问题只会变得更加可怕,病毒波及的范围也更加扩大。


  机器学习的出现,特别是使用人类反馈来建立清晰、有序的信息,使得人类在花费极少的情况下,为更好的组织大型数据提供了潜在的新工具。在我工作的初创公司,我们正在开发的技术使得内容能被更好的分组。在回应用户反馈方面,系统主要依靠关键词识别概念,带来令人惊讶并不断提高的准确度。你可以利用算法将“热狗”和“BBQ”等相关内容提取出来,对于人来说,就可以很简单地将它们归到更大范围的“夏季食品”类别中。这种排序让浏览成为可能。


  同样,被谷歌收购的Like.com是一款浏览网络商店内容的应用。它允许用户使用质地、颜色和尺寸等视觉线索浏览在线商店。


  数字信息的美丽之处在于我们不再受限于物理空间。对于内容我们发现可以细分再细分,使发现更多机遇成为可能。我们可以拥有这一切:知道自己要什么的搜寻者可以去搜索;希望聆听和参与的搜寻者可以去社交网络;希望走马观花并且让信息自己说话的搜寻者可以去浏览。(柯山)

发表评论

登录后才能评论