哈斯日志
纪录我们在网路上奔波的历程!
  • »新帖子
  • 巴巴变:模仿可以有多像?
  • 谈ID注册与注销
  • 爱问WAP搜索
  • 壹家搜中文元搜索
  • AOL Triton聊天海神
  • 微软百科全书MSN机器人
  • comScore美国互联网调查
  • 雅虎2006兆新年邮箱
  • 2G的Zoto图片存储
  • 交互设计的KISS原则


  • » @twitter
  • 个性化搜索的若干可能-哈斯日志
    个性化搜索的若干可能
    星期三, 十一月 30, 2005
    目前的所谓的个性化搜索的状态是他们服务商们争相比较功能上如何比别人多,如何能说的云山雾罩,如何显示的与众不通,他们的逻辑是,我不能更好的理解你的需要,我就提供给你更不好理解的功能,从高深莫测来推演我的高科我的强大!这不是逻辑混乱嘛.而从内涵上看却没有质的突破,其实践也无法和用户体验直接相关。

    看了laolu关于信息过载(information overload)的论述十分赞同,搜索引擎观察Danny Sullivan认为当前用户更希望能够更有效地筛选已有的内容而不是得到新内容。没有搜索引擎时面对图书馆或专有数据库的检索系统,强忍不好使的痛苦,有了搜索引擎却又要承受搜出来的结果动辄几万甚至几十万的翻到最后也没找到自己想要的那个的困扰,搜索引擎找的准找我所需的目标尤为显得突出.用户的需求是离散的,每个人对同一个关键词的理解都可能是各不相同的,而目前所谓的相关性排序则反映的是集中的,反映的是绝大多数用户对搜索结果的预期.搜索引擎与用户预期之间的误差都是属于噪音,搜索引擎的目标就是如何能提供用户最需要的结果.各大搜索引擎的原理都差不多,表现为同一搜索query的结果也相差不离,如何满足每个搜索个体对搜索结果的预期,其实就成了对用户的选择问题,权衡用户和相关性两者有益(利益最大化的)的结合点,给出最能让"大多数用户"(大众用户)满意的搜索结果排序,只能依靠"80/20"的原则区分和选择用户群.

    经过N家所谓个性化搜索的研究获得如下总结,搜索就是为了获得信息,从这点意义上讲实现方式一点都不关紧,只要能找到我需要的信息就行,所以个性化搜索的必要性和实践的艰巨性使得其在未来较长时间段内还有无限发展的可能:

    1 开展用户行为研究,长期跟踪,通过系统的复杂分析建立一套与用户搜索/点击行为相关联的搜索引擎排序自动学习/成长机制,用户搜什么是主观的,点什么完全取决的网页的标题和搜索结果上的摘要,根据点击特征进行调权的策略是可行,也是复杂的,Yahoo!这么多年都在使用,也未见明显成效.并且用户搜索和点击也有很多噪音,如偶然性的行为等,或者说用户的兴趣也是动态的,去年他在上学,所以搜索的东西可能跟学业相关,今年他上班了搜索的东西可能跟工作有关,而且大长今热播的时候它可能关注大长今,奥运会的时候他可能更关注奥运会,所以这套通过动态模型的机制实现的策略必须有自我学习和动态成长的特征,否则静止的就是片面的不科学的,Google新闻/psearch等都在试图通过这种方式去提供一个解决方案,但是目前还未见成效,而amazon则这这方面实践多年.更为重要的是这种策略的大规模应用则可能导致恶意的SPAM的泛滥,Mooter也是这类的;

    2 利用技术分析获得搜索query的主题特征以及相关关键词分析,进行搜索结果相关主题类聚和扩展,百度相关搜索多年来一直在实践,效果也不是很明显.这种策略是一种主动的根据用户的需求在调整的策略;与此相对应的,系统地进行网页分析,通过网页特征挖掘,进行主题类聚 ,然后根据用户搜索query给出相关的主题的推荐选择,这是一种有潜力的措施,vivismo,clustry是实践的典型代表,有兴趣可参看vivisimo CEO关于个性化搜索的论述,这是利用技术主动实践的主题化策略,这种策略对搜索结果提供内容分类实际上只是深层次的数据挖掘的一种方式,并没有很好的融合用户需求于其中,所以它从用户角度来看还有严重不足,这就是为什么vivisimo已经运营多年也没能成为主流搜索引擎的根由。

    3 用网摘+订阅+收藏这样有关联性的用户行为实现人工spider的机制,就是所谓的人肉Spider!在这个基础上定制类别或这某些特征来实现.现在这种实现策略不少,都是一种试验性的搜索服务,他们能够通过摘录的url/内容/标记的tag/收藏feed/对应的网站/从那儿点击到这儿的来源/以及这个网页上链出到那里去等的统计\分析,建立其url\topic之间的逻辑关系,在用户搜索中以适当的策略展现出来,这种在目前看来是增加与用户交互感,增强高质量信息的挖掘的一种手段,但是一旦专业的针对性的垃圾制造者跟进了来,同样是麻烦多多,Rollyo,Swicki,wink.com等属于这类.

    4 问答社区模式,了解搜索的人都知道Google有个Answers,它在Google那儿是一个赚钱的东东,没有能够普及到人人问会者答的境界.而百度知道/新浪爱问这个借鉴韩国naver经验的产品,无论形式还是运营模式都是不同于传统的搜索服务和社区服务,更不同于answers.他是开放的共享的,answers则是封闭的,他能有效的把需要某个主题的信息的人集中起来也能把会解答这个问题的专家集中起来,用户根据自己的需求提出问题,通过悬赏机制发动其他用户给出答案,提问者可以借此分享其他人智慧来获得所需要的结果,回答者可以在分享过程中获得自己的满足和提升,网民的需求从过去的找的到找的准,发展到了“找我所需”。

    相关阅读:信息过载和个性化搜索
    下一代搜索引擎的出路?
    Vivisimo CEO on Personal Search
    个性化搜索引擎

    Technorati Tags: , , , , ,
    This Written at 十一月 30, 2005 by loverty.  

    0条评论

    发表评论

    << Home