哈斯日志
纪录我们在网路上奔波的历程!
  • »新帖子
  • AOL Triton聊天海神
  • 微软百科全书MSN机器人
  • comScore美国互联网调查
  • 雅虎2006兆新年邮箱
  • 2G的Zoto图片存储
  • 交互设计的KISS原则
  • Live.com免费邮局
  • 中文网站的Frame文化
  • Immedi.at IM RSS alerts
  • Google BASE正式开放


  • » @twitter
  • 壹家搜中文元搜索-哈斯日志
    壹家搜中文元搜索
    星期五, 十一月 25, 2005
    Ejear.com中文元搜索引擎?它能把百度,Google中文,雅虎中文搜索的搜索结果聚合在一起,然后按照它自己定义的相关性的方法排出顺序,并会在每条结果后面注明来自那个搜索引擎,在该搜索引擎中该关键词搜索时url的排序序号.

    壹家搜可能是中文领域在元搜索方面开始尝试的先行者之一,它支持动态摘要,可显示来自的搜索引擎出处,有自己的检索排序算法.单从搜索结果的质量而言,其实挺差的,比如我搜索"放山",东北话,长白山地区指的是上山挖人参.明显百度的第一条结果是挺好的,它却把这个url扔没影咯,把Google第一条不知所云的url排了来.再用"一家搜",它倒能把自己排在第一位,实际在百度Google这个站点好像都没有收录.这个网站的系统采用了"Microsoft .NET Framework 版本:1.1.4322.2300; ASP.NET 版本:1.1.4322.2300"平台搭建的,它使用xml作数据处理方式.目前的稳定性还比较差,经常出问题,可以预见很难承受大流量用户检索需求.还很不成熟.

    UPDATE:ejear.com站长hanbaojun25日留言:
    我是ejear.com的站长,谢谢你的关注。网站刚做,很多东西还在实践中,目前网站还没打算发布,只是自己和朋友测试,然后完善。你说的许多问题确实存在,这几天我都在考虑搜索结果的获取和排序上,特别是排序,原来的想法是把多个引擎的结果果中,能够把最有代表性的结果返回给用户,但做起来不容易,现在只是按关键字出现频率、URL、在各引擎上的排名等因素来排序,问题多多,更好的方法还在考虑中。另外,第一次检索的速度也是大问题,有时会很慢,有时google/baidu/yahoo的网站链不上,结果就相对较少,所以现在把搜索结果缓存到本地硬盘,这样在下次检索同样的关键词时速度很快点,当然这样的方法很笨,不过是一时之计,以后也许会有好方法。:),那个“一家搜”是我自己加上去的,测试用的,因为我在考虑内容本地化与其它搜索引擎的结合。 (via here)

    Technorati Tags: , , ,
    This Written at 十一月 25, 2005 by loverty.  

    0条评论

    发表评论

    << Home