twitter实时搜索

我根据twitter提供的关于他们实时搜索(Earlybird)的简介 自己实现了一个实时搜索 初步测试效果还不错 相当高效 搜索 打分 20ms搞定 大家有敢兴趣的吗 可以开源出来 一起捣鼓. http://www.umiacs.umd.edu/~jimmylin/publications/Busch_etal_ICDE2012.pdf

先说一下我写的搜索的功能.
1,修改于lucene代码上面 纯内存索引存储
2,可以从新向旧搜索索引的文档
3,查询是可以终端的
4,单机最大支持上亿的数据量
5,有日志信息 可以在服务器重启的时候重建搜索 重建相当快 反而是读磁盘太慢了
6,提供文档原始数据存储功能
适用项目:
类微博, 对实时性要求很高的应用
https://github.com/wangscu/jessica

  1. da shang
    donate-alipay
               donate-weixin weixinpay

发表评论↓↓