3.2、Lucene文件检索实战 —— 架构设计


  1. 文档存储系统 —— 存储了不同类型的文件;

    后台 —— 提取出 文件名 和 文档内容;

    Lucene —— 使用Lucune对 文件名 和 文档内容 进行索引;

    前端 —— 对用户提供查询接口;

检索过程 —— 用户提交关键词,检索索引库, 返回匹配文档至前端页面

  1. 能够下载检索到的文件;

  2. 能够实现关键字的高亮;

工具准备:

  1. 使用 Tika 完成信息抽取;
  2. 使用 Lucene 构建索引;
  3. 使用 JSP页面 给用户提供查询接口;
  4. 使用 Servlet 完成搜索;

构建类似百度文库的小型文件检索系统