文档存储系统 —— 存储了不同类型的文件;
后台 —— 提取出 文件名 和 文档内容;
Lucene —— 使用Lucune对 文件名 和 文档内容 进行索引;
前端 —— 对用户提供查询接口;
检索过程 —— 用户提交关键词,检索索引库, 返回匹配文档至前端页面
能够下载检索到的文件;
能够实现关键字的高亮;
工具准备:
- 使用 Tika 完成信息抽取;
- 使用 Lucene 构建索引;
- 使用 JSP页面 给用户提供查询接口;
- 使用 Servlet 完成搜索;
构建类似百度文库的小型文件检索系统