北京中科聚网信息技术有限公司
平台产品
大数据前台.全文检索

大数据检索分析系统具有以下技术特点:

1.基于Elasticsearch (ES)的全文检索;

2.业务分析的数据范围横跨实时数据和历史数据,既需要低延迟的实时数据分析,也需要对 PB 级的历史数据进行探索性的数据分析。

3.可靠性和可扩展性问题,用户可能会存储海量的历史数据,同时数据规模有持续增长的趋势,需要引入分布式存储系统来满足可靠性和可扩展性需求,同时保证成本可控。

4.技术栈深,需要组合流式组件、存储系统、计算组件和可运维性要求高,复杂的大数据架构难以维护和管控。

ES(ElasticSearch)全文库

ES(ElasticSearch)是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性,能使数据在生产环境变得更有价值。Elasticsearch 的实现原理主要分为以下几个步骤,首先用户将数据提交到Elasticsearch 数据库中,再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据时候,再根据权重将结果排名,打分,再将返回结果呈现给用户。

全文检索:

2021092311121632366771559047109.png

全域检索:

基于Elasticsearch (ES)的全文检索,支持普通检索、高级检索、组合检索。

支持聚类筛选,支持文档类型包括TXT、WORD、EXCEL、PPT、PDF、RTF等格式文档内容参与搜索,可精准查找资源。

2021092311141632366855272071542.png

分类展示:

 针对综合检索的结果,可分类展示相关内容。如:政务资讯、文库内容(法律法规、政策文件等)、图片、视频、音频等,帮助客户精准查找需要的资源。

2021092311151632366900814014660.png

图片检索:

根据关键词,匹配图片的标题或相关描述,查找对应图片。

2021092311151632366945869076012.png


视频检索:

根据关键词或上传图片找到相关的视频内容,可精确到视频文件的固定时间点。

2021092311161632366988161046564.png

音频检索:

根据关键词找到相关的音频内容,可精确到音频文件的固定时间点。

2021092311171632367029578006053.png

视频/音频定位:

基于搜索到的视频/音频,针对视频/音频做相应处理,精确提炼视频/音频的固定时间点。

2021092311181632367116928081694.png

北京总部
  • 北京市海淀区大钟寺13号华杰大厦B座3层306-310室
  • 010-56181910
郑州子公司
  • 郑州市紫荆山路56号
石家庄
  • 新华路294号盛安大厦
乌鲁木齐
  • 沙依巴克区黑龙江路146号
呼和浩特
  • 新城区呼伦贝尔北路
Copyright 2011-2022 All Rights Reserved | 京ICP备13013562号

微信号

抖音号