学习GroupDocs.Search的Example示例
GroupDocsGroupDocs.Search
admin 发布于:2025-03-26 20:03:46
阅读:loading
前面在摸索了Aspose For Java的全量产品组件共计23款,闲来无事偶然又发现了在GroupDocs方向又存在一些产品,这些产品基本都是取自于一个又一个的组件,取自所有组件中的一个方向进行汇总,组成一个统一的产品包。本次摸索学习GroupDocs.Redaction产品,经过一些持续的分析和摸索,结合使用反射的形式来调用,也就是说在API的使用前进行一次特殊的代码注册,即可实现授权,全程不需要License之类的xml,或是文档无水印、或是文档页数限制、或是获取内容无限制,等等。
特别说明:只为单纯的学习摸索与自我突破,商业软件请勿直接使用于生产环境(购买商业授权)。
本次实践的是GroupDocs.Search for Java的24.6版本(当前最新版本),使用Java API进行高效文档搜索和索引,使用Java API进行高效文档搜索和索引。GroupDocs.Search 是一个文档搜索和索引库,旨在帮助开发人员在应用程序中全面集成高效的文档搜索功能。它支持多种文档格式,能够快速索引和检索文档中的内容,使用户能够轻松查找所需的信息。总体来说,GroupDocs.Search 是一种强大的工具,能够帮助开发人员轻松实现高效的文档搜索和索引功能。它的灵活性和支持多种文档格式的能力,使得它可以广泛应用于各行各业,极大地提高了文档管理和信息检索的效率。通过集成 GroupDocs.Search,用户可以在需要时迅速访问关键信息,提升工作效率和决策能力。
(1)Java 中的索引和搜索操作,使用GroupDocs.Search for Java,您可以有效地收集、存储和分析数据,以创建详细的索引,从而实现更快速、更准确的搜索;
(2)通过合并索引优化搜索,轻松结合多个索引,使用GroupDocs.Search for Java来优化搜索。通过将多个增量索引合并为单个高性能索引来减少小的增量索引的影响;
(3)支持多语言键盘布局,使用GroupDocs.Search for Java跨不同语言和键盘布局进行搜索。它支持88种语言和164种键盘配置,灵活多变无与伦比;
(4)形态学搜索能力,使用GroupDocs.Search for Java查找不同的单词形式,例如单数/复数名词或动词变化。为英语和其他语言定制搜索选项;
总的来说,GroupDocs.Search for Java 是一个非常实用的工具,提供了直观的 API,开发者可以轻松地将其集成到 Java 应用程序中。由于它是一个跨平台库,开发者可以在多种操作系统上运行和部署应用,是一个强大的文档内容筛选和索引的解决方案。
(1)支持的文档格式
A.流行的办公格式
便携式: PDF
Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM
Excel: XLS, XLSX, XLSM, XLT, XLTX, XLTM, XLSB, XLA, XLAM, CSV, TSV
PowerPoint: PPT, PPTX, POT, POTX, PPS, PPSX, PPTM, PPSM, POTM
OpenDocument: ODT, ODP, ODS, OTT, OTS
文本: TXT, RTF
B.媒体格式
流行图片格式: BMP, JP2, PNG, EMF, WMF, JPG, PSD
多页图像: GIF, WEBP, TIFF
音频: MP3, WAV
视频: AVI, MOV, QT, FLV, ASF
C.其他
电子邮件: PST, OST, MSG, EML, EMLX
Microsoft Visio: VSD, VSS
网页: XML, HTM, HTML, XHTML, MHT, MHTML
其他: TORRENT, ZIP, DCM, DJVU, EPUB, FB2
(2)支持的功能如下:有效管理文档内容,提供支持PDF、DOCX、XLSX、PPTX等格式的高级搜索能力。
A.可定制的搜索参数:使用日期范围和区分大小写筛选器来改进搜索;
B.增强的拼写检查:通过拼写检查、通配符和忽略特殊字符有效搜索;
C.过滤搜索结果:应用筛选器,以根据特定文档类型或标准关注搜索结果;
D.数据的导入和导出:轻松导入索引数据或将结果导出到文件以供进一步使用;
E.跳过不必要的文件:通过排除特定文件或单词来优化索引;
F.HTML和URL处理:提取HTML内容到文件,并为搜索结果生成URL链接;
G.在大型索引中快速搜索:通过将大型索引分割为可管理的块来加速搜索操作;
H.基于流的索引:直接从流或数据结构中索引数据;
I.处理拼写错误的查询:检测拼写错误,并建议替代词以提高搜索准确性;
J.全面的归档支持,索引嵌套归档,并检索ZIP文件中详细的文件列表;
K.节省磁盘空间的索引,通过紧凑的索引节省磁盘空间,并处理受密码保护的文件;
L.自定义同义词支持,扩展同义词字典,以增强搜索精度,提供定制选项;
上面这一段摘自官网的介绍,整体上觉得很抽象,运行示例项目中相关的例子后我理解的意思:GroupDocs.Search是一个文档内容搜索与索引的开发工具包,旨在帮助开发人员在其应用程序中实现对多种不同文档格式文件搜索的功能,是一个强大的文档搜索与索引解决方案。
以官网提供的Github示例`https://github.com/groupdocs-search/GroupDocs.Search-for-Java`为准,上面介绍说GroupDocs.Search for Java 是一个搜索和索引库,可以针对各种格式执行基本和高级搜索操作以获得数据洞察。它还可用于索引各种文档类型,以根据不同的搜索查询类型执行搜索。支持模糊、同义词、布尔和全文搜索等高级搜索技术。本次实践运行了Github Examples示例包下的示例代码,按个人喜好挑选了一批例子运行尝试,个别示例运行有报错(主要肯定不会使用到这个产品的功能,所以大致上有了解就可以了,略懂略懂),主要介绍官方提供的功能为主,简单过一下示例的功能,详细参考如下:
(搜索文档高亮)
(索引文件)
(示例输出)
参考代码如下:
public static void run() {
String indexFolder = ".\\output\\AdvancedUsage\\Indexing\\OcrSupport";
String documentsFolder = Utils.DocumentsPNG;
String query = "water";
// Creating an index
Index index = new Index(indexFolder);
// Setting the OCR indexing options
IndexingOptions options = new IndexingOptions();
options.getOcrIndexingOptions().setEnabledForSeparateImages(true);
options.getOcrIndexingOptions().setEnabledForEmbeddedImages(true);
options.getOcrIndexingOptions().setOcrConnector(new OcrConnector());
// Indexing documents in a document folder
index.add(documentsFolder, options);
// Searching in the index
SearchResult result = index.search(query);
Utils.traceResult(query, result);
}
(1)`GroupDocx.xxx`不是开源免费的使用,Github上有示例项目,包含了大量的示例,示例的结果就是生成了一些《Evaluation Warning》警告、水印、内容页数限制、内容文本限制等;
(2)aspose旗下有许多的产品,都是商业付费版本,常见于各种文档格式文件的操作,都需要商业授权使用,也基本都是支持多种编程语言的,如有Java、C++、.NET等等,官网也有多种在线示例;
(3)示例与相关文件下载:《GroupDocs.Search示例相关文件.zip》,注:下载并不包含具体的科学实现部分,只是源文件与示例输出文件;
(4)科学实现分为两种情况,一种是使用反射,另一种是使用License.xml文件;
(5)aspose相关的各个产品组件为独立存在的各个产品,GroupDocs是提取全集产品中的某个功能的集合,提供了一个大类的功能操作,并且统一对外提供API;
点赞
发表评论
评论列表
留言区
- 学习GroupDocs.Assembly的Word模板实践
- 学习GroupDocs.Assembly的Excel模板实践
- 学习GroupDocs.Assembly的PPT模板实践
- 学习GroupDocs.Assembly的其它模板实践
- 学习GroupDocs.Watermark的增加与删除文本水印实践
- 学习GroupDocs.Watermark的增加与删除图片水印实践
- 学习GroupDocs.Redaction的Xlsx实践
- 学习GroupDocs.Redaction的Docx实践
- 学习GroupDocs.Redaction的其它文件类型实践
- 学习GroupDocs.Annotation的简单实践
- 学习GroupDocs.Signature的简单实践
- 学习GroupDocs.Conversion的Spring版在线示例
- 学习GroupDocs.Conversion的简单实践
- 学习GroupDocs.Merger的简单实践
- 学习GroupDocs.Parser的简单实践
- 学习GroupDocs.Comparison的Spring版在线示例
- 学习GroupDocs.Comparison的简单实践
- 学习GroupDocs.Metadata的简单实践
- 学习GroupDocs.Editor的Spring版在线示例
- 学习GroupDocs.Editor的简单实践
- 学习GroupDocs.Search的HighlightExample示例
- 学习GroupDocs.Viewer的Spring版在线示例
- 学习GroupDocs.Viewer的简单实践