纯文本抽出工具

北京博信施科技有限公司是一家专业从事数据格式转换、数据处理领域研发软件产品和解决方案实施的技术型公司。随着大数据时代的到来,数据的处理、加工、生产、流通、管理成为了人们必不可少的一部分。TextPorter纯文本抽出软件可以从多种文件格式的数据中或从插入的OLE对象中,完全除掉特殊控制信息,快速抽出纯文本数据信息。广泛应用于全文检索、搜索引擎、文档管理等技术领域,百度、搜狐、拓尔思、Openfind等知名企业将本软件应用在文本检索系统、搜索引擎等领域,取得了良好的社会效益和经济效益。

功能特性

²  支持多种文件格式中文本数据抽出

支持Microsoft Office Word、Excel、PowerPoint、Adobe PDF、AutoCAD、HTML、MSG、一太郎、韩文文杰等数十种文件格式。

²  支持多种操作系统环境、支持服务器并发操作

    软件可以运行在Windows 32/64、Linux 32/64、Solaris 32/64操作系统环境下,支持单线程或多线程操作,实现了多人共用机制。

²  支持多国语言文件格式中文本数据抽出

支持中文简体、中文繁体、英语、日语及韩语等多国语言文件格式中文本数据抽出。

²  支持多种语言文字字符集合

    在抽出文本数据输出文本文件时,可以指定GBK、GB18030、Big5、Shift_JIS、KS X 1001、UTF-16、UTF-8等多种字符集合作为文本文件的文字字符集。

²  提供功能强大的API接口函数

提供C/C++、Java、.Net程序语言的API接口函数,客户可以将本软件集成到自己的应用程序中,通过调用API接口函数,实现从多种文件格式中抽出文本数据的功能。

典型客户:

百度、搜狐、拓尔思、Openfind等知名企业将本软件应用在文本检索系统、搜索引擎、文档管理等领域。

      

 

 

 

        

 

欢迎垂询!

北京博信施科技有限公司

邮箱:market@x-office.com.cn

电话:010-56820016

地址:北京市昌平区立汤路188号北方明珠3号楼1221室

版权声明:本文为sunhongyu1994原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/sunhongyu1994/p/7567121.html