RiCoReader 是什麼?
RiCoReader是.NET平台的檔案內容擷取框架,目前支援常見檔案類型如doc、docx、TXT、XML..等,
RiCoReader 透過單一介面剖析各種檔案結構,且專注擷取檔案效能並兼顧資源平衡,
簡單和快速是RiCoReader兩大特色。
RiCoReader 特性
無須安裝任何OFFICE軟體和open xml SDK、擷取內容速度快
壓縮類型檔案無深度限制
使用簡單方便(3行 code)
支援檔案類型如下
Microsoft Word(97-2016): DOCX,DOC
Microsoft Excel(97-2016): XLSX,XLS
Microsoft PowerPoint(97-2016): PPTX,PPT
Comma Separate Values: CSV(delimiter: , 。 qualifier: " )
Plain Text File: TXT,LOG,SQL
eXtensible Markup Language:XML
Archive Format:7Z,ZIP,TAR
Note:
檔案不可有任何保護或加密處理
擷取檔案文字內容,所有圖像均不支援
效能測試比較
文件類型 (執行方式) | 擷取時間(ms) |
Docx (OfficeXmlSdk) | 223.75 |
Docx (RiCoReader) | 55.75 |
Doc (OfficaAutomation) | 3116.25 |
Doc (RiCoReader) | 64.25 |
為什麼需要RiCoReader?
透過RiCoReader擷取檔案內容文字後,你可以:
實現檔案內容全文檢索搜尋
實現檔案內容管理系統
實現檔案內容data mining
RiCoReader 未來目標
支援更多檔案類型
更高效能檔案擷取速度
RiCoReader 限定期間價格優惠中
V1.01 支援檔案類型新增Html,Htm