Обработка электронных документов

Достаточно большой проблемой во многих организациях является невозможность уничтожения устаревших данных. Хранилища таких данных создаются в течении долгого времени на серверах и резервных носителях и обычно не подвергаются индексированию, классификации и разбиению на категории для выявления документов которые действительно нужно хранить, документов к хранению которых необходимо предъявлять особые меры безопасности, содержащих интеллектуальную собственность или персональные данные.

RetenGine – система созданная для сканирования больших объемов неструктурированных данных находящихся в специализированном хранилище данных, в сети предприятия или в интернете, последующей их индексации и обработки основанной на правилах или методах с использованием искусственного интеллекта.

В связи с огромными объемами обрабатываемых данных необходимо привлечение больших вычислительных мощностей. RetenGine допускает параллельную обработку на всех этапах работы с документами (сканирование, индексация, NER, PII, классификация, кластеринг, удаление повторений), поэтому вы можете эффективно задействовать ваше существующее аппаратное обеспечение не приобретая сверхмощных компьютеров. Вы также можете задействовать мощности какого либо открытого сервиса облачных вычислений если вычислительных ресурсов предприятия оказывается недостаточно.

Технологии: Java, GWT/ExtGWT, ActiveMQ, Lucene/Solr, Hibernate, Spring Framework, Oracle Outside In Technology, а также множество других сторонних инструментов и математических библиотек.