en

Co to jest Enser?

Enser to nasze rozwiązanie oparte o opensource'owe biblioteki pozwalające na indeksowanie dokumentów firmy oraz późniejsze ich przeszukiwanie. Więcej o samym rozwiązaniu na stronie Enser.

Po co nam to?

W ciągu 11 lat działania naszej firmy nazbierało nam się trochę dokumentów w najróżniejszych miejscach i formatach. Postanowiliśmy więc nieco ułatwić do nich dostęp, gdyż wstępne analizy rozwiązań klasy ECM uzmysłowiły nam, że będzie to proces dość skomplikowany, wymagający zmian w nawykach naszych pracowników i nas samych. Dodatkowo system ECM wspiera przeglądanie i wyszukiwanie ale tylko tych dokumentów, którymi sam zarządza. W naszym wypadku i tak pozostaje dość dużo danych składowanych w innych miejscach, niedostępnych dla potencjalnego systemu ECM. Aby nie być gołosłownym, oto przykłady zbiorów dokumentów, które już zaindeksowaliśmy:

  • zasoby plikowe: umowy, oferty, specyfikacje
  • zapytania ofertowe z naszego wewnętrznego systemu bazodanowego
  • tickety z naszego systemu śledzenia zgłoszeń
  • intranetowy serwis wspierający wymianę wiedzy typu "Question & Answer" (zbliżony do słynnego stackoverflow)
  • intranetowy serwis Wiki zawierający kilka poziomów dostępu

W chwili obecnej rozbudowaliśmy mechanizmy ekstrakcji danych tekstowych z plików (tak, tak, nasz system indeksuje całą zawartość plików Word, Excel, PDF, itp) o możliwość indeksowania zawartości archiwów typu Zip, Rar, itp oraz przetwarzanie plików graficznych za pomocą systemu OCR, dzięki czemu łatwiej możemy odszukiwać nawet skany podpisanych dokumentów!

Na potrzeby tego projektu powstało też wiele komponentów, które w większości udostępniliśmy społeczności open source projektu Apache Manifold CF, takie jak:

  • moduł autoryzacji za pomocą LDAP (wcześniej obsługiwane było tylko ActiveDirectory)
  • konektor do systemu Mantis Bugtracker
  • moduł prostej autoryzacji na podstawie bazy danych SQL
  • konektor FTP
  • konektor repozytorium kodu SVN (Subversion) pozwalający na błyskawiczne przeszukiwanie naszych kodów źródłowych
  • zmodyfikowaliśmy istniejący kontektor do sieciowych zasobów plikowych (np. Samba)
  • parsery OCR do biblioteki Apache Tika

Efekty

Na razie uzbierało się tego kilkadziesiąt tysięcy dokumentów, a wszystkie dostępne w wyszukiwarce w ułamku sekundy. Myślimy też o dokładaniu kolejnych źródeł i indeksowaniu jeszcze większej ilości dokumentów i danych, ale wszystko po kolei. Ponieważ Enser wspiera uprawnienia użytkowników - dostęp do narzędzia mają wszyscy nasi pracownicy, a każdy odnajduje tylko to, do czego ma prawa. W ten sposób informacje lepiej krążą po firmie, dokumenty mogą być wielokrotnie wykorzystywane, a to dla nas cenne. Dzięki temu potencjał wiedzy w firmie rośnie!

Autor: Maciej Liżewski, 3e Software House

RODO

Wyrażam zgodę, aby 3e sp. jawna zbierała, katalogowała, analizowała i podejmowała automatyczne decyzje o adresach internetowych połaczonych z urządzeniem, którego używam a także informacji o samym urządzeniu, w tym jego typie, wersji zainstalowanego oprogramowania w celu obserwacji moich aktywności w internecie (stworzenia profilu użytkownika). Automatyczne podejmowanie decyzji nie dotyczy danych wrażliwych. Zgoda pozostaje w mocy tak długo, jak długo istotne pozostają dane, dla których została wyrażona, lub do czasu, gdy któraś ze Stron zgodę wycofa. Cofnięcie zgody będzie skutkować usunięciem danych.