en

Co to jest Enser?

Enser to nasze rozwiązanie oparte o opensource'owe biblioteki pozwalające na indeksowanie dokumentów firmy oraz późniejsze ich przeszukiwanie. Więcej o samym rozwiązaniu na stronie Enser.

Po co nam to?

W ciągu 11 lat działania naszej firmy nazbierało nam się trochę dokumentów w najróżniejszych miejscach i formatach. Postanowiliśmy więc nieco ułatwić do nich dostęp, gdyż wstępne analizy rozwiązań klasy ECM uzmysłowiły nam, że będzie to proces dość skomplikowany, wymagający zmian w nawykach naszych pracowników i nas samych. Dodatkowo system ECM wspiera przeglądanie i wyszukiwanie ale tylko tych dokumentów, którymi sam zarządza. W naszym wypadku i tak pozostaje dość dużo danych składowanych w innych miejscach, niedostępnych dla potencjalnego systemu ECM. Aby nie być gołosłownym, oto przykłady zbiorów dokumentów, które już zaindeksowaliśmy:

  • zasoby plikowe: umowy, oferty, specyfikacje
  • zapytania ofertowe z naszego wewnętrznego systemu bazodanowego
  • tickety z naszego systemu śledzenia zgłoszeń
  • intranetowy serwis wspierający wymianę wiedzy typu "Question & Answer" (zbliżony do słynnego stackoverflow)
  • intranetowy serwis Wiki zawierający kilka poziomów dostępu

W chwili obecnej rozbudowaliśmy mechanizmy ekstrakcji danych tekstowych z plików (tak, tak, nasz system indeksuje całą zawartość plików Word, Excel, PDF, itp) o możliwość indeksowania zawartości archiwów typu Zip, Rar, itp oraz przetwarzanie plików graficznych za pomocą systemu OCR, dzięki czemu łatwiej możemy odszukiwać nawet skany podpisanych dokumentów!

Na potrzeby tego projektu powstało też wiele komponentów, które w większości udostępniliśmy społeczności open source projektu Apache Manifold CF, takie jak:

  • moduł autoryzacji za pomocą LDAP (wcześniej obsługiwane było tylko ActiveDirectory)
  • konektor do systemu Mantis Bugtracker
  • moduł prostej autoryzacji na podstawie bazy danych SQL
  • konektor FTP
  • konektor repozytorium kodu SVN (Subversion) pozwalający na błyskawiczne przeszukiwanie naszych kodów źródłowych
  • zmodyfikowaliśmy istniejący kontektor do sieciowych zasobów plikowych (np. Samba)
  • parsery OCR do biblioteki Apache Tika

Efekty

Na razie uzbierało się tego kilkadziesiąt tysięcy dokumentów, a wszystkie dostępne w wyszukiwarce w ułamku sekundy. Myślimy też o dokładaniu kolejnych źródeł i indeksowaniu jeszcze większej ilości dokumentów i danych, ale wszystko po kolei. Ponieważ Enser wspiera uprawnienia użytkowników - dostęp do narzędzia mają wszyscy nasi pracownicy, a każdy odnajduje tylko to, do czego ma prawa. W ten sposób informacje lepiej krążą po firmie, dokumenty mogą być wielokrotnie wykorzystywane, a to dla nas cenne. Dzięki temu potencjał wiedzy w firmie rośnie!

Autor: Maciej Liżewski, 3e Software House

Zamknij ten komunikat

Nasze strony wykorzystują pliki cookies.

Na naszych stronach używamy informacji zapisanych za pomocą cookies m.in. w celach reklamowych i statystycznych. Mogą też stosować je współpracujące z nami podmioty, takie jak firmy badawcze oraz dostawcy aplikacji multimedialnych. W każdej przeglądarce internetowej można zmienić ustawienia dotyczące cookies. Korzystanie z naszych serwisów internetowych bez zmiany ustawień dotyczących cookies oznacza, że będą one zapisane w pamięci urządzenia.