Zawsze znajduj informacje, których szukasz

Precyzyjne dotarcie do dokumentów zawierających odpowiedź na Twoje pytania.

Automatyczne Odczytywanie treści dokumentu (OCR)

Automatyczna interpretacja tekstu

Grupowanie / klasyfikacja dokumentów

Wyszukiwanie powiązań

  • PRODUKTY
  • DoRIS

Rozwiązanie DoRIS do analizy tekstu ułatwiające dostęp do nieograniczonych zasobów wiedzy zgromadzonej w postaci nieustrukturyzowanych dokumentów, składowanych w zasobach lokalnych oraz w chmurach prywatnych i publicznych.

Minimalizacja czasu dotarcia do informacji.
Centralizacja dostępu do rozproszonych zasobów informacyjnych.
Zmniejszenie pracochłonności wytworzenia dokumentu.
Efektywna nawigacja po zasobach wiedzy.
DoRIS

Document Repository Intelligent Search

System, który dzięki mechanizmom sztucznej inteligencji i uczenia maszynowego:

Rozumie zawartość dokumentów przechowywanych w swojej bazie danych. Zawartość dokumentu jest automatycznie analizowana pod kątem wystąpień encji nazwanych (jednostek nazewniczych), danych identyfikacyjnych, danych liczbowych w tabelach, zawartości obrazów. Wyznaczane są frazy kluczowe i streszczenia. 

Uczy się i dostosowuje swoje działanie do procesów organizacji na podstawie interakcji z użytkownikiem, który może uzupełniać automatycznie wygenerowane informacje o dokumentach, na przykład poprzez nadawanie tagów.

Zapewnia szybkie dotarcie do informacji dzięki wydajnym indeksom oraz mechanizmom kontekstowego wyszukiwania informacji, które uzupełniają tradycyjne mechanizmy wyszukiwania pełnotekstowego o kontekst wynikający z semantyki wyszukiwanych fraz.

DoRIS pozwala organizacjom na wyeliminowanie czasochłonnego procesu analizy dokumentów
w celu wyodrębnienia istotnych informacji, koniecznych do podjęcia decyzji.
Wskaże miejsca w dokumentach, które są ważne dla decydenta. 

Potrzebujesz innych rozwiązań powiązanych z analityką tekstu?

Funkcjonalności DoRIS

Rozwój algorytmów wykorzystywanych w systemie jest wspierany projektem badawczo-rozwojowym współfinansowanym przez NCBiR

Inteligentny OCR

Rozpoznawanie tekstu z obrazu strony z uwzględnieniem występujących w dokumencie osadzonych elementów takich jak tabele, obrazy, nagłówki i stopki. System automatycznie buduje treść dokumentu korygując błędy wynikające z niskiej rozdzielczości dokumentu.

Metadane

Wydobywanie metadanych takich jak rozmiar pliku, data utworzenia i ostatniej modyfikacji, autor, format pliku. Metadane mogą być używane do zawężania wyników wyników wyszukiwania. 

Wydobywanie treści

Inteligentne wydobywanie treści dokumentu z uwzględnieniem elementów formatowania dokumentu (nagłówki, stopki, osadzone obiekty). Ekstrakcja zawartości z formatów plików, w których taka ekstrakcja jest trudna lub generuje dużo błędów - system umożliwia pobranie jej w postaci pliku tekstowego. 

Automatyczne przypisywanie fraz kluczowych

Tradycyjne podejście oparte na słowach kluczowych wprowadzanych przez użytkownika nie sprawdzają się ze względu na tendencję użytkowników do minimalizacji wysiłku na etapie wprowadzania informacji do bazy danych.  Niekompletnie oznaczone dokumenty są następnie  pomijane w wynikach wyszukiwania.

System DORIS automatycznie generuje frazy kluczowe wypełniając w ten sposób lukę związaną z opisem dokumentu. Na każdym etapie życia dokumentu użytkownik ma możliwość weryfikacji i uzupełnienie fraz kluczowych.

Tagowanie

Użytkownik ma możliwość tagowania dokumentów - nadawania własnych etykiet, które mogą być wykorzystywane do wyszukiwania dokumentów.

Automatyczne katalogowanie

Zautomatyzowane katalogowanie dokumentów (na podstawie kategorii definiowanych elastycznie przez użytkownika). System pozwala na tworzenie własnych, hierarchicznych folderów, do których użytkownik może następnie przypisywać dokumenty – taki sposób nawigacji odzwierciedla sposób pracy z zasobami zgromadzonymi lokalnie na komputerze, przy czym użytkownik równolegle organizować swoje biblioteki na wiele sposobów: według dat, tematyki, przeznaczenia dokumentu. 

Wyszukiwanie pełnotekstowe

Pełnotekstowe wyszukiwanie z uwzględnieniem odmiany słów, oraz tolerujący błędy takie jak literówki. System obsługuje operatory w treści zapytania, które pozwalają na  wprowadzenie dodatkowych kryteriów wyszukiwania. 

Wyszukiwanie poznawcze / semantyczne / według znaczenia słów

Wyszukiwanie treści nie tylko za pomocą słów kluczowych, ale z uwzględnieniem znaczenie słów. Wyszukiwarka rozumie kontekst wyszukiwanego zapytania.

Dzięki wyszukiwaniu kognitywnemu, możesz wyszukiwać treści nie ujęte bezpośrednio w samych słowach kluczowych oraz opisane przy pomocy innych niż użyte w zapytaniu frazy, np.: dokumenty zawierające semantycznie podobne słowa, pojęcia, relacje.

Wyszukiwanie dokumentów podobnych

Wyszukiwanie dokumentów zawierających treści lub frazy podobne do wzorcowego dokumentu. 

Szybki algorytm przeszukiwania pozwala na odnalezienie dokumentów podobnych, co pozwala na wykorzystanie już istniejących treści. Oszczędzamy w ten sposób na pracy, którą wykonujemy tylko dlatego, że nie mamy świadomości istnienia rezultatów w danym obszarze.

Eliminacja duplikatów

Wyszukiwanie dokumentów występujących w repozytorium w wielu kopiach (duplikatów).

W repozytorium często znajduje się ogromna ilość duplikatów, które niepotrzebnie zajmują miejsce na dysku

Klasyfikacja dokumentu

Automatyczne przypisanie do rodzaju sprawy i uruchomienie odpowiedniego procesu obsługi dokumentu.

W firmach znajdują się ogromne ilości nieustrukturyzowanych danych (e-maile, prezentacje pdf, grafiki), które są niewykorzystane ponieważ lub wymagają ręcznego wyszukania. Automatyczna klasyfikacja dokumentów (na poszczególne kategorie) nadaje im odpowiednią strukturę, dzięki czemu nie tracisz czasu na ręczne katalogowanie /oznaczanie/, a wyszukiwanie w konkretnym katalogu danych jest znacznie łatwiejsze. 

 

Rekomendacje

Znajdź zanim zaczniesz szukać. Automatyczne i celne proponowanie użytkownikowi innych dokumentów, którymi użytkownik może być zainteresowany lub, które mogą przydać się w wykonywaniu jego obowiązków.

Wydobywanie danych liczbowych z tabel i formularzy

System automatycznie wykrywa na dokumentach tabele  i konwertuje ich zawartość do formatu, który umożliwia ich dalszą analizę w arkuszach kalkulacyjnych.

Automatyczne streszczenie

Przeczytanie dużej ilości tekstu i dotarcie do istotnych informacji zajmuje dużo czasu i może być wyczerpujące. Dzięki funkcji automatycznego streszczenia, z tekstu wydobywane są tylko niezbędne informacje.

Maksimum treści, minimum słów – automatyczne skracanie tekstów do ich najważniejszych treści / zawartości.

Repozytorium dokumentów

Standardowo system przechowuje  informacje o dokumentach, pozostawiając oryginały plików w źródłowych lokalizacjach. System potrafi integrować się z takimi źródłami plików jak Sharepoint, dyski chmurowe (OneDrive), foldery sieciowe i inne.