Софтуер за дигитален архив (дигитален архив софтуер)
Дигитален архив софтуер по поръчка за дългосрочно съхранение на хартиени папки и електронни документи — bulk OCR пайплайн, WORM хранилище, retention правила за 10 и 50 години по българското архивно законодателство, eIDAS времеви печат и пълнотекстово търсене на български и английски.
Какво включва софтуерът за дигитален архив
Bulk OCR на хартиени архиви
Индустриален пайплайн за сканиране и разпознаване на стари хартиени папки — Tesseract за български кирилски шрифтове, AWS Textract за таблици и формуляри, ръчно ревю на ниска confidence. Партиди от 50,000 до 2 милиона страници, със запазване на оригиналния PDF и текстов слой за пълнотекстово търсене.
Retention правила (10 и 50 години)
Конфигурируем retention engine по тип документ — счетоводни 10 години по Закона за счетоводството, трудови досиета 50 години по КТ, медицински 30 години, договори с публични органи по конкретна номенклатура. Автоматично изтичане, hold заявки при проверка, без ръчни Excel таблици за срокове.
eIDAS времеви печат и подписи
Всеки документ при влизане в архива получава квалифициран електронен времеви печат (eIDAS) от лицензиран доставчик в ЕС. Доказателство кога точно е архивиран — критично за съдебни и данъчни производства. Поддръжка на КЕП за входящи подписани документи и за подпечатване при export.
WORM (immutable) съхранение
Write-Once-Read-Many обектно хранилище върху S3 Object Lock или Azure Immutable Blob — веднъж записан, документът не може да бъде изтрит или модифициран до изтичане на retention срока. Защита срещу ransomware, срещу вътрешна злонамерена дейност и срещу случайно изтриване от администратор.
Версии, права за достъп и аудит
Версиониране на всяка ревизия преди WORM commit, ролеви права за достъп по отдел и по тип документ, четирима-очи политика за чувствителни папки. Immutable аудит trail на всяко отваряне, изтегляне, печат и експорт — кой, кога, от кой IP, за какво. Готови справки за ДАНС, КЗЛД и одитори.
GDPR right-to-erasure и BG/EN търсене
Контролирано изтриване по чл. 17 от GDPR с пълен запис на причината и одобрението — без да се чупи WORM при невъзможност. Пълнотекстово търсене върху OCR съдържанието на български и английски, с морфологичен анализ, фасетни филтри по дата, отдел, тип документ и retention статус.
За кого е подходящ дигиталният архив
Компании с хартиен архив
Производствени, търговски и логистични фирми с мазета пълни с папки от последните 15-20 години — фактури, договори, трудови досиета, проектна документация. Целта е освобождаване на физическо пространство, бърз retrieval при данъчна проверка и легално унищожение на хартията след завереното дигитално копие.
Държавни и общински администрации
Министерства, агенции, областни и общински администрации с архивни фондове по Закона за Националния архивен фонд. Нуждата е дългосрочно съхранение в съответствие с номенклатурите, контролиран достъп по нива на класификация и интероперабилност с Единния портал за достъп до електронни административни услуги.
Юридически и счетоводни кантори
Адвокатски дружества с дела от 10-30 години, нотариуси с актове, счетоводни кантори с клиентски архиви за 10-годишен данъчен срок. Системата държи всичко в WORM, дава мигновен retrieval по номер на дело или ЕИК на клиент и блокира случайно изтриване от младши служител.
Как изграждаме софтуера за дигитален архив
Не препродаваме чужда DMS с месечен абонамент. Изграждаме ваш собствен архив върху проверен стек: PostgreSQL за метаданните и пълнотекстовия индекс (pg_trgm и tsvector за български), S3-съвместимо обектно хранилище с Object Lock за WORM immutability, bulk OCR pipeline на Tesseract плюс AWS Textract, eIDAS-съвместим timestamping от ЕС-лицензиран TSP и retention engine като отделен service.
Започваме с одит — обем в линейни метри, типове документи, законови retention срокове, кой днес има право да чете и изтрива. От тази карта правим класификационна схема и retention матрица, които покриват Закона за счетоводството, Кодекса на труда и вътрешните ви политики. Пилот с един отдел — счетоводство или HR — преди миграция на целия физически архив. Виж как правим изработка на софтуер по поръчка и API интеграции.
След go-live архивът работи като read-mostly система — десетки хиляди retrieval заявки на ден, минимални записи. Това позволява агресивно кеширане и месечна инфраструктурна цена често под €200 дори при няколко милиона документа. Кодът е ваша собственост, без vendor lock-in.
Защо Saitami за вашия дигитален архив
Физическо пространство
Среден спад в заети квадратни метри архивно помещение след пълна миграция към дигитален архив с WORM съхранение и легално унищожение на хартията по протокол.
Retrieval за 30 секунди
Документ от 2009 година се намира с пълнотекстово търсене за под 30 секунди — вместо половин ден ровене в мазе по поредния номер на класьора.
Стартова инвестиция
Фиксирана цена за първа фаза — retention engine, WORM хранилище, OCR пайплайн и BG/EN търсене. Без лицензни такси на потребител, без обвързване с платформа.
Системата за дигитален архив често върви ръка за ръка със система за управление на документи за активния поток и със система за електронно подписване за документите, които влизат вече подписани в архива.
Често задавани въпроси
Заменя ли дигиталният архив хартиения за БГ компетентни органи?
Да, при коректно изпълнение. Закон за електронния документ и електронните удостоверителни услуги признава електронния документ с квалифициран времеви печат и подпис като еквивалент на хартиения пред НАП, НОИ и съда. Изисква се документиран процес на сканиране, eIDAS времеви печат при влизане в WORM хранилището и протокол за унищожение на хартиения оригинал — всичко това системата генерира автоматично.
Поддържа ли OCR за стари документи на пишеща машина?
Да. Bulk OCR пайплайнът комбинира Tesseract за чисти кирилски шрифтове и AWS Textract за машинописни и сложни таблици. За изтъркани документи от 90-те години добавяме deskew, despeckle и binarization преди разпознаването. Документи с confidence под 85% отиват в ръчна опашка за корекция от оператор — така няма губещ се текст в пълнотекстовото търсене, дори при лошо сканирани оригинали.
Колко документа могат да се мигрират наведнъж?
Сме мигрирали архиви от 200,000 до над 8 милиона страници. Реалистичен темп при една сканираща линия е 50,000-80,000 страници седмично с OCR, метаданни и WORM commit. При по-голям обем работим с подизпълнител за сканиране на място при вас, а нашият софтуер консумира резултата паралелно. Графикът се планира по партиди, за да не блокира оперативната работа на отдела ви.
Колко струва софтуер за дигитален архив?
Цената стартира от €3,800 за първа фаза — retention engine, WORM хранилище, базов OCR и BG/EN търсене за до 50,000 документа. За пълен корпоративен архив с няколко милиона страници, eIDAS подписи, миграция от хартия и интеграция с ERP цената обикновено е €14,000-€38,000. Фиксирана цена за договорения скоуп, на етапи, без лицензна такса на потребител и без месечен абонамент за платформа.
Готови да освободите архивното помещение?
Идваме при вас, измерваме реалния обем хартия, картографираме типовете документи и retention сроковете и излизаме с конкретен план за първа фаза от вашия дигитален архив — с фиксирана цена и срок. Демото е безплатно и отнема 45 минути.
Заявете демо на архива →