Problem koji rješavamo

Prosječno hrvatsko kućanstvo u 2026. ima:

  • 5–10 godina papirnatih garancija na bijeloj tehnici (perilica, hladnjak, klima), elektronici i sportskoj opremi
  • 3+ aktivna stana / kuće dokumenata — vlasnički listovi, energetski certifikati, ugovori s upraviteljem
  • 20–40 računa godišnje koje treba pamtiti ili tražiti (HEP, plinara, voda, internet, telefon)
  • Bankarski dokumenti, ugovori, pokloni / nasljedstvo, medicinski nalazi, porezne prijave

Sve to obično završi u tri-četiri fascikla, pet-šest sata svake godine ponovno klasificiranje, i panika kad treba garancija za perilicu koja se danas pokvarila.

Cilj: digitalizirati sve, učiniti to pretraživim kao Gmail ("porez 2024", "garancija LG", "ugovor sa T-mobile"), i automatizirati buduće priljeve.

Rješenje: Paperless-ngx — self-hosted Document Management System (DMS), open-source (GPL-3.0), s OCR-om, AI klasifikacijom, mobilnom integracijom, i potpunom lokalnom kontrolom (ništa ne ide u oblak).

Što je Paperless-ngx i kako radi

Paperless-ngx prima PDF, PNG, JPG ili TIFF dokument (iz skenera, mobitela, e-pošte, fizičke mape), pokreće Tesseract OCR (prepoznaje tekst, podržava hrvatski jezik nativno), automatski:

  • Dodjeljuje korespondenta (HEP, T-mobile, Allianz, Pevec)
  • Dodjeljuje dokumenttip (račun, garancija, ugovor, nalaz)
  • Dodjeljuje tagove (porez 2024, kuća, mama, hitno)
  • Spaja datum dokumenta (čita iz OCR-a)
  • Pohrana u strukturiranu mapu ili samo u indeks (vaš izbor)

Zatim možete pretraživati po sadržaju: "perilica garancija" — i Paperless-ngx će pronaći skeniranu garanciju iz 2023. čak i ako tekst "perilica" nije bio u nazivu fajla, već u OCR-iziranom sadržaju dokumenta.

Hardver — što vam treba

1. Računalo (Paperless host)

Paperless je lagan. Sve od N100 mini-PC-a do Raspberry Pi 5 (4 GB+) radi besprijekorno.

Setup OCR brzina Pohrana
Raspberry Pi 5 (4 GB) + microSD 8–15 s/stranica <500 dokumenata
Raspberry Pi 5 (8 GB) + SSD via M.2 4–8 s/stranica 2.000 dokumenata
N100 mini-PC + SSD 2–4 s/stranica 5.000+ dokumenata
Postojeći NAS (Synology DS224+ ili noviji) 3–6 s/stranica 5.000+ dokumenata

Naš N100 mini-PC vodič je idealan host — N100 + 16 GB RAM + 500 GB SSD pokriva godinama unaprijed.

2. Skener — ključna investicija

OCR kvaliteta = skener kvaliteta. Tri kategorije:

A) Multi-page document feeder (ADF) skener — preporučeno

Model Cijena Snaga
Brother ADS-1700W 215 EUR Najmanji ADF skener, A4 dvostrana, WiFi
Epson WorkForce ES-580W 295 EUR 35 strana/min, beskontaktni dvostrani
Canon imageFORMULA R30 145 EUR Najbolji budget ADF, dvostrani USB
Fujitsu ScanSnap iX1300 425 EUR Premium izbor, najbolji softver

ADF (Automatic Document Feeder) je must-have za digitalizaciju 5+ godina arhive — bez njega ćete odustati nakon prvog vikenda.

B) Flatbed all-in-one printer s ADF-om

Većina modernijih Brother/HP all-in-one printera u rangu 250–400 EUR ima ADF + flatbed + scan-to-network. Dovoljno za prosječno kućanstvo koje skenira jednu mapu dokumenata mjesečno.

C) Mobitel kao skener (zadnja opcija)

Aplikacije: - Adobe Scan (Android/iOS) — najbolji rezultat za pojedinačne dokumente - Microsoft Lens — solidan, besplatan - Open Source: OSS Document Scanner (Android) ili Pico Scanner (iOS)

Problem: za 5 godina arhive od 2.000 dokumenata, ručno snimanje jedan po jedan nije realno. Mobitel je dobar za "post-arhiviranje" — od trenutka kada uspostavite Paperless workflow, novi dokumenti se snimaju usput.

3. Pohrana

  • Originalni skenovi: ~150 KB/stranica (PDF s OCR-om), znači 2 GB za 13.000 stranica
  • Backup: sve u 3-2-1 strategiju (vidi 3-2-1 backup vodič)

Instalacija — Docker Compose

Paperless-ngx je najbolje pokrenuti u Dockeru. Sljedeća konfiguracija je production-ready za kućnu uporabu:

services:
  paperless-broker:
    image: docker.io/library/redis:7
    restart: unless-stopped
    volumes:
      - redisdata:/data

  paperless-db:
    image: docker.io/library/postgres:16
    restart: unless-stopped
    volumes:
      - pgdata:/var/lib/postgresql/data
    environment:
      POSTGRES_DB: paperless
      POSTGRES_USER: paperless
      POSTGRES_PASSWORD: <strong_pass>

  paperless-webserver:
    image: ghcr.io/paperless-ngx/paperless-ngx:latest
    restart: unless-stopped
    depends_on:
      - paperless-db
      - paperless-broker
    ports:
      - "8000:8000"
    healthcheck:
      test: ["CMD", "curl", "-fs", "-S", "--max-time", "2", "http://localhost:8000"]
      interval: 30s
      timeout: 10s
      retries: 5
    volumes:
      - data:/usr/src/paperless/data
      - media:/usr/src/paperless/media
      - ./export:/usr/src/paperless/export
      - ./consume:/usr/src/paperless/consume
    environment:
      PAPERLESS_REDIS: redis://paperless-broker:6379
      PAPERLESS_DBHOST: paperless-db
      PAPERLESS_DBPASS: <strong_pass>
      PAPERLESS_OCR_LANGUAGE: hrv+eng
      PAPERLESS_OCR_LANGUAGES: hrv eng deu
      PAPERLESS_SECRET_KEY: <random_50_chars>
      PAPERLESS_URL: https://paperless.<vasa_domena>.com
      PAPERLESS_TIME_ZONE: Europe/Zagreb
      PAPERLESS_OCR_MODE: skip
      PAPERLESS_CONSUMER_POLLING: 60
      PAPERLESS_FILENAME_FORMAT: "{created_year}/{correspondent}/{title}"
      USERMAP_UID: 1000
      USERMAP_GID: 1000

volumes:
  data:
  media:
  pgdata:
  redisdata:

Pokrenete s docker compose up -d, prvi korisnik se kreira preko docker compose exec paperless-webserver python manage.py createsuperuser. Web UI je na http://<host>:8000.

Workflow — kako stvarno radi u praksi

A) "Consume" folder

Najjednostavniji pristup: mapa /consume na hostu (mountana u container) je "ulazna ladica" za Paperless. Sve što ubacite u tu mapu — bilo SCP, bilo Samba share, bilo Synology Hyper Backup linked folder, bilo skener koji u mrežu šalje preko SMB-a — Paperless automatski:

  1. Detektira nove datoteke
  2. Pokreće OCR
  3. Trenira klasifikator (ako je prošlo prvih ~30 dokumenata)
  4. Indeksira u Postgres
  5. Premjesti u /media strukturu po formatu {godina}/{korespondent}/{naslov}
  6. Odbaci iz consume mape

B) Skener-direktno-u-Paperless (preporučeno)

ADF skeneri s WiFi (Brother ADS-1700W, Epson ES-580W) imaju "Scan to SMB" ili "Scan to FTP" opciju. Postavite ih da pišu izravno u \\paperless-host\consume share. Tada cijeli workflow izgleda:

  1. Stavite 30 stranica papira u ADF
  2. Pritisnete "Scan to Paperless" tipku
  3. 90 sekundi kasnije Paperless je sve obradio i klasificirao

To je razlika koja čini Paperless stvarno održivim, a ne hobby projektom koji odustanete nakon 2 mjeseca.

C) E-mail consumer

Paperless može pratiti IMAP račun (npr. dedicated arhiva@vasadomena.hr ili Gmail filter koji push-a u poseban label):

  • HEP, T-mobile, Allianz šalju mjesečne e-račune u PDF privitku — Paperless ih automatski usisava
  • eRačun korisnici mogu postaviti pravilo: "iz mojOIB@e-racun.hr u Paperless"
  • Doctor's office referencije (medicinski izvještaji) preko encrypted attachment workflow-a

Konfiguracija je u Web UI → Settings → Mail.

D) Mobilna app (Paperless Mobile)

Paperless Mobile — third-party Flutter aplikacija (Android + iOS), open-source. Omogućava:

  • Upload fotografije s telefona izravno (skenira na iPhoneu kroz Vision API, šalje PDF u Paperless)
  • Browse cijele arhive offline
  • Skenirati račun u trgovini, dodati tag "porez 2026", spremiti — gotovo za 30 sekundi

Klasifikacija — gdje stvarno štedite vrijeme

Paperless ima machine-learning klasifikator koji uči nakon ~30 ručno tagiranih dokumenata. Nakon toga automatski dodjeljuje:

  • Korespondenta (HEP, T-mobile, Allianz...)
  • Tip dokumenta (račun, garancija, ugovor, izvod)
  • Tagove ("porez 2024", "garancija aktivna", "platiti do kraja mjeseca")

Ključ: 1. Prvih 30 dokumenata otagirajte ručno — to je trening set 2. Idite na Settings → Automatic Classifier → klik "Train" 3. Iduća 100 dokumenata Paperless će automatski tagirati (vi samo potvrđujete ili korigirate) 4. Iduća 1.000 dokumenata radi sam

Realan učinak: 5–10 minuta tjedno umjesto sat vremena na klasifikaciju nove pošte.

Backup — apsolutno obavezno

Paperless ne čuva ništa van vaše mreže. To znači da je vaš disk = vaše vlasništvo, ali i vaš risk.

Paperless export mehanizam:

docker compose exec paperless-webserver document_exporter ../export -na -nt -p

Stvara mapu s svim dokumentima + metapodacima u jednostavnom JSON formatu. Ta se mapa stavlja u 3-2-1 backup (vidi 3-2-1 vodič).

Veličina za prosječnu kuću: 5–15 GB. Dakle, lako stane na obični USB stick, B2 cloud bucket (~0,4 EUR/mjesečno), ili u rotaciju offsite diska.

Cron job (Linux):

0 2 * * * docker compose -f /opt/paperless/docker-compose.yml exec -T paperless-webserver document_exporter /usr/src/paperless/export -na -nt -p

I onda restic / Duplicacy / rsync to na B2 jednom dnevno.

Realan kalendar prve godine

Vrijeme Aktivnost Trošak
Tjedan 1 Kupnja ADF skenera + N100/Pi5 + 500 GB SSD 400 EUR
Tjedan 1 Docker setup, prvi test (10 dokumenata) 2 h
Vikend 1 Skeniranje 1 fascikla — porezne prijave zadnjih 5 god. 3 h
Vikend 2 Skeniranje računa i garancija 4 h
Vikend 3 Skeniranje medicinskih nalaza 2 h
Vikend 4 Skeniranje bankovnih izvoda + ugovora 3 h
Mjesec 2–12 5–10 min tjedno, novi dokumenti <10 h

Ukupni vremenski ulog: ~24 h prve godine, <10 h godišnje dalje.

Realan primjer — vraćanje na garanciju

Prošli vikend prvašnji laptop je crknuo. Klasični workflow: 1. Tražiti račun po fasciklima: 40 min, ne nalazi se 2. Otići do trgovine i tražiti reprint računa: 20 min vožnje + čekanje 3. Tražiti garanciju u proizvodnih dokumenata: 25 min 4. Ukupno: 2 sata

Paperless workflow: 1. Otvoriti web UI, "laptop garancija" pretraga: 8 sekundi 2. Download PDF s računom, garancijom, originalnom košaricom: 30 sekundi 3. Slanje u servis e-pošte: 1 minuta

Razlika: 2 sata vs 2 minute.

To je razlog zašto Paperless-ngx odavno nije "homelab gadget" već nešto što se isplati i bakama-djedovima u obitelji (iako oni neće postavljati Docker, vi to napravite za njih).

Najčešće greške i kako ih izbjeći

  1. Krenuti bez ADF skenera. Snimanje 500 dokumenata mobitelom završi u odustajanju. Investirajte u ADF od početka.
  2. Postaviti OCR samo na "eng". Hrvatski OCR (Tesseract hrv data) je obavezan — bez njega "račun" postaje "raCun" i pretraga ne radi.
  3. Bez 3-2-1 backupa. Disk crkne, sve nestaje. To je gore nego prije Paperlessa jer ste papirne originale već bacili.
  4. Ne raditi exporter cron job. Postgres dump nije dovoljan — document_exporter daje human-readable arhivu koja preživi i da Paperless-ngx jednog dana nestane.
  5. Pohrana u "single bucket" cloudu bez self-host kopije. Ako sve fotografirate na Backblaze B2 i jedan dan se accountu nešto desi, nemate ništa lokalno. Local-first, cloud second.
  6. Skener u WAN-u. Brother i Epson skeneri imaju vlastite web UI-eve koji preko zadanog gateway-a "zovu kući". Stavite ih u izolirani VLAN (vidi Wi-Fi router vodič).
  7. Forsiranje "perfect tagova" od početka. Krenete s minimalnim setom: 5 korespondenata, 3 tag-tipa, 4 doc-tipa. Postupno raste organski, ne planirajte sve unaprijed.

Sigurnost — GDPR i ozbiljnost dokumenata

Vaša Paperless instalacija sadrži sve osjetljive podatke obitelji: OIB-ove, bankovne izvode, medicinske nalaze, ugovore. Tretirajte je kao malu banku:

  • HTTPS samo, nikad HTTP za vanjski pristup
  • Reverse-proxy s 2FA (Caddy + Authelia, ili NGINX + Authentik)
  • VPN-only pristup (Tailscale, Wireguard) je još bolji od javnog pristupa
  • Postgres backup šifrirajte prije slanja u cloud — restic čini to nativno, kao i Duplicacy
  • Disk encryption na hostu (LUKS na Linuxu) — ako ukradu N100, sirovi PDF-ovi se ne mogu čitati
  • AZOP nije irelevantan za kućnu uporabu, ali ako planirate dijeliti pristup s računovođom — to su pravna pitanja koja zahtijevaju i Data Processing Agreement

Sažetak

Paperless-ngx je najbolji self-hosted DMS u 2026., dovoljno sazreo da ga preporučujemo i običnim korisnicima (kroz tehničkog člana obitelji koji ga postavi). Ulaganje od ~400 EUR u skener + mini-PC, ~24 h prvog vikenda u digitalizaciju, i trajno rješavate problem papirne arhive.

Kombinacija s N100 homelab serverom, 3-2-1 backupom, i pametnim domom čini cjelovitu "lokalnu autonomiju" — sve obiteljske podatke kod kuće, pretraživo, sigurno, i neovisno o cloud servisima.

Sljedeći logički korak nakon Paperless-a obično je Immich za fotografije — isti princip, druga vrsta podataka, ista filozofija privatnosti.