Problem koji rješavamo
Prosječno hrvatsko kućanstvo u 2026. ima:
- 5–10 godina papirnatih garancija na bijeloj tehnici (perilica, hladnjak, klima), elektronici i sportskoj opremi
- 3+ aktivna stana / kuće dokumenata — vlasnički listovi, energetski certifikati, ugovori s upraviteljem
- 20–40 računa godišnje koje treba pamtiti ili tražiti (HEP, plinara, voda, internet, telefon)
- Bankarski dokumenti, ugovori, pokloni / nasljedstvo, medicinski nalazi, porezne prijave
Sve to obično završi u tri-četiri fascikla, pet-šest sata svake godine ponovno klasificiranje, i panika kad treba garancija za perilicu koja se danas pokvarila.
Cilj: digitalizirati sve, učiniti to pretraživim kao Gmail ("porez 2024", "garancija LG", "ugovor sa T-mobile"), i automatizirati buduće priljeve.
Rješenje: Paperless-ngx — self-hosted Document Management System (DMS), open-source (GPL-3.0), s OCR-om, AI klasifikacijom, mobilnom integracijom, i potpunom lokalnom kontrolom (ništa ne ide u oblak).
Što je Paperless-ngx i kako radi
Paperless-ngx prima PDF, PNG, JPG ili TIFF dokument (iz skenera, mobitela, e-pošte, fizičke mape), pokreće Tesseract OCR (prepoznaje tekst, podržava hrvatski jezik nativno), automatski:
- Dodjeljuje korespondenta (HEP, T-mobile, Allianz, Pevec)
- Dodjeljuje dokumenttip (račun, garancija, ugovor, nalaz)
- Dodjeljuje tagove (porez 2024, kuća, mama, hitno)
- Spaja datum dokumenta (čita iz OCR-a)
- Pohrana u strukturiranu mapu ili samo u indeks (vaš izbor)
Zatim možete pretraživati po sadržaju: "perilica garancija" — i Paperless-ngx će pronaći skeniranu garanciju iz 2023. čak i ako tekst "perilica" nije bio u nazivu fajla, već u OCR-iziranom sadržaju dokumenta.
Hardver — što vam treba
1. Računalo (Paperless host)
Paperless je lagan. Sve od N100 mini-PC-a do Raspberry Pi 5 (4 GB+) radi besprijekorno.
| Setup | OCR brzina | Pohrana |
|---|---|---|
| Raspberry Pi 5 (4 GB) + microSD | 8–15 s/stranica | <500 dokumenata |
| Raspberry Pi 5 (8 GB) + SSD via M.2 | 4–8 s/stranica | 2.000 dokumenata |
| N100 mini-PC + SSD | 2–4 s/stranica | 5.000+ dokumenata |
| Postojeći NAS (Synology DS224+ ili noviji) | 3–6 s/stranica | 5.000+ dokumenata |
Naš N100 mini-PC vodič je idealan host — N100 + 16 GB RAM + 500 GB SSD pokriva godinama unaprijed.
2. Skener — ključna investicija
OCR kvaliteta = skener kvaliteta. Tri kategorije:
A) Multi-page document feeder (ADF) skener — preporučeno
| Model | Cijena | Snaga |
|---|---|---|
| Brother ADS-1700W | 215 EUR | Najmanji ADF skener, A4 dvostrana, WiFi |
| Epson WorkForce ES-580W | 295 EUR | 35 strana/min, beskontaktni dvostrani |
| Canon imageFORMULA R30 | 145 EUR | Najbolji budget ADF, dvostrani USB |
| Fujitsu ScanSnap iX1300 | 425 EUR | Premium izbor, najbolji softver |
ADF (Automatic Document Feeder) je must-have za digitalizaciju 5+ godina arhive — bez njega ćete odustati nakon prvog vikenda.
B) Flatbed all-in-one printer s ADF-om
Većina modernijih Brother/HP all-in-one printera u rangu 250–400 EUR ima ADF + flatbed + scan-to-network. Dovoljno za prosječno kućanstvo koje skenira jednu mapu dokumenata mjesečno.
C) Mobitel kao skener (zadnja opcija)
Aplikacije: - Adobe Scan (Android/iOS) — najbolji rezultat za pojedinačne dokumente - Microsoft Lens — solidan, besplatan - Open Source: OSS Document Scanner (Android) ili Pico Scanner (iOS)
Problem: za 5 godina arhive od 2.000 dokumenata, ručno snimanje jedan po jedan nije realno. Mobitel je dobar za "post-arhiviranje" — od trenutka kada uspostavite Paperless workflow, novi dokumenti se snimaju usput.
3. Pohrana
- Originalni skenovi: ~150 KB/stranica (PDF s OCR-om), znači 2 GB za 13.000 stranica
- Backup: sve u 3-2-1 strategiju (vidi 3-2-1 backup vodič)
Instalacija — Docker Compose
Paperless-ngx je najbolje pokrenuti u Dockeru. Sljedeća konfiguracija je production-ready za kućnu uporabu:
services:
paperless-broker:
image: docker.io/library/redis:7
restart: unless-stopped
volumes:
- redisdata:/data
paperless-db:
image: docker.io/library/postgres:16
restart: unless-stopped
volumes:
- pgdata:/var/lib/postgresql/data
environment:
POSTGRES_DB: paperless
POSTGRES_USER: paperless
POSTGRES_PASSWORD: <strong_pass>
paperless-webserver:
image: ghcr.io/paperless-ngx/paperless-ngx:latest
restart: unless-stopped
depends_on:
- paperless-db
- paperless-broker
ports:
- "8000:8000"
healthcheck:
test: ["CMD", "curl", "-fs", "-S", "--max-time", "2", "http://localhost:8000"]
interval: 30s
timeout: 10s
retries: 5
volumes:
- data:/usr/src/paperless/data
- media:/usr/src/paperless/media
- ./export:/usr/src/paperless/export
- ./consume:/usr/src/paperless/consume
environment:
PAPERLESS_REDIS: redis://paperless-broker:6379
PAPERLESS_DBHOST: paperless-db
PAPERLESS_DBPASS: <strong_pass>
PAPERLESS_OCR_LANGUAGE: hrv+eng
PAPERLESS_OCR_LANGUAGES: hrv eng deu
PAPERLESS_SECRET_KEY: <random_50_chars>
PAPERLESS_URL: https://paperless.<vasa_domena>.com
PAPERLESS_TIME_ZONE: Europe/Zagreb
PAPERLESS_OCR_MODE: skip
PAPERLESS_CONSUMER_POLLING: 60
PAPERLESS_FILENAME_FORMAT: "{created_year}/{correspondent}/{title}"
USERMAP_UID: 1000
USERMAP_GID: 1000
volumes:
data:
media:
pgdata:
redisdata:
Pokrenete s docker compose up -d, prvi korisnik se kreira preko docker compose exec paperless-webserver python manage.py createsuperuser. Web UI je na http://<host>:8000.
Workflow — kako stvarno radi u praksi
A) "Consume" folder
Najjednostavniji pristup: mapa /consume na hostu (mountana u container) je "ulazna ladica" za Paperless. Sve što ubacite u tu mapu — bilo SCP, bilo Samba share, bilo Synology Hyper Backup linked folder, bilo skener koji u mrežu šalje preko SMB-a — Paperless automatski:
- Detektira nove datoteke
- Pokreće OCR
- Trenira klasifikator (ako je prošlo prvih ~30 dokumenata)
- Indeksira u Postgres
- Premjesti u
/mediastrukturu po formatu{godina}/{korespondent}/{naslov} - Odbaci iz consume mape
B) Skener-direktno-u-Paperless (preporučeno)
ADF skeneri s WiFi (Brother ADS-1700W, Epson ES-580W) imaju "Scan to SMB" ili "Scan to FTP" opciju. Postavite ih da pišu izravno u \\paperless-host\consume share. Tada cijeli workflow izgleda:
- Stavite 30 stranica papira u ADF
- Pritisnete "Scan to Paperless" tipku
- 90 sekundi kasnije Paperless je sve obradio i klasificirao
To je razlika koja čini Paperless stvarno održivim, a ne hobby projektom koji odustanete nakon 2 mjeseca.
C) E-mail consumer
Paperless može pratiti IMAP račun (npr. dedicated arhiva@vasadomena.hr ili Gmail filter koji push-a u poseban label):
- HEP, T-mobile, Allianz šalju mjesečne e-račune u PDF privitku — Paperless ih automatski usisava
- eRačun korisnici mogu postaviti pravilo: "iz mojOIB@e-racun.hr u Paperless"
- Doctor's office referencije (medicinski izvještaji) preko encrypted attachment workflow-a
Konfiguracija je u Web UI → Settings → Mail.
D) Mobilna app (Paperless Mobile)
Paperless Mobile — third-party Flutter aplikacija (Android + iOS), open-source. Omogućava:
- Upload fotografije s telefona izravno (skenira na iPhoneu kroz Vision API, šalje PDF u Paperless)
- Browse cijele arhive offline
- Skenirati račun u trgovini, dodati tag "porez 2026", spremiti — gotovo za 30 sekundi
Klasifikacija — gdje stvarno štedite vrijeme
Paperless ima machine-learning klasifikator koji uči nakon ~30 ručno tagiranih dokumenata. Nakon toga automatski dodjeljuje:
- Korespondenta (HEP, T-mobile, Allianz...)
- Tip dokumenta (račun, garancija, ugovor, izvod)
- Tagove ("porez 2024", "garancija aktivna", "platiti do kraja mjeseca")
Ključ: 1. Prvih 30 dokumenata otagirajte ručno — to je trening set 2. Idite na Settings → Automatic Classifier → klik "Train" 3. Iduća 100 dokumenata Paperless će automatski tagirati (vi samo potvrđujete ili korigirate) 4. Iduća 1.000 dokumenata radi sam
Realan učinak: 5–10 minuta tjedno umjesto sat vremena na klasifikaciju nove pošte.
Backup — apsolutno obavezno
Paperless ne čuva ništa van vaše mreže. To znači da je vaš disk = vaše vlasništvo, ali i vaš risk.
Paperless export mehanizam:
docker compose exec paperless-webserver document_exporter ../export -na -nt -p
Stvara mapu s svim dokumentima + metapodacima u jednostavnom JSON formatu. Ta se mapa stavlja u 3-2-1 backup (vidi 3-2-1 vodič).
Veličina za prosječnu kuću: 5–15 GB. Dakle, lako stane na obični USB stick, B2 cloud bucket (~0,4 EUR/mjesečno), ili u rotaciju offsite diska.
Cron job (Linux):
0 2 * * * docker compose -f /opt/paperless/docker-compose.yml exec -T paperless-webserver document_exporter /usr/src/paperless/export -na -nt -p
I onda restic / Duplicacy / rsync to na B2 jednom dnevno.
Realan kalendar prve godine
| Vrijeme | Aktivnost | Trošak |
|---|---|---|
| Tjedan 1 | Kupnja ADF skenera + N100/Pi5 + 500 GB SSD | 400 EUR |
| Tjedan 1 | Docker setup, prvi test (10 dokumenata) | 2 h |
| Vikend 1 | Skeniranje 1 fascikla — porezne prijave zadnjih 5 god. | 3 h |
| Vikend 2 | Skeniranje računa i garancija | 4 h |
| Vikend 3 | Skeniranje medicinskih nalaza | 2 h |
| Vikend 4 | Skeniranje bankovnih izvoda + ugovora | 3 h |
| Mjesec 2–12 | 5–10 min tjedno, novi dokumenti | <10 h |
Ukupni vremenski ulog: ~24 h prve godine, <10 h godišnje dalje.
Realan primjer — vraćanje na garanciju
Prošli vikend prvašnji laptop je crknuo. Klasični workflow: 1. Tražiti račun po fasciklima: 40 min, ne nalazi se 2. Otići do trgovine i tražiti reprint računa: 20 min vožnje + čekanje 3. Tražiti garanciju u proizvodnih dokumenata: 25 min 4. Ukupno: 2 sata
Paperless workflow: 1. Otvoriti web UI, "laptop garancija" pretraga: 8 sekundi 2. Download PDF s računom, garancijom, originalnom košaricom: 30 sekundi 3. Slanje u servis e-pošte: 1 minuta
Razlika: 2 sata vs 2 minute.
To je razlog zašto Paperless-ngx odavno nije "homelab gadget" već nešto što se isplati i bakama-djedovima u obitelji (iako oni neće postavljati Docker, vi to napravite za njih).
Najčešće greške i kako ih izbjeći
- Krenuti bez ADF skenera. Snimanje 500 dokumenata mobitelom završi u odustajanju. Investirajte u ADF od početka.
- Postaviti OCR samo na "eng". Hrvatski OCR (Tesseract
hrvdata) je obavezan — bez njega "račun" postaje "raCun" i pretraga ne radi. - Bez 3-2-1 backupa. Disk crkne, sve nestaje. To je gore nego prije Paperlessa jer ste papirne originale već bacili.
- Ne raditi exporter cron job. Postgres dump nije dovoljan —
document_exporterdaje human-readable arhivu koja preživi i da Paperless-ngx jednog dana nestane. - Pohrana u "single bucket" cloudu bez self-host kopije. Ako sve fotografirate na Backblaze B2 i jedan dan se accountu nešto desi, nemate ništa lokalno. Local-first, cloud second.
- Skener u WAN-u. Brother i Epson skeneri imaju vlastite web UI-eve koji preko zadanog gateway-a "zovu kući". Stavite ih u izolirani VLAN (vidi Wi-Fi router vodič).
- Forsiranje "perfect tagova" od početka. Krenete s minimalnim setom: 5 korespondenata, 3 tag-tipa, 4 doc-tipa. Postupno raste organski, ne planirajte sve unaprijed.
Sigurnost — GDPR i ozbiljnost dokumenata
Vaša Paperless instalacija sadrži sve osjetljive podatke obitelji: OIB-ove, bankovne izvode, medicinske nalaze, ugovore. Tretirajte je kao malu banku:
- HTTPS samo, nikad HTTP za vanjski pristup
- Reverse-proxy s 2FA (Caddy + Authelia, ili NGINX + Authentik)
- VPN-only pristup (Tailscale, Wireguard) je još bolji od javnog pristupa
- Postgres backup šifrirajte prije slanja u cloud —
resticčini to nativno, kao i Duplicacy - Disk encryption na hostu (LUKS na Linuxu) — ako ukradu N100, sirovi PDF-ovi se ne mogu čitati
- AZOP nije irelevantan za kućnu uporabu, ali ako planirate dijeliti pristup s računovođom — to su pravna pitanja koja zahtijevaju i Data Processing Agreement
Sažetak
Paperless-ngx je najbolji self-hosted DMS u 2026., dovoljno sazreo da ga preporučujemo i običnim korisnicima (kroz tehničkog člana obitelji koji ga postavi). Ulaganje od ~400 EUR u skener + mini-PC, ~24 h prvog vikenda u digitalizaciju, i trajno rješavate problem papirne arhive.
Kombinacija s N100 homelab serverom, 3-2-1 backupom, i pametnim domom čini cjelovitu "lokalnu autonomiju" — sve obiteljske podatke kod kuće, pretraživo, sigurno, i neovisno o cloud servisima.
Sljedeći logički korak nakon Paperless-a obično je Immich za fotografije — isti princip, druga vrsta podataka, ista filozofija privatnosti.