Skip to content

RadioTux Sendung Februar 2018

Der Winter

Das Feld ist kahl, auf ferner Höhe glänzet

Der blaue Himmel nur, und wie die Pfade gehen,

Erscheinet die Natur, als Einerlei, das Wehen

Ist frisch, und die Natur von Helle nur umkränzet.

Der Erde Stund ist sichtbar von dem Himmel

Den ganzen Tag, in heller Nacht umgeben,

Wenn hoch erscheint von Sternen das Gewimmel,

Und geistiger das weit gedehnte Leben.

-- Friedrich Hölderlin (1770 - 1843)

Es ist bitter kalt draußen aber wir bringen euch die neue RadioTux Sendung. Es geht um UBPorts und Scanner unter Linux.

Wir wünschen euch viel Spaß!

Shownotes

2018-02-28.RadioTux.Magazin.Februar2018.mp3

2018-02-28.RadioTux.Magazin.Februar2018.ogg

2018-02-28.RadioTux.Magazin.Februar2018.m4a

2018-02-28.RadioTux.Magazin.Februar2018.flac

2018-02-28.RadioTux.Magazin.Februar2018.opus

MP3 Low-Version

Trackbacks

Keine Trackbacks

Kommentare

Ansicht der Kommentare: Linear | Verschachtelt

Frank Emter am :

Bezüglich papierloses Büro möchte ich auf den Artikel https://www.pro-linux.de/artikel/2/1892/dokumente-digitalisieren-und-zukunftssicher-aufbewahren.html hinweisen.

Privat verwende ich gscan2pdf (https://sourceforge.net/projects/gscan2pdf/) unter Debian Stretch, das mir hier gute Dienste leistet. Leider ist das Programmpaket recht komplex und bei einigen Distros schlecht gepflegt.

Trolli Schmittlauch am :

Bzgl. dem papierlosen Büro: Ich selbst habe keine Erfahrung damit, habe aber mal https://github.com/openpaperwork/paperwork als Lösung dafür aufgeschnappt.

Dirk Deimeke am :

Mit dem "papierlosen Büro" kommt ein Thema, was ich auch schon lange auf der "noch zu erledigen"-Liste habe. Ich bin sehr gespannt, vor allem das DMS interessiert mich.

Ingo am :

Genau so geht es mir auch. Da ich mich aber beruflich gerade mit einem DMS beschäftige ist das ein guter Zeitpunkt das mal anzugehen. Wird sicher noch ein paar Monate dauern aber ich werde weiter berichten wie meine Erfahrungen sind.

Grüße

Sebastian am :

Mit dem Thema Papierloses Büro und DMS beschäftige ich mich Privat seit nun ca. 4 Jahren. Seither Scanne ich meinen Briefverkehr um meine Dokumente stets bei mir zu haben. In dieser Zeit habe ich mir einige Gedanken zu dem Thema gemacht und im letzten Jahr eine Blaupause für ein DMS erstellt, jedoch hatte ich noch keine Zeit das Projekt in angriff zu nehmen.

Ich würde mich sehr freuen wenn du dich bei mir meldest und wir uns über das Thema austauschen können (e-mail steht ja beim Kommentar dabei ;-) ). Für das Scannen habe ich zum Beispiel auch ein Shell Script erstellt welches die Dokumente über scanimage einscannt, die Bilder umwandelt, leere Seiten raus filtert, OCR darüber laufen lässt und das ganze zu einem PDF zusammen packt.

Grüße,

Sebastian

Thomas am :

Ich verwende als Workflow für das Papierlose Büro eine Kombi aus ocrmypdf und ecodms (kommerzielles DMS). Ocrmypdf ist ein script, welches mit tesseract und einigen anderen tools saubere, kleine pdf-a files erstellt. Diese lade ich dann ins ecodms (was prinzipiell auch ocr etc. könnte). Bin damit bisher ganz zufrieden.

tuxflo am :

Riesenthema DMS:

Zunächst mal zum Subthema "Scanner der Duplexscans durchführen kann": wenn man das Ganze nur privat einsetzt, kann man auch einfach einen "normalen" Scanner mit Dokumenteneinzug verwenden, und die Beidseitigkeit nachträchlich z.B. mit Hilfe von pdftk erreichen. Ich habe das Ganze mal in einen Docker Container gepackt: https://github.com/tuxflo/docker-mergepdf der Container überwacht mittels incrond den Scanordner auf Dokumente die mit _o (für "odd") und _e (für "even") enden und fügt diese dann mittels pdftk zusammen. Man kann also einfach einen Stapel scannen, rumdrehen, erneut scannen und fertig ist das Duplexdokument.

Subthema OCR: ich vermute mal die gängige Lösung für pdf Dokumente ist OCRmypdf, welches auf tesseract aufsetzt. Auch wenn die Ergebnisse hier schon ganz OK sind, kommt es an die Qualität von kommerziellen Produkten wie abbyfinereader (den es mittlerweile als Dienst auch für Linux gibt) nicht heran.

Subthema DMS:

Ich habe auch lange Zeit damit zugebracht mir das irgendwie selbst zu basteln und verschiedene "fertige" Lösungen ausprobiert und bin mittlerweile bei ecoDMS, was Thomas hier auch schon erwähnt hat, hängengeblieben (nicht Open Source). Die Vorteile: Client/Server Konzept, Docker Version verfügbar (dann kann der Server auch auf einem NAS laufen), Plattformübergreifend (Clients gibt es für Debian/Ubuntu, Windows, macOS) und meiner Meinung nach das Beste: der "vorgegebene" Workflow: zunächst landen die Dokumente in einer INBOX und können von da aus entweder mit automatischen Vorlagen oder manuell Archiviert werden.

Weiterhin ist das Ganze recht günstig und kann mit etwas handarbeit auch auf abbyfinereader umgestellt werden, damit bessere OCR Ergebnisse erzielt werden können.

Ich bin dennoch gespannt, was du für Erfahrungen gemacht hast und freue mich schon jetzt auf die nächste Folge...

Ingo am :

OCR: Genau entweder man nimmt was auf Tesseract Basis oder abbyfinereader. Abby ist nicht ganz billig aber hat auch eine Kommandozeilen Linux Version. Man darf dann nur 25.000 Sachen pro Jahr einscannen aber ich denke da kommt man nicht so schnell dran.

DMS: Hatte ich überlegt agorum core mir näher anzuschauen oder eine Lösung mit Nextcloud zu basteln. Wenn man mit ocrmypdf die Sachen in die Nextcloud packt und diese eine Volltextsuche hat dann ist auch schon mal viel geschafft.

Dirk am :

Moin,

als Ubuntu Phone Fan hat mir die Sendung sehr gefallen.

Als Hobbyprogrammierer hab ich mir auch schon einige Apps gemacht. Nur leider ist die Dokumentation nur in Englich verfügbar. Und in meinem alter hat man keine Zeit mehr um die Schulbank zu drücken. Würd mich freuen wenn Ihr öffters drüber berichten würdet.

Kommentar schreiben

Umschließende Sterne heben ein Wort hervor (*wort*), per _wort_ kann ein Wort unterstrichen werden.
Standard-Text Smilies wie :-) und ;-) werden zu Bildern konvertiert.
Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet.
Formular-Optionen
tweetbackcheck