Dokumentenscanner

Liebe Experten!

Ich habe mich inspirieren lassen, mein Büro auf papierlos umzustellen und bräuchte dafür einen vernünftigen Dokumentenscanner.

Die Dokumente, die bei mir zu scannen wäre, sind überwiegend Worddokumente, Zeitschriftenartikel (die ich auch ausschneiden würde für den Einzug), Viele Bildder (Frisurenbilder DIN-A4 aus Zeitschriften), aber auch ärztliche Atteste (also kleinere Formate).

Muss ich mich zwischen einem Einzugsscanner und einem „normalen“ entscheiden oder gibt es Scanner, die beides können?

Welches Modell erkennt Worddokumente gut, sodass ich diese auch wieder mit Word bearbeiten könnte, und scannt gleichzeitig Bilder in guter Qualität?

Für Empfehlungen bedanke ich mich im Voraus!

Danke und Gruß, Diva

Hallo,

äh, wozu willst du ein Word-Dokument einscannen? Das liegt doch schon als Datei vor. Oder meinst du einen Text, der irgendwann mal mit Word erstellt und anschließend ausgedruckt wurde?

Mir persönlich ist zumindest kein Modell bekannt, das beides kann, aber das muss nichts heißen.

Das hat nichts mit dem Scannermodell sondern mit der Software zu tun. Für Texterkennung benutze ich Abbyy-FineReader und bin damit sehr zufrieden.

Gruß
Christa

Die Modernen können das immer beides. Du kannst den Einzug hochklappen und hast dann das normale Glas.

Das gibt es nicht. Aus dem Scanner fallen immer Bilddateien aus, die im besten Fall noch in ein PDF verpackt werden. Bearbeiten kannst du das grundsätzlich nicht ohne weitere Schritte.

Also für deine realistischeren Anforderungen reicht jeder einfache Multifunktionsdrucker mit Einzelblatteinzug. Die sind viel (!) günstiger als die dedizierten Dokumentendrucker. Netzwerkfähigkeit macht unbedingt Sinn.

Achte darauf, dass er direkt in PDF drucken kann, das ist für Dokumente das Mittel der Wahl, weil du das dann gleich wieder als A4 ausdrucken kannst.

Achte auch darauf, dass das Ding auch ohne Hilfe des PCs scannt, etwa auf eine externe Festplatte.

Und wenn du einmal Geld ausgibst, dann nimm was mit Duplex-Scaneinheit. Obacht, da musst du genau lesen. Viele von den Druckern können zwar duplex drucken aber nur einseitig scannen.

Ich mache das seit Jahren so mit einem Scanner, der direkt auf mein NAS scannt. Da ist auch irgendwie ein Tintenstrahler unten dran. Aber den habe ich noch nie benutzt. Den hier hab ich: HP Officejet Pro 8620.

Den würde ich aber ehrlich gesagt nicht wieder kaufen, weil die Duplex-Scaneinheit hin und wieder Papierstau macht, wenn der A4-Brief doppelt gefaltet im normalen Briefumschlag steckte. Darauf würde ich das nächste Mal mehr achten. Aber damit warte ich, bis die Kiste Schrott ist - meistens geht es ja.

Boah, ich sollte erst nochmal lesen, bevor ich das abschicke… Hier ein paar Korrekturen.

Also Scannen meint: Papier oben drauf, elektronische Bilddaten auf die Platte.

Scanner! Ich meine Mulitfunktionsdrucker sind günstiger als Dokumentenscanner.

Scanne, ich meine scannen. Also Papier oben drauf, PDF auf die Platte.

Duplex bedeutet: Beidseitig bedrucktes Blatt oben rein, beide Seiten werden automatisch gescannt, ohne dass du da manuell was drehen musst.

Wenn du nicht gerade ständig größere Mengen zu verarbeiten hast, lohnt die Investition in einen echten Dokumentenscanner (ggf. auch noch Duplex) regelmäßig nicht. Ganz abgesehen davon, dass das dann reine Durchzugsscanner sind, was natürlich bei größeren Papierstapeln Sinn macht, nicht aber bei „der ein oder anderen Seite“, von denen ggf. auch noch einige Sonderformate haben, und tatsächlich mal doppelseitig gescannt werden wollen.

Ich würde auf ein etwas besseres AIO (all-in-one) Gerät setzen, das Druck- und Scanfunktion (ggf. auch noch Fax) vereint. Da hast du dann sowohl Einzelblatt als auch Einzug. Und kannst im Falle des Falles dann auch problemlos Sonderformate, doppelseitige Dokumente, Dinge, die du nicht so einfach rausreißen kannst/willst, … scannen. Es gibt die Dinger auch mit Duplexscanner. Ob der Aufpreis hierfür lohnt ???

Bessere AIO verfügen über Netzwerkfähigkeit und die Möglichkeit unterschiedliche Scanjobs für unterschiedlichen Bedarf anzulegen. D.h. da kannst Du dann angeben, ob Du s/w oder Farbe, JPG oder PDF, geringe oder hohe Auflösung, … an unterschiedliche Ziele (Speicherkarte, PC, Netzwerkfreigabe, Mailadresse, … )senden willst. In den zugehörigen Softwarepaketen ist üblicherweise auch eine OCR-Software enthalten, die man dann ebenfalls direkt per Tastendruck befeuern kann. D.h. es wird dann passend für die Texterkennung gescannt, und die Datei gleich an die auf dem PC installierte Software übergeben, die dann die Texterkennung durchführt. Das klingt auf den ersten Blick alles ganz super. Ich kenne aber kaum Leute, die das regelmäßig dann auch tatsächlich nutzen. Dafür ist der manuelle Aufwand der Nachbearbeitung dann doch zu groß, wenn man nicht unmittelbar eine Weiterverarbeitung in der Textverarbeitung betreiben will.

Ich habe hier ein Farblaser-Gerät von hp im Einsatz, mit dem ich recht zufrieden mit all diesen Dingen bin, auch wenn ich tatsächlich recht wenig digital archiviere. Aber alleine schon die Tatsache beim Scannen gleich den vordefinierten Job aufrufen zu können, um die Dinge an die richtige Stelle im richtigen Format zu bekommen, ist schon sehr hilfreich.

Ja, ist ein ausgedrucktes, Word-Dokument kein Word-Dokument mehr? Ich habe viele Dokumente nur noch als Ausdruck vorliegen oder von Kollegen bekommen oder oder…

Darf ich dann mal ganz dumm fragen: Ich kaufe also solch einen Scanner und die Software kaufe ich nochmal extra dazu, je nach Anforderungen?

Danke und Gruß
Diva

Sorry, ich verstehe keine Wort von dem, was du sagst, jetzt erst recht nicht mehr.

Was bedeutet das?
Dass ich ein Papierdokument auf den Scanner lege und dieses dann als pdf auf der Festplatte gespeichert wird?

Ich habe einen Multifunktionsdrucker, aber der hat keinen Einzelblatteinzug. Die können doch immer nur auf der Platte oben scannen. Was für ein Multifunktionsdrucker hat denn auch noch einen Einzug zum Scannen?

Bitte nicht in Computerexperten-Jargon mit mir sprechen, dafür bin ich zu doof.

Danke und Gruß,
Diva

Ich habe solch ein Gerät, allerdings wüsste ich nicht, dass die einen Einzug zum Scannen haben.

Ich hab halt keine Lust, alle Papierstapel, die ich am Ende des Schuljahres einscannen muss, per Hand auf den Scanner zu legen.

Mein Gerät ist ein Brother DCP J4120 DW, falls das hilft. Ich wüsste nicht, wie da ein Einzug zum Scannen funktionieren sollte.

Welche Geräte gibt es da bspw., dass ich mir das mal ansehen kann?

Danke und Gruß,
Diva

Nein. Ein ausgedrucktes Word-Dokument ist ein Stück Papier mit bunten oder schwarzen Punkten drauf. Dein Kopf interpretiert aus diesen Punkten dann die Information heraus.

Genau. Aber dir muss auch klar sein, dass du nie mehr das originale Word-Dokument wiederbekommst. Du bekommst irgendwas, was eventuell so ähnlich aussieht, was mit Sicherheit inhaltliche Fehler hat und was sich eventuell irgendwie weiterverarbeiten lässt.

Allein durch die Texterkennung (also die Interpretation bunter und schwarzer Punkte in echten Text) geht viel Information verloren. Je schlechter der Ausdruck, desto mieser die Erkennung. Fachbegriffe kannst du meistens ganz vergessen. Abkürzungen sowieso.

Es kommt halt nicht das Originaldokument raus, sondern eine wage Interpretation bunter und schwarzer Punkte.

Wenn es oben heißt

dann bedeutet das am Ende nur, dass man sich mit den Unzulänglichkeiten irgendwie arrangiert hat.

Hab doch ein konkretes Modell geschrieben. Aber bitte auch nochmal hier:

Alle, die oben nicht flach sind, sondern so einen Aufbau haben, die haben einen Einzelblatteinzug.

1 Like

Einzelblatteinzug gibt es nur bei den etwas besseren Geräten. Ich habe hier einen hp Color Laserjet Pro MFP M277dw. Davor hatte ich auch ein Gerät von Brother, dass mechanisch gesehen deutlich massiver und besser aufgebaut war, aber auch schon uralt war. Dieses Mal hat der hp ein Gerät von Brother dann knapp geschlagen (ist aber auch schon zwei Jahre her, d.h. das damals in die engere Wahl genommene Modell dürfte inzwischen auch schon wieder veraltet sein. Aber solche Geräte hat eigentlich jeder namhafte Hersteller im Angebot.

Wenn du tatsächlich viel per Einzelblatteinzug scannen willst, würde ich mir genau ansehen, wie gut die Mechanik dieses Einzugs ist. Ist das eher „Spielzeug“ mit viel dünnem Plastik, oder eher recht massiv mit viel Metall? Für eine bessere Mechanik wird man ein paar Euro mehr ausgeben müssen. Die dürften sich aber bei großem Volumen lohnen. Ich würde da mal so grob min. € 200,-- anpeilen. Mein hp ist da übrigens auch eher schwachbrüstig. Aber der Einzelblatteinzug des Scanners war für mich auch nicht so wichtig.

1 Like

Oh danke, das ist wirklich ein sehr wertvoller Hinweis.

Dann muss ich nochmal drüber nachdenken.

Vermute, das gilt in gleicher Weise für Zeitschriften-Artikel usw.

Wie machen andere das, die ihr ganzes Büro papierlos organisieren? Das kann doch keine zufriedenstellende Alternative sein?!

Naja, die heben sich halt die Word-Dokumente einfach mit auf. Und alles, was du nur auf Papier bekommst, sollst du wahrscheinlich auch nicht verändern.

Ich mach das privat so, dass ich jeden Brief einscanne und dann schreddere. Somit habe ich alle Korrespondenz im PDF-Format vorliegen. Wenn man dabei noch ein paar sinnvolle Dateinamen vergibt, dann findet man das Zeug viel (!) schneller, als wenn man im Ordner blättern muss. Und man hat das in der Datensicherung drin. Wenn dir deine Ordner abbrennen, sind sämtliche Dokumente fort. Ich hab das alles in meinen Backups.

Und… Niemand will im privaten Umfeld jemals von irgendwas die Originale sehen. Kopien reichen immer. Wenn ich also einen Brief in Papier vorzeigen muss, dann drucke ich den einfach wieder aus und hab ne Kopie.

Übrigens: auch im PDF kann man eine Texterkennung machen, dann kann man das zwar nicht verändern aber man kann innerhalb eines Briefes suchen. Dann isses auch nicht schlimm, wenn da mal was falsch erkannt ist.

1 Like

genau.

Sowas gibt es auch für kleines Geld. Das habe ich dir doch verlinkt. Warum muss ich diese Information denn dreimal geben? Du bist doch hier Modöse, du solltest doch klarkommen damit, wenn ein Thread sich über mehrere Antworten zieht.

Du musst überlegen, wo eine Texterkennung Sinn macht, und wo es reicht, ein „Abbild“ eines Textes in Form eines PDFs oder JPGs zu haben. Texterkennung funktioniert heute bei sauberen und grafisch nicht sonderlich gestalteten Texten mit anständiger Abbildungsqualität erstaunlich gut, wenn man mal von Spezialitäten wie Fraktur, haderhaltigem Papier, … absieht. Aufwändig wird es halt immer bei grafisch gestalteten Seiten mit mehreren Spalten, unterschiedlichen Schriften/Schriftgrößen, Bildern, … weil die Programme dabei oft überfordert sind, dem Verlauf eines konkreten Textes z.B. auf einer Zeitschriftenseite zu folgen.

Es stellt sich aber die Frage, in welchen Fällen man tatsächlich einen dann in einer Textverarbeitung weiterverarbeitbaren Text braucht? Dies ist bei Archivierung üblicherweise nicht der Fall. Da reicht es normalerweise, dass man sich die gescannte Seite als „Bild“ ansehen, und manuell lesen kann. Sollte sich der Bedarf einer Weiterverarbeitung als Text nachträglich ergeben, kann man die Texterkennung im Einzelfall immer noch über das zunächst gespeicherte PDF/JPG laufen lassen.

Professionelle Archivierungslösungen (die für dich aber eher nicht in Frage kommen werden), kennen noch eine Mischform, bei der über Masken konkrete textliche Informationen aus dem Scan per Texterkennung gewonnen werden, die dann zur Indizierung der Dokumente genutzt werden. D.h. man lässt dann nicht den ganzen Text erkennen, sondern z.B. nur die bei bestimmten Rechnungen immer wieder an einer bestimmten Stelle stehende Rechnungsnummer, um hierüber dann den Scan einer konkreten Rechnung wieder auffinden zu können.

Äh, das war vielleicht beim Nadeldrucker so, mit den Punkten, beim Tintenstrahler auch ein bisschen, aber das, was ein Laserdrucker ausgibt, ist doch ein bisschen größer als Pünktchen. Aber dass ein ausgedrucktes Word-Dokument kein Word-Dokument mehr ist, sehe ich genauso.

Wann hast du zuletzt eine OCR-Software benutzt? Als ich in den Neunzigern studiert habe und OCR brauchte, war OmniPage (ich bin mir nicht mehr ganz sicher über den Namen), glaube ich, das Non-Plus-Ultra, aber die Erkennungsrate war grottenschlecht.

Das hängt bei dem Abbyy definitiv von der Vorlage ab. Bei guten Vorlagen (PDF-Dateien, aber nicht von gescannten Bildern natürlich) habe ich tatsächlich eine Erkennungsrate von 100 %.

Mir kommt da gerade ein denkwürdiger (und amüsanter) Vortrag in den Sinn:

Aber zurück zur Frage:
Du benötigst dann einen Flachbettscanner mit automatischem Dokumenteneinzug (ADF).

Das wirft eine Preisvergleichsmaschine dabei heraus:
https://www.heise.de/preisvergleich/?cat=scn&xf=2881_Flachbettscanner~778_ADF