Die letzten Meldungen

Neues IT-Kursprogramm bis Oktober online

28. Juni 2017

Neue Kurse sind online. Studierende als Kursleiter für Excel & Co gesucht.
Weiterlesen...

Apple-Day am 06. Juli 2017 am RRZE, 10 – 16 Uhr

26. Juni 2017

Am 06. Juli 2017 findet am RRZE wieder der traditionelle Apple-Day statt.
Weiterlesen...

Störungen der Datennetzversorgung im Bereich der Tentoria-Süd / Bürocontainer E-Technik (Behoben)

21. Juni 2017

Durchtrennung der LWL/Glasfaser-Anbindung zwischen RRZE und Tentoria durch laufende Tiefbauarbeiten (Bagger).
Weiterlesen...

Meldungen nach Thema

 

Alte und weitere Anleitungen

Hier finden Sie Anleitungen zu Soft- und Hardware, die derzeit nicht im TNZB-CIP-Pool installiert ist, aber teilweise aber ähnliche Funktionalität, wie die dort zur Verfügung stehenden Programme und Geräte aufweist.

Die alten Anleitungen enthalten z.B. noch nützliche Tipps, in die jemand mal viele Arbeit gesteckt hat und die einfach zu schade zum Wegwerfen sind.

Gliederung

Acrobat (nicht auf CIP-Pool-Rechner installiert)

Acrobat kann auch Dokumente direkt vom Scanner einscannen und diese in PDF umwandeln, die Bilder einer OCR-Erkennung unterziehen und den erkannten Text für Suchaufgaben indizieren.

Mit Acrobat Pro XI kann man natürlich auch noch viele weitere Dinge tun, wie z.B.

  • Dokumentgröße auf Qualität bzw. Dateigröße optimieren
  • Rechtschreibprüfung
  • Problemstellen bei der OCR-Erkennung suchen
  • Analysieren, welche Farbräume und Profile enthalten sind
  • Dokument mit Editor bearbeiten,
    • Text bearbeiten oder
    • Hintergrundbild der OCR-Texterkennung entfernen oder ersetzen.
  • Seiten hinzufügen und entfernen
  • PDF-Dokumente ins Powerpoint, Word Format, HTML und Bildformate wandeln
  • Mit dem Aktionsassistent lassen Sich Aktionen erstellen, mit denen man z.B.
    • automatisch direkt per WIA-Treiber einscannen,
    • nachträglich eine Texterkennung durchführen,
    • anschliesend das Dokument in einen speziallen PDF/A-Standard zur Langzeitarchivierung konvertieren,
    • das Dokument ins Word- oder Powerpoint-Format konvertieren oder
    • auch direkt ausdrucken kann.

Durchsuchbares, archivtaugliches PDF erstellen mit Acrobat Pro

Acrobat Pro ist leider nicht auf den ScanPCs des TNZB-CIP-Pools vorhanden!

Die Acrobat OCR-Erkennung reduziert die Aufllösung auf 600 dpi, falls die Auflösung des gescannten Dokumenters höher ist. Die besten Ergebnisse erzielt man mit 300 dpi (Standardeinstellung) oder 600 dpi. Bei 600 dpi werden die Dateien allerdings schon sehr groß. Man kann auch 72 dpi bzw. 150 dpi einstellen.

Die Acrobat OCR-Erkennung unterscheidet drei Methoden:

  • Durchsuchbares Bild
  • Durchsuchbares Bild (exakt)
  • ClearScan

Beim durchsuchbaren Bild wird Priorität auf das eingescannte Bild gelegt, der durchsuchbare Text liegt unsichtbar darüber. Hier ist der Text nicht editierbar, kann aber per Copy&Paste entnommen werden. Wird anschließend das Dokument in den PDF-Standard PDF/A-3u konvertiert, so kann leider kein Text per Copy&Paste entnommen werden. Diese Methode wird von den meisten anderen OCR-Programmen auch verwendet. Hier spielen falsch erkannte Zeichen eine geringere Rolle, da man der eigentlichen Text ja nicht sieht, sondern nur zur Suche nutzt. Bei falsch erkannten Worten funktioniert meist auch die Suche nach einem Teil der Zeichen.

Die Variante exact behält die Originalbildgröße bei, während sich bei der anderen die Auflösung verändern lässt bzw. per default auf 300 dpi reduziert wird.

Bei der Methode ClearScan wird Priorität auf den erkannten Text gelegt, das eingescannte Bild liegt in einer etwas verblassten Version als Hintergrund darunter. Hier ist der Text editierbar und kann auch per Copy&Paste entnommen werden. Das Hintergrundbild kann mit dem, in Acrobat Pro enthaltenen Editor, gelöscht werden. Diese Methode eignet sich gut, falls man das Dokument ins Powerpoint- oder Word-Format exportieren will. Auch das ist mit Acrobat Pro XI möglich. Hier fallen natürlich falsch erkannte Zeichen deutlich ins Gewicht, so dass meist noch nachträglich Textkorrekturen vorgenommen werden müssen.

Acrobat 10 Pro oder Acrobat 11 Pro

> Datei > Erstellen > PDF über den Scanner > Benutzerdefiniertes Scannen
Scanner auswählen: Epson Perfection V700/750 (WIA-Epson Perfection V700/750 geht nicht richtig)
Auflösung: 300 dpi oder 600 dpi
Papierformat: A4
(x) Gescannte Datei optimieren: eventuell Hohe Qualität
(x) PDF/A-1b-kompatibel machen
Hier kann man leider kein PDF/A-2u oder PDF/A-3u wählen. Mit Preflight lässt sich dies aber nachträglich durchführen. u steht für Unicode, was durchaus sinnvoll für Langzeitarchivierung ist. b steht für Basic und enthält noch keinen Unicode.

Aufgetretene Probleme

  • Leider geht bei der nachträglichen Konvertierung mit Preflight die Durchsuchbarkeit in einigen Kombinationen (siehe Test und Tabelle unten) verloren.
  • Leider funktioniert die Konvertierung in den PDF/A-2u bzw. -PDF/A-3u Standard nur bei Acrobat 11 Pro, nicht dagegen bei Acrobat 10 Pro, obwohl dieses Feature schon vorhanden ist.
  • Leider verklemmt sich Acrobat 11 Pro manchmal, so dass man eventuell mehrere Versuche machen bzw. den Destiller schließen muss.

> Werkzeuge > Druckproduktion > Preflight > Nach PDF PDF/A-2u konvertieren bzw.. PDF/A-3u konvertieren.

Test, in welchem PDF/A Standard ist das gescannte Bild durchsuchbar

Ein zweiseitiges DIN A4 Dokument mit Text und Bildern wurde mit Acrobat X durchsuchbar eingescannt, mit 600 dpi und gleich archivierbar als PDF/A-2b erstellt.

Da Acrobat X Pro Probleme beim Konvertieren nach PDF/A-2u und PDF/A-3u hat, wurde die Konvertierung auf einem anderen Rechner, auf dem Acrobat XI Pro installiert ist, vorgenommen.

  1. Dokument öffnen mit Acrobat XI Pro
  2. > Standards > Konformität prüfen (optional)(Nur, falls das Icon zur Konformitätsprüfung erscheint.)
  3. > Bearbeitung aktivieren (Nur, falls diese deaktiviert ist.)
  4. > Werkzeuge > Texterkennung > In dieser Datei bearbeiten > Bearbeiten
    Primäre OCR-Sprache:
    Deu:Deutsch (bei deutschen Textvorlagen)
    PDF-Ausgabestil: entsprechend nachfolgender Tabelle
    und Neuberechnen auf: 300 dpi bzw. besser 600 dpi einstellen.
    > Ok > Ok
  5. > Werkzeuge > Druckproduktion > Preflight > PDF/A-Standard >
    Nach PDF/A-1b konvertieren oder
    Nach PDF/A-2u konvertieren oder
    Nach PDF/A-3u konvertieren

Die folgende Tabelle zeigt in welchen Kombinationen, das Dokument nicht durchsuchbar ist.

Test in welchem PDF/A Standard ist das gescannte Bild durchsuchbar
PDF-Standard PDF-Ausgabe-Stil Neuberechnen auf Durchsuchbar Acrobat XI ältere Version Durchsuchbar Acrobat XI Version 11.0.5
PDF/a-1b Durchsuchbares Bild 300 dpi Ja Ja
PDF/a-1b Durchsuchbares Bild (exakt) 600 dpi Ja noch nicht getestet
PDF/a-1b ClearScan 300 dpi Ja noch nicht getestet
PDF/a-2u Durchsuchbares Bild 300 dpi Nein noch nicht getestet
PDF/a-2u Durchsuchbares Bild (exakt) 600 dpi Nein noch nicht getestet
PDF/a-2u ClearScan 300 dpi Ja noch nicht getestet
PDF/a-3u Durchsuchbares Bild 300 dpi Nein Ja
PDF/a-3u Durchsuchbares Bild (exakt) 600 dpi Nein noch nicht getestet
PDF/a-3u ClearScan 300 dpi Ja Ja

Empfohlen

  • PDF-Standard: PDF/A-2u,
  • PDF-Ausgabestil:Durchsuchbares Bild,
  • Neuberechnen auf: 600 dpi,
  • Primäre OCR-Sprache: Deu:Deutsch (bei deutschen Textvorlagen)

Das Problem mit der Durchsuchbarkeit scheint aber inzwischen gelöst zu sein.

Leider wird bei PDF/A-2u und PDF/a-3u auch der Acrobat Destiller göffnet. Die Konvertierung mit Acrobat Destiller und die anschließende Weiterverarbeitung und Speicherung dauern sehr lange, bei 10 Seiten durchaus länger als 10 Minuten. Dabei sollte man nicht die Geduld verlieren und versuchen den Prozess abzubrechen. Das führt eventuell dazu, dass man den Rechner neu booten muss.

Der Destiller erzeugt eine sehr große Datei, für die man genügend Plattenplatz haben muss.

Wem dies zu lange dauert und wer auf Unicode verzichten kann, sollte vielleicht derzeit noch den ältern Standard PDF/A-1b wählen.

Anmerkung

> Werkzeuge > Aktionsassistent > Gescannte Dokumente optimieren

Das reduziert in Acrobat XI Pro die Größe der Datei noch mal beträchtlich. Das Dokument bleibt weiterhin durchsuchbar, entspricht aber nicht mehr dem PDF/A-Standard. Konvertiert man das Ganze noch mal mit

> Werkzeuge > Druckproduktion > Preflight > PDF/A-Standard > Nach PDF/A-3u konvertieren

, so wird die Datei wieder deutlich größer. Eine 10-seitige DIN A4 Datei hatte nach dem Einscannen etwa 7 MB, nach Gescannte Dokumente optimieren etwa 1MB, und nach der Konvertierung nach PDF/A-3u etwa 40 MB.

> Datei > Eigenschaften...

Hiermit lassen sich die Dateigröße, Titel, Verfasser, Thema, PDF-Version, Stichwörter, Schnelle Webanzeige kontrollieren.

Nicht druckbare PDF-Datei in PDF mit Bildern wandeln

Manchmal lassen sich PDF-Dateien zwar am Bildschirm korrekt anzeigen, beim Drucken meldet sich der Postscript Error Handler mit Postscript Error (Eine Seite mit einer Fehlermeldung wird ausgedruckt).

Ein Trick ist, diese PDF-Dateien in Bilder umzuwandeln.

Acrobat XI pro

Seiten des Dokumentes als einzelne Bilder speichern

> Datei >Speichern als > Bild

Um alle auf einmal drucken zu können, wieder ein PDF daraus machen.

> Datei > Erstellen > Dateien in einem einzigen PDF zusammenführen ...

Photoshop CS6

  • PDF-Dateien mit Photoshop öffnen.
  • Alle Seiten auswählen.
  • Beschneiden auf Medien-Rahmen.

Jetzt hat man leider lauter Einzelbilder. Diese muss man jetzt entweder einzeln ausdrucken, oder z.B. mit Adobe Bridge im Modus Ausgabe wieder in ein eine PDF-Datei wandeln.

Bei ein, zwei Seiten ist diese Methode praktikabel, bei vielen Seiten aber sehr umständlich.

RRZE: Links, Tipps, Anleitungen im Umfeld von Adobe CS6

Omnipage (früher installierte OCR-Software)

Testbild Drucker

Hinweis: Falls Sie ohne Farbmangement arbeiten, sollten Sie dieses Testbild mit einer farbmanagementfähigen Software, wie z.B. Photoshop vorher in das Farbprofil sRGB umwandeln!

Mit diesem Testbild lässt sich mit Hilfe der Teststreifen am unteren Ende des Bildes prima überprüfen, wo beim Drucken von dunklen und hellen Bereichen Defizite entstehen.

Selbst bei einem guten Drucker können dunkle Tonwerte unterhalb von 8 bzw. helle Tonwerte oberhalb von 247 nicht mehr differenziert werden.

Es empfiehlt sich gleich beim Scannen, wenn man auf hohe Qualität Wert legt,diese Tonwerte entsprechend mit Gradationskurven zu korrigieren, damit vor dem Ausdruck keine weitere Bearbeitung mit einer Fotobearbeitungssoftware mehr nötig ist.

Universelle Scansoftware

Diese Programme unterstützen viele verschiedene Scannermodelle und bieten OCR Support und erlauben das Erstellen von PDF-Dateien. Auf den TNZB-CIP-Pool Rechnern sind diese aber nicht installiert.

3 Versionen

  • PaperScan Pro
  • PaperScan Home
  • PaperScan Free

Weitere beim RRZE vorhandene Scanner

Diese Scanner befinden sich in unserem Druckzentrum und können nur durch RRZE-Mitarbeiter benutzt werden!

Scannen direkt aus der Anwendung

Diese Software ist nur auf den Scannern im Druckzentrum des RRZE vorhanden!

Silverfast Scanner Software

Diese Software ist nicht auf den Rechnern des TNZB-CIP-Pools installiert, ist aber erste Wahl, falls man hohe Qualität beim Scannen, von Filmen, Dias und Fotos erzielen will.

Ältere Scanner Bedienungsanleitungen

  • HP Scanjet G4050
  • Externer Link:  HP Scanjet 4500c/5500c Benutzerhandbuch (PDF)
    Kurzanleitung HP 4500 C
    • Zuerst Scanner, dann Rechner einschalten
    • Wenn der Rechner fertig hochgefahren ist, klicken sie auf Arbeitsplatz
    • Unter Scanner Doppelklick auf HP Scanjet 4500C/5500C
    • Scanvorgaben auswählen
    • Auf Scannen klicken
  • Einzugsscanner (für mehrseitige Dokumente)
    Der Einzugsscanner steht nicht mehr zur Verfügung. Man findet in dieser Anleitung aber ein paar nützliche Tipps, die man auch bei anderen Scannern anwenden kann.

Zusammenfassung als PDF-Portfolio

  • PDF: Alle Anleitungen zum TNZB-CIP-Pool als PDF-Portfolio
    (Acrobat Reader ab Version 9 erforderlich, voller Funktionsumfang mit Acrobat Reader X oder XI)
    Stand 22.2.2013
    Seither wurden die Webseiten aber noch etwas aktualisiert. Wenn die Bearbeitung der Webseiten abgeschlossen ist, wird hier das aktuelle PDF-Portfolio abgelegt.
  1. Ein PDF-Portfolio bietet den Vorteil, alle vorhandenen Dokumente nach beliebigen Stichworten zu durchsuchen.
  2. Man kann alle Dokumente auf einmal herunterladen und auch alle auf einmal ausdrucken.
  3. Hyperlinks bleiben in den PDF-Dateien weiterhin anklickbar.
  4. Leider hat ein PDF-Portfolio auch den Nachteil, dass es nicht mehr mit der neuen PDF-Vorschau in Firefox lesbar ist. Man muss Externer Link:  Firefox wieder auf Acrobat Reader zurück konfigurieren oder die PDF-Datei abspeichern und mit Acrobat Reader oder Acrobat Pro öffnen.

Letzte Änderung: 3. November 2014, Historie

zum Seitenanfang

Startseite | Kontakt | Impressum

RRZE - Regionales RechenZentrum Erlangen, Martensstraße 1, D-91058 Erlangen | Tel.: +49 9131 8527031 | Fax: +49 9131 302941

Zielgruppennavigation

  1. Studierende
  2. Beschäftigte
  3. Einrichtungen
  4. IT-Beauftragte
  5. Presse & Öffentlichkeit