Seite 1 von 2

Text aus PDF?

Verfasst: Mo 03.11.08 19:43
von Ridcully
Hallo!

Ich trete mit einer Frage an euch technisch versierte Sammelgenossen!
Ich habe als PDF-Dokument einen Artikel, der allerdings nur aus der Kopie desselben besteht. Ergo ist alles recht grau. Und, da ich meine Druckerpatrone entlasten möchte, frage ich, ob es möglich ist, den Text herauslesen und gesondert als normale Textdatei speichern zu lassen.

Geht das mit dem adobe Reader? Oder muss ich mir dafür erst kostspielige "Helferlein" holen?

Ridcully

Verfasst: Mo 03.11.08 19:47
von Locnar
nö, sende mir einfach mal zu.

Verfasst: Mo 03.11.08 20:00
von Ridcully
Hallo!

Danke für dein Angebot!

Leider lehnt mein E-Mail Account es ab, die 10,3 MB große Datei zu verschicken. Hm.

Verfasst: Mo 03.11.08 20:44
von wpmergel
Doch, das geht.
Du brauchst ein OCR-Texterkennungsprogramm oder eine Scanner bei dem soetwas dabei ist - soweit ich weiß haben alle hp-Scanner ein solches dabei.

Dein freemail-account lehnt alles oberhalb 10 mb ab. Deshalb pack die Datei mal in ein ZIP-File, es könnte sein, daß das schon dafür ausreicht.

Verfasst: Di 04.11.08 15:09
von Ridcully
Hallo wpmergel!
Danke für deine Antwort, aber, da ich den Artikel nicht selbst gescannt habe, sondern er uns in PDF ausgehändigt wurde, wird mir das leider nichts nützen.

Ich habe die E-Mail an Locnar über meinen Uni-Account geschickt, dieser lässt 64MB als Anhang zu.

Ridcully

Verfasst: Di 04.11.08 16:12
von FloNumi
Du kannst auch wenn die PDF datei geöffnet ist sagen alles markieren und dann es dir in ein Word programm kopieren und es normal Drucken ...so mache ich es meistens

lg FloNumi

Verfasst: Di 04.11.08 16:18
von Ridcully
Ja, das mache ich auch meist. Nur:

Die Buchseiten wurden eingescannt, das heißt, es sind Bilder in einem PDF-Dokument, die ziemlich grau unterlegt sind. Da geht kein Markieren (verständlicherweise).

Ridcully

Verfasst: Di 04.11.08 20:33
von wpmergel
Na, dann leg es doch nochmal auf Deinen scanner - aber erst ausdrucken ;-)

Das Ergebnis kannst Du dann mit einem Bildbearbeitungsprogramm entgrauen und wenig schärfen und vergrößern. Das führt zu besseren Ergebnissen der Texterkennungsoftware.

Verfasst: Di 04.11.08 22:02
von Ridcully
Genau da liegt ja das Problem!
Da die Seiten grau unterlegt sind, verbraucht es sehr viel Druckertinte... das wollte ich ja umgehen :D

Verfasst: Di 04.11.08 22:22
von diwidat
Der Hinweis von wpmergel deutet immer noch auf die Texterkennung, die kann den grauen Hintergrund ausblenden und liest nur die druckbaren Zeichen.
Die Bilder kann man separat einscannen und dann wieder in den Text einfügen.

Das spart dann für 50 Cent Tinte, kostet aber eine Stunde Arbeitszeit à 15 Euro.

Verfasst: Mi 05.11.08 00:27
von wpmergel
Ridcully,

wenn Du keinen Grabber hast: PDF möglichst groß öffnen (am Besten 400%) dann [Shift]+[Druck]. Dann liegt der Bildschirminhalt in der Zwischenablage, von dort kannst Du die Datei mit jedem Grafikprogramm bearbeiten.

Das sollte Deine Bedenken bezüglich des Tintenverbrauchs zerstreuen.

Diese Dateien kannst Du auch direkt (also ohne Ausdruck) über die Texterkennung laufen lassen.

Verfasst: Do 06.11.08 11:46
von Ridcully
Nun gut!
Dann werde ich mich da mal ranmachen. Danke für alles!

Und nun eine weitere Frage... ich komme mir schon langsam etwas dümmlich vor...

Ich habe gesehen, dass einige Leute mehrere Seiten auf einer Seite aus einem PDF-Dokument ausgedruckt haben, zweireihig. Wenn es um Bilder geht, ist das wirklich praktisch. Nur irgendwie finde ich nicht heraus, wie sie das gemacht haben... wisst Ihr eventuell Rat?

Verfasst: Do 06.11.08 12:10
von payler
Wenn ich deine Anfrage richtig verstanden habe willst du nur bestimmte Seiten ausdrucken?

Datei/Drucken -> Seiten von bis eingeben - und fertig!

Verfasst: Do 06.11.08 12:14
von Ridcully
Nein, das nicht.

Mehrere Seiten auf EINE Seite bringen, verkleinerte Bilderdarstellungen.

Verfasst: Do 06.11.08 14:08
von areich
Das findest Du normalerweise bei den Druckeinstellungen (klicke auf Datei->Drucken, dann Eigenschaften), das ist unabhängig vom Dateiformat bzw. dem Programm aus dem Du druckst.

Andreas