Deutsch

копировать PDF

858  
TinaInna завсегдатай20.01.24 22:29
TinaInna
20.01.24 22:29 

Подскажите пожалуйста. Как копировать текст из PDF формата?

#1 
QwerT2007 коренной житель21.01.24 00:06
NEW 21.01.24 00:06 
в ответ TinaInna 20.01.24 22:29

выделяешь и копируешь...

#2 
TinaInna завсегдатай21.01.24 00:39
TinaInna
NEW 21.01.24 00:39 
в ответ QwerT2007 21.01.24 00:06

Там нет такой функции, закрыто.

#3 
Geshka знакомое лицо21.01.24 08:45
NEW 21.01.24 08:45 
в ответ TinaInna 21.01.24 00:39, Последний раз изменено 21.01.24 08:46 (Geshka)

либо документ запаролен и его можно только читать. Что то оттуда скопировать или сам документ куда то вствить уже не получится. Либо, что скорее всего, это отсканнированный документ и он уже не столько пдф, сколько документ содержащий картинки. А с картинок ничего скопировать не получится. Есть разные программки, но все это платное и там возиться придется, потерять кучу времени пока во всем этом разберешься, устанавливать опознование текста... В общем ищите какой то другой путь в обход этого документа.

#4 
gendy Dinosaur21.01.24 09:17
gendy
NEW 21.01.24 09:17 
в ответ TinaInna 21.01.24 00:39

PDF это контейнер. В нем может быть и текст и картинки с текстом и даже всё вперемешку

Если текст не копируется, то это картинка.

С неё текст можно прочитать только с помощью OCR .

Для этого например годится бесплатный Power Toys от микрософта

Фашизм будет разбит


Человека карают только те боги, в которых он верит

#5 
Valentin_30 постоялец22.01.24 09:49
Valentin_30
NEW 22.01.24 09:49 
в ответ TinaInna 20.01.24 22:29, Последний раз изменено 22.01.24 09:49 (Valentin_30)

Есть вариант. выше было правильно написано, что PDF это контейнер. А соответственно можно открыть 7-zip, или WinRar, или родным виндовз Zip. И внутри архива найдете картинки а так же текст.

#6 
НуПогоди коренной житель22.01.24 10:21
NEW 22.01.24 10:21 
в ответ Valentin_30 22.01.24 09:49
Есть вариант. выше было правильно написано, что PDF это контейнер. А соответственно можно открыть 7-zip, или WinRar, или родным виндовз Zip. И внутри архива найдете картинки а так же текст.

улыб

В игноре: ...Amigo ABG Nik_21 aaa-elita Astor24 tanuna_0 Ona_BERLIN kenguruscha daduda faraon2 dukus Ramses2 Пoльзoватель NextLive Hudertpro gve...
#7 
Valentin_30 постоялец22.01.24 10:23
Valentin_30
NEW 22.01.24 10:23 
в ответ НуПогоди 22.01.24 10:21

Или я не прав?

#8 
НуПогоди коренной житель22.01.24 10:44
NEW 22.01.24 10:44 
в ответ Valentin_30 22.01.24 10:23
Или я не прав?

Можете попробовать сами и убедиться.

Видимо, вы просто перепутали контейнер с архивом...

В игноре: ...Amigo ABG Nik_21 aaa-elita Astor24 tanuna_0 Ona_BERLIN kenguruscha daduda faraon2 dukus Ramses2 Пoльзoватель NextLive Hudertpro gve...
#9 
Valentin_30 постоялец22.01.24 11:15
Valentin_30
NEW 22.01.24 11:15 
в ответ НуПогоди 22.01.24 10:44
НуПогоди коренной житель22.01.24 11:22
NEW 22.01.24 11:22 
в ответ Valentin_30 22.01.24 11:15
https://tools.pdf24.org/de/pdf-seiten-extrahierenвот ещё вариант

и снова мимо улыб... эта приблуда просто режет общий многостраничный пдф на несколько.

если уж так хочется проверить версии в онлайне, то рядом есть более подходящий линк https://tools.pdf24.org/de/ocr-pdf

В игноре: ...Amigo ABG Nik_21 aaa-elita Astor24 tanuna_0 Ona_BERLIN kenguruscha daduda faraon2 dukus Ramses2 Пoльзoватель NextLive Hudertpro gve...
#11 
TinaInna завсегдатай22.01.24 13:04
TinaInna
NEW 22.01.24 13:04 
в ответ НуПогоди 22.01.24 11:22

Посоветуйте Ваш способ.

#12 
Muenderin знакомое лицо22.01.24 13:26
NEW 22.01.24 13:26 
в ответ TinaInna 20.01.24 22:29
Как копировать текст из PDF формата?

Если хотите копировать как картинку, то пожалуйста сниппинг тул

https://www.chip.de/downloads/Snipping-Tool-Plus_47471201....

#13 
НуПогоди коренной житель22.01.24 13:54
NEW 22.01.24 13:54 
в ответ TinaInna 22.01.24 13:04

С 95% вероятностью исходный пдф у вас = скан документа, представленный в виде графики, т.е. нужно распознавание из графики в текст. Это называется OCR = Optical Character Recognition. 5% оставляю на вариант с защитой от копирования... Тогда просто выложить пдф сюда, народ разберется.

Посоветуйте Ваш способ.

1. Прочесть, что вам уже посоветовали в самом начале темы. Если ничего не понятно, выложить пдф сюда...

2. Сделать хоть что-то самому/ой: например, забросить свой пдф в окошко по ссылке из моего пред. поста и сделать в онлайне процедуру OCR, но придется ждать в очереди... Или, как вариант, можно скачать себе на комп https://tools.pdf24.org/de/creator , установить, найти в тулбоксе "PDF OCR", выбрать файл и язык и запустить на распознавание текста. На выходе, как я понимаю, будет pdf с добавленным текстовым слоем. Проверяется двойным кликом по слову, если выделяется только оно, копируйте текст, как в любом текстовом редакторе

В игноре: ...Amigo ABG Nik_21 aaa-elita Astor24 tanuna_0 Ona_BERLIN kenguruscha daduda faraon2 dukus Ramses2 Пoльзoватель NextLive Hudertpro gve...
#14 
rewas постоялец22.01.24 17:24
NEW 22.01.24 17:24 
в ответ НуПогоди 22.01.24 13:54

Может быть проще будет преобразовать JPG в текст онлайн здесь

#15 
НуПогоди коренной житель22.01.24 18:02
NEW 22.01.24 18:02 
в ответ rewas 22.01.24 17:24
Может быть проще будет преобразовать JPG в текст онлайн здесь

Принципиальной разницы с https://tools.pdf24.org/ru/ocr-pdf не вижу, разве что ей придется каждую страницу из pdf предварительно перегонять в отдельный файл -- png, jpg или еще какой-то (причем в приличном разрешении, не с буквами высотой в 2-3 пиксела), что для больших документов страниц эдак на 100-200 может слегка утомить. А потом еще и собирать текст с отдельных страниц в один общий текстовый документ. Для тех, кто как она, не удосужились прочесть и понять уже предложенные ей варианты, это может стать непосильной задачей

В игноре: ...Amigo ABG Nik_21 aaa-elita Astor24 tanuna_0 Ona_BERLIN kenguruscha daduda faraon2 dukus Ramses2 Пoльзoватель NextLive Hudertpro gve...
#16 
TinaInna завсегдатай23.01.24 23:23
TinaInna
NEW 23.01.24 23:23 
в ответ TinaInna 20.01.24 22:29

Поколдовали и все получилось при помощи программы Adobe Acrobat 7.

#17