копировать PDF
Подскажите пожалуйста. Как копировать текст из PDF формата?
либо документ запаролен и его можно только читать. Что то оттуда скопировать или сам документ куда то вствить уже не получится. Либо, что скорее всего, это отсканнированный документ и он уже не столько пдф, сколько документ содержащий картинки. А с картинок ничего скопировать не получится. Есть разные программки, но все это платное и там возиться придется, потерять кучу времени пока во всем этом разберешься, устанавливать опознование текста... В общем ищите какой то другой путь в обход этого документа.
PDF это контейнер. В нем может быть и текст и картинки с текстом и даже всё вперемешку
Если текст не копируется, то это картинка.
С неё текст можно прочитать только с помощью OCR .
Для этого например годится бесплатный Power Toys от микрософта
Фашизм будет разбит
Человека карают только те боги, в которых он верит
Есть вариант. выше было правильно написано, что PDF это контейнер. А соответственно можно открыть 7-zip, или WinRar, или родным виндовз Zip. И внутри архива найдете картинки а так же текст.
Или я не прав?
Можете попробовать сами и убедиться.
Видимо, вы просто перепутали контейнер с архивом...
https://tools.pdf24.org/de/pdf-seiten-extrahierenвот ещё вариант
и снова мимо ... эта приблуда просто режет общий многостраничный пдф на несколько.
если уж так хочется проверить версии в онлайне, то рядом есть более подходящий линк https://tools.pdf24.org/de/ocr-pdf
Как копировать текст из PDF формата?
Если хотите копировать как картинку, то пожалуйста сниппинг тул
https://www.chip.de/downloads/Snipping-Tool-Plus_47471201....
С 95% вероятностью исходный пдф у вас = скан документа, представленный в виде графики, т.е. нужно распознавание из графики в текст. Это называется OCR = Optical Character Recognition. 5% оставляю на вариант с защитой от копирования... Тогда просто выложить пдф сюда, народ разберется.
Посоветуйте Ваш способ.
1. Прочесть, что вам уже посоветовали в самом начале темы. Если ничего не понятно, выложить пдф сюда...
2. Сделать хоть что-то самому/ой: например, забросить свой пдф в окошко по ссылке из моего пред. поста и сделать в онлайне процедуру OCR, но придется ждать в очереди... Или, как вариант, можно скачать себе на комп https://tools.pdf24.org/de/creator , установить, найти в тулбоксе "PDF OCR", выбрать файл и язык и запустить на распознавание текста. На выходе, как я понимаю, будет pdf с добавленным текстовым слоем. Проверяется двойным кликом по слову, если выделяется только оно, копируйте текст, как в любом текстовом редакторе
Может быть проще будет преобразовать JPG в текст онлайн здесь
Принципиальной разницы с https://tools.pdf24.org/ru/ocr-pdf не вижу, разве что ей придется каждую страницу из pdf предварительно перегонять в отдельный файл -- png, jpg или еще какой-то (причем в приличном разрешении, не с буквами высотой в 2-3 пиксела), что для больших документов страниц эдак на 100-200 может слегка утомить. А потом еще и собирать текст с отдельных страниц в один общий текстовый документ. Для тех, кто как она, не удосужились прочесть и понять уже предложенные ей варианты, это может стать непосильной задачей