русский
Germany.ruForen → Архив Досок→ Computer & Co

А можно ли делать поиск внутри пдф?

211  1 2 alle
adik_torsion старожил10.05.06 22:27
adik_torsion
NEW 10.05.06 22:27 
Zuletzt geändert 10.05.06 22:28 (adik_torsion)
есть БОЛЬШАЯ куча пдф...
задача: найти внутри нужное сочетание слов. как это сделать?
http://www.afed.ucoz.ru
#1 
Konfuzius свой человек10.05.06 22:59
Konfuzius
NEW 10.05.06 22:59 
in Antwort adik_torsion 10.05.06 22:27
Через функцию "Suchen", там ещ╦ бинокль изображ╦н.
[пурп]GLÜCK IST DAS EINZIGE, WAS SICH VERDOPPELT, WENN MAN ES TEILT.[/пурп]
#2 
Стёпа местный житель10.05.06 23:03
NEW 10.05.06 23:03 
in Antwort adik_torsion 10.05.06 22:27
пдф это по сути графический файл, так что слов там не найд╦шь. Есть программы преобразующие пдф в тексовые файлы. После преобразования можно поискать. Название программ не помню.
Легче нести ахинею, чем бревно.
#3 
Стёпа местный житель10.05.06 23:05
NEW 10.05.06 23:05 
in Antwort Konfuzius 10.05.06 22:59
В ответ на:
Через функцию "Suchen", там ещ╦ бинокль изображ╦н.

Интересно. Я не знал. Спасибо за подсказку.
Легче нести ахинею, чем бревно.
#4 
adik_torsion старожил10.05.06 23:09
adik_torsion
NEW 10.05.06 23:09 
in Antwort Konfuzius 10.05.06 22:59
не работает так!!!
http://www.afed.ucoz.ru
#5 
карелка коренной житель10.05.06 23:41
карелка
NEW 10.05.06 23:41 
in Antwort adik_torsion 10.05.06 23:09
Как сказали выше, пдфки могут быть текстовыми, в которых текст можно не только искать, но и изменять, крепить к ним гиперссылки и еще много чего, а может быть графическим, то есть текст сохранили картинкой и все. Тогда уже ничего не сделаешь.
Если не хочется перечитывать кучу ваших файлов в поисках слов, можно прогнать их через программы распознавания текста типа Fine Reader, бесплатная демо-версия есть на их сайте ABBYYY. Потом эти тексты очень хорошо сохраняются в Ворде. Правда, при распознавании все-таки много ошибок, при сохранении в Ворд, программа справшивает, проверять или нет. Если вам тексты нужны потом, чтоб работать с ними, то надо проверять. Дело очень муторное, особенно с непривычки.

Нет братоубийственной войне!

#6 
adik_torsion старожил10.05.06 23:43
adik_torsion
NEW 10.05.06 23:43 
in Antwort карелка 10.05.06 23:41
тогда конечно не реально... их там несколько тысяч...
http://www.afed.ucoz.ru
#7 
Alex__R гость10.05.06 23:48
Alex__R
10.05.06 23:48 
in Antwort adik_torsion 10.05.06 23:43
Не совсем так...
Есть очень хорошие преобразователи PDF to WORD. С сохранением форматирования и т.п.
Пишу только то, что знаю точно
#8 
карелка коренной житель11.05.06 00:22
карелка
NEW 11.05.06 00:22 
in Antwort Alex__R 10.05.06 23:48
Например, какие? Мне тоже очень хотелось бы узнать на всякий случай.

Нет братоубийственной войне!

#9 
NeverMind коренной житель11.05.06 00:24
NeverMind
NEW 11.05.06 00:24 
in Antwort Стёпа 10.05.06 23:03
In Antwort auf:
пдф это по сути графический файл, так что слов там не найдёшь.

С каких это пор pdf стал графическим файлом?
#10 
Alex__R гость11.05.06 00:32
Alex__R
NEW 11.05.06 00:32 
in Antwort карелка 11.05.06 00:22
SolidDocuments: SolidConverterPDF
Пишу только то, что знаю точно
#11 
Simple Nothing is f*cked11.05.06 12:34
Simple
NEW 11.05.06 12:34 
in Antwort adik_torsion 10.05.06 22:27
по-моему, гугл десктоп индексирует в том числе и пдфки.
#12 
3AHYDA свой человек11.05.06 12:41
3AHYDA
NEW 11.05.06 12:41 
in Antwort Simple 11.05.06 12:34
индексирует и очень даже неплохо. но ты попробуй в курилке посоветовать гуглевский десткоп.
#13 
Simple Nothing is f*cked11.05.06 12:49
Simple
NEW 11.05.06 12:49 
in Antwort 3AHYDA 11.05.06 12:41
Это ж я против был ;) Больше мне ничего в голову не приходит просто...
#14 
3AHYDA свой человек11.05.06 12:51
3AHYDA
NEW 11.05.06 12:51 
in Antwort Simple 11.05.06 12:49
а потому что ничего и нету. действительно серьёзный поиск внутри документов(пдф включительно), мнгновенный, не существовал до них. альтернативы пока им нет.
#15 
Simple Nothing is f*cked11.05.06 12:52
Simple
NEW 11.05.06 12:52 
in Antwort 3AHYDA 11.05.06 12:51
Не может быть, чтобы ничего не было. В c't периодически описывают всякие тулы для индексирования документов.
#16 
Russman старожил11.05.06 13:01
Russman
NEW 11.05.06 13:01 
in Antwort 3AHYDA 11.05.06 12:51
Бугага. grep -r -i "Dude" /home/dude/pdfs/
---
Как хоpоши, как свежи были pожи...
#17 
Simple Nothing is f*cked11.05.06 13:07
Simple
NEW 11.05.06 13:07 
in Antwort Russman 11.05.06 13:01
Примитивист :-D
#18 
staganovich прохожий16.05.06 17:22
NEW 16.05.06 17:22 
in Antwort Simple 11.05.06 13:07
Если нужно просмотретъ болъшое количество фаилов, то для етого можно исполъзоват програмы типа Архивариус 3000 или Коперник. Гоогл плохо справляется с етой задачей.
#19 
barmaglot знакомое лицо16.05.06 17:46
barmaglot
NEW 16.05.06 17:46 
in Antwort NeverMind 11.05.06 00:24
В ответ на:
пдф это по сути графический файл, так что слов там не найдёшь.
С каких это пор pdf стал графическим файлом?

Ну, бывают же битовые постскрипты/фрагменты постскриптов, вот наверняка найдутся криворукие деятели, которые и в пдф-ы битовые куски тулить будут...
#20 
1 2 alle