Deutsch
Germany.ruФорумы → Архив Досок→ Компьютер & Co

А можно ли делать поиск внутри пдф?

211  1 2 все
adik_torsion старожил10.05.06 22:27
adik_torsion
NEW 10.05.06 22:27 
Последний раз изменено 10.05.06 22:28 (adik_torsion)
есть БОЛЬШАЯ куча пдф...
задача: найти внутри нужное сочетание слов. как это сделать?
http://www.afed.ucoz.ru
#1 
Konfuzius свой человек10.05.06 22:59
Konfuzius
NEW 10.05.06 22:59 
в ответ adik_torsion 10.05.06 22:27
Через функцию "Suchen", там ещ╦ бинокль изображ╦н.
GLÜCK IST DAS EINZIGE, WAS SICH VERDOPPELT, WENN MAN ES TEILT.
#2 
Стёпа местный житель10.05.06 23:03
NEW 10.05.06 23:03 
в ответ adik_torsion 10.05.06 22:27
пдф это по сути графический файл, так что слов там не найд╦шь. Есть программы преобразующие пдф в тексовые файлы. После преобразования можно поискать. Название программ не помню.
Легче нести ахинею, чем бревно.
#3 
Стёпа местный житель10.05.06 23:05
NEW 10.05.06 23:05 
в ответ Konfuzius 10.05.06 22:59
В ответ на:
Через функцию "Suchen", там ещ╦ бинокль изображ╦н.

Интересно. Я не знал. Спасибо за подсказку.
Легче нести ахинею, чем бревно.
#4 
adik_torsion старожил10.05.06 23:09
adik_torsion
NEW 10.05.06 23:09 
в ответ Konfuzius 10.05.06 22:59
не работает так!!!
http://www.afed.ucoz.ru
#5 
карелка коренной житель10.05.06 23:41
карелка
NEW 10.05.06 23:41 
в ответ adik_torsion 10.05.06 23:09
Как сказали выше, пдфки могут быть текстовыми, в которых текст можно не только искать, но и изменять, крепить к ним гиперссылки и еще много чего, а может быть графическим, то есть текст сохранили картинкой и все. Тогда уже ничего не сделаешь.
Если не хочется перечитывать кучу ваших файлов в поисках слов, можно прогнать их через программы распознавания текста типа Fine Reader, бесплатная демо-версия есть на их сайте ABBYYY. Потом эти тексты очень хорошо сохраняются в Ворде. Правда, при распознавании все-таки много ошибок, при сохранении в Ворд, программа справшивает, проверять или нет. Если вам тексты нужны потом, чтоб работать с ними, то надо проверять. Дело очень муторное, особенно с непривычки.

Нет братоубийственной войне!

#6 
adik_torsion старожил10.05.06 23:43
adik_torsion
NEW 10.05.06 23:43 
в ответ карелка 10.05.06 23:41
тогда конечно не реально... их там несколько тысяч...
http://www.afed.ucoz.ru
#7 
Alex__R гость10.05.06 23:48
Alex__R
10.05.06 23:48 
в ответ adik_torsion 10.05.06 23:43
Не совсем так...
Есть очень хорошие преобразователи PDF to WORD. С сохранением форматирования и т.п.
Пишу только то, что знаю точно
#8 
карелка коренной житель11.05.06 00:22
карелка
NEW 11.05.06 00:22 
в ответ Alex__R 10.05.06 23:48
Например, какие? Мне тоже очень хотелось бы узнать на всякий случай.

Нет братоубийственной войне!

#9 
NeverMind коренной житель11.05.06 00:24
NeverMind
NEW 11.05.06 00:24 
в ответ Стёпа 10.05.06 23:03
In Antwort auf:
пдф это по сути графический файл, так что слов там не найдёшь.

С каких это пор pdf стал графическим файлом?
#10 
Alex__R гость11.05.06 00:32
Alex__R
NEW 11.05.06 00:32 
в ответ карелка 11.05.06 00:22
SolidDocuments: SolidConverterPDF
Пишу только то, что знаю точно
#11 
Simple Nothing is f*cked11.05.06 12:34
Simple
NEW 11.05.06 12:34 
в ответ adik_torsion 10.05.06 22:27
по-моему, гугл десктоп индексирует в том числе и пдфки.
#12 
3AHYDA свой человек11.05.06 12:41
3AHYDA
NEW 11.05.06 12:41 
в ответ Simple 11.05.06 12:34
индексирует и очень даже неплохо. но ты попробуй в курилке посоветовать гуглевский десткоп.
#13 
Simple Nothing is f*cked11.05.06 12:49
Simple
NEW 11.05.06 12:49 
в ответ 3AHYDA 11.05.06 12:41
Это ж я против был ;) Больше мне ничего в голову не приходит просто...
#14 
3AHYDA свой человек11.05.06 12:51
3AHYDA
NEW 11.05.06 12:51 
в ответ Simple 11.05.06 12:49
а потому что ничего и нету. действительно серьёзный поиск внутри документов(пдф включительно), мнгновенный, не существовал до них. альтернативы пока им нет.
#15 
Simple Nothing is f*cked11.05.06 12:52
Simple
NEW 11.05.06 12:52 
в ответ 3AHYDA 11.05.06 12:51
Не может быть, чтобы ничего не было. В c't периодически описывают всякие тулы для индексирования документов.
#16 
Russman старожил11.05.06 13:01
Russman
NEW 11.05.06 13:01 
в ответ 3AHYDA 11.05.06 12:51
Бугага. grep -r -i "Dude" /home/dude/pdfs/
---
Как хоpоши, как свежи были pожи...
#17 
Simple Nothing is f*cked11.05.06 13:07
Simple
NEW 11.05.06 13:07 
в ответ Russman 11.05.06 13:01
Примитивист :-D
#18 
staganovich прохожий16.05.06 17:22
NEW 16.05.06 17:22 
в ответ Simple 11.05.06 13:07
Если нужно просмотретъ болъшое количество фаилов, то для етого можно исполъзоват програмы типа Архивариус 3000 или Коперник. Гоогл плохо справляется с етой задачей.
#19 
barmaglot знакомое лицо16.05.06 17:46
barmaglot
NEW 16.05.06 17:46 
в ответ NeverMind 11.05.06 00:24
В ответ на:
пдф это по сути графический файл, так что слов там не найдёшь.
С каких это пор pdf стал графическим файлом?

Ну, бывают же битовые постскрипты/фрагменты постскриптов, вот наверняка найдутся криворукие деятели, которые и в пдф-ы битовые куски тулить будут...
#20 
1 2 все