Вход на сайт
Программка для поиска повторяющихся слов.
07.09.12 19:52
Привет всем!
Как в заголовке уже видно, я ищу программку, которая могла бы из текста выловить все повторяющиеся слова
и хотя бы их просто маркировать или удалить.
Перерыл уже весь интернет, но вроде ничего путного не нашёл.
Мне нужно часто составлять списки, перечни или просто ключевые слова,
а в ворде или ОО этой возможности похоже нет.
Как в заголовке уже видно, я ищу программку, которая могла бы из текста выловить все повторяющиеся слова
и хотя бы их просто маркировать или удалить.
Перерыл уже весь интернет, но вроде ничего путного не нашёл.
Мне нужно часто составлять списки, перечни или просто ключевые слова,
а в ворде или ОО этой возможности похоже нет.
NEW 07.09.12 23:33
Это не полноценные тексты, а или отдельные слова или фразы.
Разделённые между собой запятой.
К примеру "natur, morgen, früh, grün, sommer, ähre, getreide, herbst,"
Это только часть списка.
А полностью список намного больше будет
в ответ project33 07.09.12 23:08
В ответ на:
в том числе и предлоги?
в том числе и предлоги?
Это не полноценные тексты, а или отдельные слова или фразы.
Разделённые между собой запятой.
К примеру "natur, morgen, früh, grün, sommer, ähre, getreide, herbst,"
Это только часть списка.
А полностью список намного больше будет

NEW 07.09.12 23:43
Гы
Об этом я тоже уже думал, но есть уже и готовые решения.
А я если начну программировать, то не успокоюсь пока не разработаю что-нибудь уникальное и созревшее для патентирования
А если серьёзно, то сейчас времени нет мелочи программировать, других забот хватает.
Я вроде тоже не по китайски написал, что нужно из простого списка (формат не важен)
убрать повторяющиеся слова или фразы и внести его (список) потом в форму для загрузки на сервер.
Посмотрю потом когда освобожусь немного, может в PHP что-нибудь состряпаю.
в ответ Murr 07.09.12 23:22
В ответ на:
самый простой ответ (программиста) будет
самый простой ответ (программиста) будет
Гы

Об этом я тоже уже думал, но есть уже и готовые решения.
А я если начну программировать, то не успокоюсь пока не разработаю что-нибудь уникальное и созревшее для патентирования

А если серьёзно, то сейчас времени нет мелочи программировать, других забот хватает.
В ответ на:
с какими исходными данными ты работаеш?
с какими исходными данными ты работаеш?
Я вроде тоже не по китайски написал, что нужно из простого списка (формат не важен)
убрать повторяющиеся слова или фразы и внести его (список) потом в форму для загрузки на сервер.
Посмотрю потом когда освобожусь немного, может в PHP что-нибудь состряпаю.
NEW 08.09.12 00:08
в ответ Vovan(ator) 07.09.12 23:44
а, ну если это только список с разделителем, то тут я согласен с муром - легче самому написать парсер, чем искать готовое решение. пока тема обсуждается можно было уже с десяток таких парсеров наваять
Продвижение сайтов, реклама: https://www.pro33.net
NEW 08.09.12 00:28
в ответ Vovan(ator) 07.09.12 23:43
(формат не важен)
------
Т.е. имеем список каких-то ПДФов, в которые упакованы сканированные с малым разрешением картинки и поверх еще замучено что-то типа шифрации...
Ну русским же языком спрашиваю - каковы форматы исходных данных? для простого текста - 10 минут работы. Для Ворда - полчаса... Для Екселя - не знаю, давно не работал с ним..
------
Т.е. имеем список каких-то ПДФов, в которые упакованы сканированные с малым разрешением картинки и поверх еще замучено что-то типа шифрации...

Ну русским же языком спрашиваю - каковы форматы исходных данных? для простого текста - 10 минут работы. Для Ворда - полчаса... Для Екселя - не знаю, давно не работал с ним..
NEW 08.09.12 11:42
в ответ Vovan(ator) 07.09.12 23:44
http://dienst.project33.eu/tools/vovanparser.php лови парсер
Продвижение сайтов, реклама: https://www.pro33.net