Login
HTML Table to CSV Converter
NEW 14.09.08 09:24
in Antwort digital.pilot 14.09.08 09:01
NEW 14.09.08 10:48
in Antwort kajf 13.09.08 10:30
В csv нельзя же сохранять подтаблицы , или я ошибаюсь ?
Может тебе нужны просто 4 колонки Modell-Nr,Größe,Modellierdatum,Status ?
Может тебе нужны просто 4 колонки Modell-Nr,Größe,Modellierdatum,Status ?
NEW 14.09.08 12:35
in Antwort Chipolino 14.09.08 10:48
NEW 14.09.08 20:55
гм. короче. подвешиваю файлец. переименовать расширение в .vbs. Открыть в текстовом редакторе и прописать наверху путь и имя файла. Путь у меня счас там пустой, имя файла - pelod.htm.
теперь касательно твоего ужоснаха. Мой скрипт работал на нем около часа :D (в конце работы выводится сообщение). О том, что он че-то делает, 1-ые минут 40 можно видеть по загруженному процу и жрущему ресурсы процессу wshost. Оставшиеся минут 10 он создает csv-файлы.
их много!
он мне их 2781 штуку создал!
причем половина из них тебе не нужны. Потому что картинки с надписями сделаны тоже в виде таблиц, и скрипт их, ессно, тоже выводит. На каждый товар, по ходу, создается 2 файла: таблица с картинкой и таблица с нужными тебе параметрами. Похерить ненужные .csv, насколько я видел, можно по такому критерию: они содержат в себе слово popimage.
все, вроде.
in Antwort kajf 13.09.08 22:56
гм. короче. подвешиваю файлец. переименовать расширение в .vbs. Открыть в текстовом редакторе и прописать наверху путь и имя файла. Путь у меня счас там пустой, имя файла - pelod.htm.
теперь касательно твоего ужоснаха. Мой скрипт работал на нем около часа :D (в конце работы выводится сообщение). О том, что он че-то делает, 1-ые минут 40 можно видеть по загруженному процу и жрущему ресурсы процессу wshost. Оставшиеся минут 10 он создает csv-файлы.
их много!
он мне их 2781 штуку создал!
причем половина из них тебе не нужны. Потому что картинки с надписями сделаны тоже в виде таблиц, и скрипт их, ессно, тоже выводит. На каждый товар, по ходу, создается 2 файла: таблица с картинкой и таблица с нужными тебе параметрами. Похерить ненужные .csv, насколько я видел, можно по такому критерию: они содержат в себе слово popimage.
все, вроде.
NEW 14.09.08 21:52
in Antwort digital.pilot 14.09.08 20:55
процесс пошел. загруженость 100% (наверное я все сделал правильно :)
закончит, буду дальше разбираться.
спасибо огромное.
закончит, буду дальше разбираться.
спасибо огромное.
vaya con dios
NEW 15.09.08 07:57
in Antwort digital.pilot 14.09.08 20:55, Zuletzt geändert 16.09.08 12:34 (kajf)
вчера дома на висте не дождался результата (лапоть работал всю ночь).
сейчас запустил на работе под ХР, жду.
правильно ли я изменил/дополнил те строки?
сейчас запустил на работе под ХР, жду.
правильно ли я изменил/дополнил те строки?
В ответ на:
Const g_Path = "C:\Dokumente und Einstellungen\IIIII\Desktop\DateiOrdner"
Const g_File = "datei.asp.htm"
Const g_Path = "C:\Dokumente und Einstellungen\IIIII\Desktop\DateiOrdner"
Const g_File = "datei.asp.htm"
vaya con dios
NEW 15.09.08 20:06
in Antwort digital.pilot 14.09.08 20:55
NEW 15.09.08 21:53
in Antwort digital.pilot 13.09.08 22:16, Zuletzt geändert 15.09.08 21:58 (anatoli888)
я сильно не старался:
строчка которую надо задать в shell:
содержание stranitza1.html:
пс: тут должно было быть больше пробелов, но они съелись при отправке сообщения.
результат:
строчка которую надо задать в shell:
В ответ на:
sed '/<tr>/,/<\/tr>/ s|^ *<[Tt][RrDd]>||g' stranitza1.html | sed 's|<\/[Tt][RrDd]>|$|g' | tr '\n' ' ' | sed 's|$ *$|\n|g' | sed 's|$ |,|g' | sed 's|<.*>||'
sed '/<tr>/,/<\/tr>/ s|^ *<[Tt][RrDd]>||g' stranitza1.html | sed 's|<\/[Tt][RrDd]>|$|g' | tr '\n' ' ' | sed 's|$ *$|\n|g' | sed 's|$ |,|g' | sed 's|<.*>||'
содержание stranitza1.html:
В ответ на:
<table>
<tbody>
<tr>
<td>11 </td>
<td>1 2</td>
<td>1 3 </td>
</tr>
<tr>
<td> 2 1 </td>
<td> 2 2 </td>
<td>.2.3.</td>
</tr>
<tr>
<td>..3..1..</td>
<td>32
</td>
<td>33
</td>
</tr>
<tr>
<td>41</td>
<td>42</td>
<td>43</td>
</tr>
<tr>
<td>51</td>
<td>52</td>
<td>53</td>
</tr>
</tbody>
</table>
<table>
<tbody>
<tr>
<td>11 </td>
<td>1 2</td>
<td>1 3 </td>
</tr>
<tr>
<td> 2 1 </td>
<td> 2 2 </td>
<td>.2.3.</td>
</tr>
<tr>
<td>..3..1..</td>
<td>32
</td>
<td>33
</td>
</tr>
<tr>
<td>41</td>
<td>42</td>
<td>43</td>
</tr>
<tr>
<td>51</td>
<td>52</td>
<td>53</td>
</tr>
</tbody>
</table>
пс: тут должно было быть больше пробелов, но они съелись при отправке сообщения.
результат:
В ответ на:
lanixx lanixx-server : ~/Desktop $ sed '/<tr>/,/<\/tr>/ s|^ *<[Tt][RrDd]>||g' stranitza1.html | sed 's|<\/[Tt][RrDd]>|$|g' | tr '\n' ' ' | sed 's|\$ *\$|\n|g' | sed 's|$ |,|g' | sed 's|<.*>||'
11 ,1 2,1 3
2 1 , 2 2 ,.2.3.
..3..1..,32 ,33
41,42,43
51,52,53
Пнд Сен 15 21:48:47 CEST 2008 : /dev/pts/4 : Debian :
lanixx lanixx-server : ~/Desktop $
lanixx lanixx-server : ~/Desktop $ sed '/<tr>/,/<\/tr>/ s|^ *<[Tt][RrDd]>||g' stranitza1.html | sed 's|<\/[Tt][RrDd]>|$|g' | tr '\n' ' ' | sed 's|\$ *\$|\n|g' | sed 's|$ |,|g' | sed 's|<.*>||'
11 ,1 2,1 3
2 1 , 2 2 ,.2.3.
..3..1..,32 ,33
41,42,43
51,52,53
Пнд Сен 15 21:48:47 CEST 2008 : /dev/pts/4 : Debian :
lanixx lanixx-server : ~/Desktop $
15.09.08 21:56
in Antwort digital.pilot 15.09.08 10:34
конечно все это можно сделать в шеле, но лучше использовать Perl.
NEW 16.09.08 08:32
in Antwort anatoli888 15.09.08 21:53
Месье тонкий извращенец? Интересно, сколько оно будет считаться?
NEW 16.09.08 09:25
in Antwort Simple 16.09.08 08:32, Zuletzt geändert 16.09.08 10:18 (anatoli888)
я пробовал применить то что я накорябал на сцылу выше. строчку надо подправить.
время на то что я накорябал
пс: меня попросили показать как это примерно будет выглядеть в одной строчке в shell. я показал, но не говорил что это лучший вариант.
время на то что я накорябал
В ответ на:
...
real 0m3.674s
user 0m1.504s
sys 0m0.076s
...
...
real 0m3.674s
user 0m1.504s
sys 0m0.076s
...
пс: меня попросили показать как это примерно будет выглядеть в одной строчке в shell. я показал, но не говорил что это лучший вариант.
NEW 16.09.08 10:46
in Antwort anatoli888 16.09.08 09:25
на последнего.
к моему стыду я таки и не смог этого сделать, мой четырехпроцессорный сименс работал безрезультатно целый день. наверное я очень тупой. но упрямый, за полночи в ручную сделал половину таблицы на екселе.
к моему стыду я таки и не смог этого сделать, мой четырехпроцессорный сименс работал безрезультатно целый день. наверное я очень тупой. но упрямый, за полночи в ручную сделал половину таблицы на екселе.
vaya con dios
NEW 16.09.08 10:54
in Antwort kajf 16.09.08 10:46
Как говорят бильярдисты, wer locht, hat recht. Как - все равно :)
NEW 16.09.08 11:31
in Antwort Simple 16.09.08 10:54
а в перерывах песал рецепт в самуси группу. мож и тебе пригодиться
: http://groups.germany.ru/showmessage.pl?Number=11725188&Board=101260
vaya con dios
NEW 16.09.08 11:58
in Antwort Simple 16.09.08 11:50
NEW 16.09.08 12:01
in Antwort kajf 16.09.08 11:58
NEW 16.09.08 12:17
in Antwort Simple 16.09.08 12:01
да любую часть, только не очень пресное.
я бы нарек ферганских курдючных баранов святыми животными, если бы они не были так вкусны.
у турков местная баранина, им не разрешают завозить из турции курдючных баранов. не, если просто жарить в казане... плов там или жаркое, оно конечно сойдет. сам беру, куда деваться.
я бы нарек ферганских курдючных баранов святыми животными, если бы они не были так вкусны.
у турков местная баранина, им не разрешают завозить из турции курдючных баранов. не, если просто жарить в казане... плов там или жаркое, оно конечно сойдет. сам беру, куда деваться.
vaya con dios

