Вход на сайт
На чем парсить большие объемы output из научных программ
335 просмотров
Перейти к просмотру всей ветки
Murr патриот
в ответ ilghiz 24.04.18 17:30
Вопрос именно что проще/удобнее, пожалуйста, посоветуйте!
-----
Как вариант:
https://www.codeproject.com/Articles/28294/a-Tiny-Parser-G...
Редактировать более-менее удобно.
Но тебе будет нужно описать имеющиеся документы какой-то грамматикой и как-то обрабатывать свертку правил.
По грамматике тебе уже MrSanders сказал - могут быть множественные неоднозначности, особенно на бинарниках.
ибо нужно быстро, удобно, и без выежонов.
-----
Тогда сначала оцени с какой стороны подходить к задаче:
- от полной спецификации документа к тому что в нем возможно содержится
- от того что ты ищешь к способу его извлечения.
В первом случае - ссылка выше,
Во втором - описано мною раннее.
Для 10-ти вариантов извлекаемых данных Я бы не стал возится с полным парсингом сотни типов документоv.