Berufseinsteiger - Maschinelles Lernen/KI
> SVM хорош, да, но зараза не параллелится на несколько машин, так что когда данных много, то его особо не применишь :-(
не знание законов (параллелизма) не освобождает от ответственности (по качественному распараллеливанию) (С)
SVM пишется через матричные операции, а именно BLAS2, при аккуратных формулировках все становится блочным и требует BLAS3. Теперь вспомним, что линпаковский солвер для измерения пиковой производительности суперкомпьютеров (top500.org) основан как раз на BLAS3, то замечаем, что раз линпак на миллионах ядрах очень хорошо параллелится, то и SVM должен тоже хорошо параллелится. Сам больше 4 ГПУшных ядер для SVM каюсь, еще ни разу не задействовал (что составляет около 12000 параллельных тредов), но производительность была просто абалденная, в отличие от АНН и других хНН, которые страдают load-balansingом
и даже на 1К+ ядрах показывают в десятки раз меньшую от пиковой производительность.