Вход на сайт
вопрос по статистике
12.12.07 17:42
У меня вопрос по статистике. Коротко опишу задачу. Есть данные от 2500 опрошенных.
1. их пол (м или ж)
2. возраст в трех категориях (меньше 30, 30-60 или больше 60)
3. их заболевания (например: инфаркт, бронхит, диабет)
мне нужно с этими данными провести статистическое вычисление. Например имеет ли связь пол в возрастом. Или имеется ли зигнификантная зависимость между 30ти летними мужчинами и заболеваниями. Вариаций конечно много.
Мне не совсем понятно, какие статистические тесты нужно применить и что точно я этим покажу/докажу??
Очень была бы благодарна за подсказку, так как никак не сдвинусь с места в этой задаче
1. их пол (м или ж)
2. возраст в трех категориях (меньше 30, 30-60 или больше 60)
3. их заболевания (например: инфаркт, бронхит, диабет)
мне нужно с этими данными провести статистическое вычисление. Например имеет ли связь пол в возрастом. Или имеется ли зигнификантная зависимость между 30ти летними мужчинами и заболеваниями. Вариаций конечно много.
Мне не совсем понятно, какие статистические тесты нужно применить и что точно я этим покажу/докажу??
Очень была бы благодарна за подсказку, так как никак не сдвинусь с места в этой задаче
NEW 12.12.07 17:55
обычно задание дается на какую-либо пройденную тему, вы наверняка недавно это проходили, я думаю, вы дискриптиве статистик делаете, я сейчас точно не помню, я такое год назад делала, а скрипта под рукой нет, но все формулы и коэффициенты, кот нужно посчитать должны были вам даваться
ну например какова квота среди мужчин, больных диабетом и которые старше 30 по отношению к здоровому населению ну и все в таком роде
в ответ zwerjok24 12.12.07 17:42
В ответ на:
Мне не совсем понятно, какие статистические тесты нужно применить
Мне не совсем понятно, какие статистические тесты нужно применить
обычно задание дается на какую-либо пройденную тему, вы наверняка недавно это проходили, я думаю, вы дискриптиве статистик делаете, я сейчас точно не помню, я такое год назад делала, а скрипта под рукой нет, но все формулы и коэффициенты, кот нужно посчитать должны были вам даваться
В ответ на:
что точно я этим покажу/докажу??
что точно я этим покажу/докажу??
ну например какова квота среди мужчин, больных диабетом и которые старше 30 по отношению к здоровому населению ну и все в таком роде
NEW 12.12.07 18:43
в ответ zwerjok24 12.12.07 18:35
http://www.sowi.uni-mannheim.de/lehrstuehle/lesas/index.php?lehrmat/main
вот ссыслка, поройся, если ты в немецком универе учишься....
это страница профессора моего уни..в скрипте всё должно стоять..мы это всё в первом семестре проходили,а я уже в 3ем, ни черта не помню
вот ссыслка, поройся, если ты в немецком универе учишься....

это страница профессора моего уни..в скрипте всё должно стоять..мы это всё в первом семестре проходили,а я уже в 3ем, ни черта не помню
NEW 12.12.07 18:47
в ответ sexappeal 12.12.07 18:44
я уже рылась. но я медик, у меня к сожалению нет времени досконально разобраться в статистике. А поверхностно нельзя, так как можно ошибиться логически в выборе теста. Я знаю, как и что подсчитать, но мне нужет совет именно в названии выбранного теста
NEW 12.12.07 18:54
я на третьем(фвл), вообще не представляю как бы я это на первом делала, там сам черт голову сломит, у нас там совершенно нет вот таких данных как выше приводилось, сплошные hypothesen, при этом все решаем исключительно с теоритической точки, т.е. конкретных примеров нет, только матрицы и буквы 

NEW 12.12.07 19:03
в ответ sexappeal 12.12.07 18:58
мне это не так срочно. я просто вижу, что сама не разберусь, ну или не так, чтобы быть увереной в правильности выбранного теста. Если бы ты могла посмотреть, я бы тебе сверх благодарна была!! Но конечно после экзаменов!! Не хватало еще, чтобы из-за меня твоя подготовка пострадала:)
NEW 12.12.07 19:12
в ответ zwerjok24 12.12.07 19:03
в каком городе живёшь? я бы тебя проконсультировала, если ты конечно хочешь, снма ещё раз повторю, вместе бы точно раобрались, а что ты мне должна показать, у тебя данные тоже в инете?
я уже вспоминаю_что у нас тоже такое задание было, но для точности нужно найти все старые листочки
я уже вспоминаю_что у нас тоже такое задание было, но для точности нужно найти все старые листочки
NEW 12.12.07 19:16
в ответ zwerjok24 12.12.07 17:42
ну я би начала с того, что вычислила би среднее арифметическое и построила графики, сразу э можно сделат вывод с какого возраста луди начинаыут болет. Потом хужно гипотезы сформулироват, например: диабетом болше болеют мужчины, бронхитом - женсцины и т.д. Тут тебе виднее, т.к. ты медик. Для вычисления исползуется Т-тест или zweifaktorielle Varianzanalyse не знаыу как ето на русском звучит. Потом можно исследоват, что м. болеыут часце, чем ж. ну и куча вариантов до 30 болеыут наиболее бронхитом, за 60 инфарктом и куча комбинатсиы в етом духе. Ест такая програмка SPSS, она замечателно все вичисляет, в инете помоему можно тестовуыу версиыу скачат. Удачи.
NEW 12.12.07 19:58
в ответ Nataly_M_S 12.12.07 19:16
спасибо!
программа SPSS у меня есть, поэтому я знаю КАК применить сам тест, но не знаю, какой выбрать...
я правильно поняла, что корреляцию нужно подсчитывать тестом chi2?? мне по русски названия не нужны, я их и не знаю.
Вот например конкретный пример:
я говорю, что мужчины чаще болеют диабетом. Как мне это статистически подтвердить или опровергнуть?
программа SPSS у меня есть, поэтому я знаю КАК применить сам тест, но не знаю, какой выбрать...
я правильно поняла, что корреляцию нужно подсчитывать тестом chi2?? мне по русски названия не нужны, я их и не знаю.
Вот например конкретный пример:
я говорю, что мужчины чаще болеют диабетом. Как мне это статистически подтвердить или опровергнуть?
NEW 12.12.07 23:06
в ответ zwerjok24 12.12.07 22:56
chi2 употребляется для nominalskalierten Daten ето когда количество групп однозначно, например м. и ж. так как третего не бывает. Етот тест употребляется толко в етом случае, а т-тест для любых, ну почти любых. Короче говоря ми исползовали почти всегда т-тест, так как он практиче, сравнение полов ето не оснавная задача в статистике, но в твоем случае подходят оба теста, но с возрастом его уже не исползуы так, как ето уже не nominalskalierten Daten.
NEW 13.12.07 11:52
А больше он нигде не употребляется?
Это как утверждать, что шурупы используются только для приделывания картин к стене, и больше ни для чего. Ну они используются конечно, но спектр их применения намного шире.
в ответ Nataly_M_S 12.12.07 23:06
В ответ на:
chi2 употребляется для nominalskalierten Daten ето когда количество групп однозначно, например м. и ж. так как третего не бывает.
chi2 употребляется для nominalskalierten Daten ето когда количество групп однозначно, например м. и ж. так как третего не бывает.
А больше он нигде не употребляется?
Это как утверждать, что шурупы используются только для приделывания картин к стене, и больше ни для чего. Ну они используются конечно, но спектр их применения намного шире.
NEW 13.12.07 11:54
В chi2-Test Teststatistik имеет chi2-распределение, в T-Test Teststatistik имеет Т-распределение. Это два разных распределения, у них разные функции распределения, ну и разные графики соответственно. Т.е. логическая разница в том, что котлета отличается от яишницы.
в ответ zwerjok24 12.12.07 22:56
В ответ на:
мне не совсем понятна логическая разница между chi2 и T-Test?
мне не совсем понятна логическая разница между chi2 и T-Test?
В chi2-Test Teststatistik имеет chi2-распределение, в T-Test Teststatistik имеет Т-распределение. Это два разных распределения, у них разные функции распределения, ну и разные графики соответственно. Т.е. логическая разница в том, что котлета отличается от яишницы.
NEW 13.12.07 12:03
Номинальные
Ординальные
Номинальные
Ну тут могут помочь например Kontingenztafeln. Если речь будет идти о стохастической зависимости. Ну и там соответственно ХиКвадрат-Тест будет. Он правда болеет в данном случае кучей ограничений. Более универсален Фишерский тест для m на n таблиц, но его очень сложно описать в теории, хотя в SAS он применяется на ура. Применяется он чаще чем встречается в литературе, это да.
Какие еще варианты?
Ну можно попытаться с логистической регрессией. Но там нужна бинарная переменная для вероятности, это тут только пол. Можно правда и аггрегировать другие. Другие варианты генерализированной логистической регрессии брать не советую, это будет неподъемно, правда там гибкость получше будет.
в ответ zwerjok24 12.12.07 17:42
В ответ на:
1. их пол (м или ж)
1. их пол (м или ж)
Номинальные
В ответ на:
2. возраст в трех категориях (меньше 30, 30-60 или больше 60)
2. возраст в трех категориях (меньше 30, 30-60 или больше 60)
Ординальные
В ответ на:
3. их заболевания (например: инфаркт, бронхит, диабет)
3. их заболевания (например: инфаркт, бронхит, диабет)
Номинальные
В ответ на:
Например имеет ли связь пол в возрастом.
Например имеет ли связь пол в возрастом.
Ну тут могут помочь например Kontingenztafeln. Если речь будет идти о стохастической зависимости. Ну и там соответственно ХиКвадрат-Тест будет. Он правда болеет в данном случае кучей ограничений. Более универсален Фишерский тест для m на n таблиц, но его очень сложно описать в теории, хотя в SAS он применяется на ура. Применяется он чаще чем встречается в литературе, это да.
Какие еще варианты?
Ну можно попытаться с логистической регрессией. Но там нужна бинарная переменная для вероятности, это тут только пол. Можно правда и аггрегировать другие. Другие варианты генерализированной логистической регрессии брать не советую, это будет неподъемно, правда там гибкость получше будет.