Вход на сайт
Korrelation in EXCEL
25.05.08 17:53
Добрый вечер!
Мне нужно подсчитать коррелацию, но я еще никогда не делала статистических вычеслений с помощью ексель... Возможно ли ее с этой программой подсчитать и если да, как это можно сделать??
За ответы заранее благодарна
Мне нужно подсчитать коррелацию, но я еще никогда не делала статистических вычеслений с помощью ексель... Возможно ли ее с этой программой подсчитать и если да, как это можно сделать??
За ответы заранее благодарна

NEW 25.05.08 19:31
корреляцию можно..задайте в помощи к ехсель соответствуещее слово..
или же посмотрите математические функции...
или вот тут
http://www.cloodt.de/3akorrel.pdf
или же посмотрите математические функции...
или вот тут
http://www.cloodt.de/3akorrel.pdf
NEW 25.05.08 20:53
И совсем не долго. Я думаю не больше 10 минут. На копирование.
Можно на одном листе сделать решение, а данные подставлять разные на другом. И хоть 200 корреляций.
А вообще мне кажется там формула была... думаю туда нужно было заглянуть в первую очередь. В формулы.
В любом стат. пакете проще. С СПСС не работал, но за R и SAS могу поручиться.
в ответ zwerjok24 25.05.08 20:34
В ответ на:
по формуле не только тупо, но и слишком долго:)
по формуле не только тупо, но и слишком долго:)
И совсем не долго. Я думаю не больше 10 минут. На копирование.
В ответ на:
Мне нужна далеко ни одна коррелация...
Мне нужна далеко ни одна коррелация...
Можно на одном листе сделать решение, а данные подставлять разные на другом. И хоть 200 корреляций.
А вообще мне кажется там формула была... думаю туда нужно было заглянуть в первую очередь. В формулы.
В ответ на:
а в СПСС ето проще?
а в СПСС ето проще?
В любом стат. пакете проще. С СПСС не работал, но за R и SAS могу поручиться.

NEW 25.05.08 22:00
Не понял. Это что будет корреляция между номинальными переменными?
Нужно просто подумать как это сделать не вручную.
в ответ zwerjok24 25.05.08 21:00
В ответ на:
Проблема ешё в том, что в банке данных имеются только нули и единизы (1=да, 0=нет).
Если я задаю корреляцию, то мне же пересчитывают все ети единицы???
Проблема ешё в том, что в банке данных имеются только нули и единизы (1=да, 0=нет).
Если я задаю корреляцию, то мне же пересчитывают все ети единицы???
Не понял. Это что будет корреляция между номинальными переменными?
В ответ на:
Или надо сначало сделать из них суммы "вручную"?
Или надо сначало сделать из них суммы "вручную"?
Нужно просто подумать как это сделать не вручную.
NEW 26.05.08 18:41
в ответ zwerjok24 25.05.08 17:53
большое спасибо за ответы!
у меня есть СПСС, если точно понять, каким тестом воспользоваться, то можно посчитать и на нём.
Я не совсем понимаю, почему в етом случае напрашивается регрессия?? Моя идея была перепроверить "дейвствительно ли с возрастом болезнь проявляется чаще? Ето же коррелатия: если ли связь между возрастом и болезнью?! Или не так?
А каузальная зависимость как можно применить??? Является ли возраст причиной болезни? Ето не совсем то, что мне нужно показать...
Я по зифрам уже вижу, что в старшей возрастной группе болеют чаще! Но каким тестом ето перепроверить, так и не прояснилось...:)
у меня есть СПСС, если точно понять, каким тестом воспользоваться, то можно посчитать и на нём.
Я не совсем понимаю, почему в етом случае напрашивается регрессия?? Моя идея была перепроверить "дейвствительно ли с возрастом болезнь проявляется чаще? Ето же коррелатия: если ли связь между возрастом и болезнью?! Или не так?
А каузальная зависимость как можно применить??? Является ли возраст причиной болезни? Ето не совсем то, что мне нужно показать...
Я по зифрам уже вижу, что в старшей возрастной группе болеют чаще! Но каким тестом ето перепроверить, так и не прояснилось...:)
NEW 26.05.08 19:33
Проблема в том, что у вас одна переменная дихотомная (принимает только два значения), а вторая метрическая (ну или ординальная), а стандартные коэффициенты корреляции (Пирсона и Спирмана) на ситуации метрических либо ординальных переменных придуманы. В вашем случае можно коэффициент Gini (он же Sommer's D) считать, это можно и вручную сделать, но лучше воспользоваться тем, что логистическая регрессия его сама вам посчитает (в SAS это точно так, в SPSS тоже должно быть так, но не уверен). Правда, не думаю, что это то, что вам нужно.
Если нужно только протестировать разницу количества заболеваний в двух группах, то это хи-квадрат-тест, насколько я помню.
в ответ zwerjok24 26.05.08 18:41
В ответ на:
Моя идея была перепроверить "дейвствительно ли с возрастом болезнь проявляется чаще? Ето же коррелатия: если ли связь между возрастом и болезнью?! Или не так?
Моя идея была перепроверить "дейвствительно ли с возрастом болезнь проявляется чаще? Ето же коррелатия: если ли связь между возрастом и болезнью?! Или не так?
Проблема в том, что у вас одна переменная дихотомная (принимает только два значения), а вторая метрическая (ну или ординальная), а стандартные коэффициенты корреляции (Пирсона и Спирмана) на ситуации метрических либо ординальных переменных придуманы. В вашем случае можно коэффициент Gini (он же Sommer's D) считать, это можно и вручную сделать, но лучше воспользоваться тем, что логистическая регрессия его сама вам посчитает (в SAS это точно так, в SPSS тоже должно быть так, но не уверен). Правда, не думаю, что это то, что вам нужно.
В ответ на:
Я по зифрам уже вижу, что в старшей возрастной группе болеют чаще! Но каким тестом ето перепроверить, так и не прояснилось.
Я по зифрам уже вижу, что в старшей возрастной группе болеют чаще! Но каким тестом ето перепроверить, так и не прояснилось.
Если нужно только протестировать разницу количества заболеваний в двух группах, то это хи-квадрат-тест, насколько я помню.
NEW 27.05.08 13:12
Корреляция это мера связи изначально между метрическими переменными (на непрерывной шкале), а потом между ординальными (дискретные переменные имеющие определенный порядок расстановки). Коэффициент корреляции Пирсона показывает степень линейной зависимости между двумя метрическими переменными. Спирмана и Кендалла показывают есть ли вообще некая связь между переменными. (что правда опять же может ни о чем не говорить)
У вас болезнь это номинальная переменная, для нее не существует порядка расстановки. Поэтому коэффициенты корреляции неприменимы. Зато для определения зависимости можно использовать Kontingenztafeln. Ну и в контексте с ними хи квадрат тест. Там могут быть и номинальные переменные. Там две переменные: в вашем случае Болезнь (0 болен, 1 здоров) и Возраст (1, 2, 3, 4 - возрастные группы). Составляется таблица, заносится туда количество разных случаев, ну и считается. Правда у хи квадрат теста есть множество условий, которые не всегда выполняются. Если нет - то есть тест Фишера. Он всегда хорош. Правда в книгах описаны только таблицы 2 на 2, хотя он есть и для любых таблиц.
в ответ zwerjok24 26.05.08 18:41
В ответ на:
Моя идея была перепроверить "дейвствительно ли с возрастом болезнь проявляется чаще? Ето же коррелатия: если ли связь между возрастом и болезнью?! Или не так?
Моя идея была перепроверить "дейвствительно ли с возрастом болезнь проявляется чаще? Ето же коррелатия: если ли связь между возрастом и болезнью?! Или не так?
Корреляция это мера связи изначально между метрическими переменными (на непрерывной шкале), а потом между ординальными (дискретные переменные имеющие определенный порядок расстановки). Коэффициент корреляции Пирсона показывает степень линейной зависимости между двумя метрическими переменными. Спирмана и Кендалла показывают есть ли вообще некая связь между переменными. (что правда опять же может ни о чем не говорить)
У вас болезнь это номинальная переменная, для нее не существует порядка расстановки. Поэтому коэффициенты корреляции неприменимы. Зато для определения зависимости можно использовать Kontingenztafeln. Ну и в контексте с ними хи квадрат тест. Там могут быть и номинальные переменные. Там две переменные: в вашем случае Болезнь (0 болен, 1 здоров) и Возраст (1, 2, 3, 4 - возрастные группы). Составляется таблица, заносится туда количество разных случаев, ну и считается. Правда у хи квадрат теста есть множество условий, которые не всегда выполняются. Если нет - то есть тест Фишера. Он всегда хорош. Правда в книгах описаны только таблицы 2 на 2, хотя он есть и для любых таблиц.
NEW 27.05.08 13:14
У вас 2 переменных: Болезнь 2 значения принимает и Возраст 4 значения принимает. Как раз на таблицу по горизонтали одна переменная, по вертикали другая. Это несложно.
в ответ zwerjok24 26.05.08 20:59
В ответ на:
дело в том, что у меня только одна группа... что же тогда можно сделать...?
дело в том, что у меня только одна группа... что же тогда можно сделать...?
У вас 2 переменных: Болезнь 2 значения принимает и Возраст 4 значения принимает. Как раз на таблицу по горизонтали одна переменная, по вертикали другая. Это несложно.
NEW 27.05.08 13:16
Найти как в нем считаются Kontingenztafeln и Fischers Test и Chi-Quadrat Test. Но только по этой теме!!! А то Хиквадрат тестов имеется большое количество.
в ответ zwerjok24 26.05.08 18:41
В ответ на:
у меня есть СПСС, если точно понять, каким тестом воспользоваться, то можно посчитать и на нём.
у меня есть СПСС, если точно понять, каким тестом воспользоваться, то можно посчитать и на нём.
Найти как в нем считаются Kontingenztafeln и Fischers Test и Chi-Quadrat Test. Но только по этой теме!!! А то Хиквадрат тестов имеется большое количество.
NEW 28.05.08 07:58
нет
В данном тесте, как вобщем и в любом другом все зависит от нулевой гипотезы. В случае с контингенцтафелями нулевая гипотеза будет, что Болезнь и Возраст стохастически независимы. Так вот может быть только два исхода теста: Нулевая гипотеза отвергается, Нулевая гипотеза не отвергается на сигнификантном уровне альфа. Установить или подтвердить ничего нельзя. Можно только отвергнуть гипотезу или не отвергнуть.
в ответ zwerjok24 27.05.08 19:46
В ответ на:
А имеет значение, что именно пойдёт по горизонтали или вертикали?
А имеет значение, что именно пойдёт по горизонтали или вертикали?
нет
В ответ на:
И что именно я установлю применив хи2-Тест?? Наличие взаимосвязи между болезней и возрастом?
И что именно я установлю применив хи2-Тест?? Наличие взаимосвязи между болезней и возрастом?
В данном тесте, как вобщем и в любом другом все зависит от нулевой гипотезы. В случае с контингенцтафелями нулевая гипотеза будет, что Болезнь и Возраст стохастически независимы. Так вот может быть только два исхода теста: Нулевая гипотеза отвергается, Нулевая гипотеза не отвергается на сигнификантном уровне альфа. Установить или подтвердить ничего нельзя. Можно только отвергнуть гипотезу или не отвергнуть.