Deutsch
Germany.ruФорумы → Архив Досок→ Образование

Korrelation in EXCEL

636  1 2 все
zwerjok24 знакомое лицо25.05.08 17:53
zwerjok24
25.05.08 17:53 
Добрый вечер!
Мне нужно подсчитать коррелацию, но я еще никогда не делала статистических вычеслений с помощью ексель... Возможно ли ее с этой программой подсчитать и если да, как это можно сделать??
За ответы заранее благодарна
#1 
  Quo Vadis патриот25.05.08 19:31
Quo Vadis
NEW 25.05.08 19:31 
в ответ zwerjok24 25.05.08 17:53, Последний раз изменено 25.05.08 19:34 (Quo Vadis)
корреляцию можно..задайте в помощи к ехсель соответствуещее слово..
или же посмотрите математические функции...
или вот тут
http://www.cloodt.de/3akorrel.pdf
#2 
nrw1979 коренной житель25.05.08 20:10
nrw1979
NEW 25.05.08 20:10 
в ответ zwerjok24 25.05.08 17:53
та хотябы тупо по формуле... почему бы нет? не сказать, что это самое удобное, но можно.
#3 
zwerjok24 знакомое лицо25.05.08 20:34
zwerjok24
NEW 25.05.08 20:34 
в ответ nrw1979 25.05.08 20:10
по формуле не только тупо, но и слишком долго:) Мне нужна далеко ни одна коррелация...
а в СПСС ето проще?
#4 
zwerjok24 знакомое лицо25.05.08 20:35
zwerjok24
NEW 25.05.08 20:35 
в ответ Quo Vadis 25.05.08 19:31
Болшое спасико! Сейчас посмотрю!
#5 
nrw1979 коренной житель25.05.08 20:53
nrw1979
NEW 25.05.08 20:53 
в ответ zwerjok24 25.05.08 20:34
В ответ на:
по формуле не только тупо, но и слишком долго:)

И совсем не долго. Я думаю не больше 10 минут. На копирование.
В ответ на:
Мне нужна далеко ни одна коррелация...

Можно на одном листе сделать решение, а данные подставлять разные на другом. И хоть 200 корреляций.
А вообще мне кажется там формула была... думаю туда нужно было заглянуть в первую очередь. В формулы.
В ответ на:
а в СПСС ето проще?

В любом стат. пакете проще. С СПСС не работал, но за R и SAS могу поручиться.
#6 
zwerjok24 знакомое лицо25.05.08 21:00
zwerjok24
NEW 25.05.08 21:00 
в ответ nrw1979 25.05.08 20:53
Проблема ешё в том, что в банке данных имеются только нули и единизы (1=да, 0=нет).
Если я задаю корреляцию, то мне же пересчитывают все ети единицы??? Получается же чушь ...
Или надо сначало сделать из них суммы "вручную"?
#7 
zwerjok24 знакомое лицо25.05.08 21:15
zwerjok24
NEW 25.05.08 21:15 
в ответ zwerjok24 25.05.08 21:00
и ещо такой вопрос:
если у меня есть 4 возрастные группы и например одна болезнь. Есть ли смысл в етом случае высчитывать коррелацию??
#8 
nrw1979 коренной житель25.05.08 22:00
nrw1979
NEW 25.05.08 22:00 
в ответ zwerjok24 25.05.08 21:00
В ответ на:
Проблема ешё в том, что в банке данных имеются только нули и единизы (1=да, 0=нет).
Если я задаю корреляцию, то мне же пересчитывают все ети единицы???

Не понял. Это что будет корреляция между номинальными переменными?
В ответ на:
Или надо сначало сделать из них суммы "вручную"?

Нужно просто подумать как это сделать не вручную.
#9 
nrw1979 коренной житель25.05.08 22:06
nrw1979
NEW 25.05.08 22:06 
в ответ zwerjok24 25.05.08 21:15
В ответ на:
если у меня есть 4 возрастные группы и например одна болезнь. Есть ли смысл в етом случае высчитывать коррелацию??

Нет. Смысла нет. Это будет не линейная зависимость. Нужно логистическую регрессию делать.
#10 
nrw1979 коренной житель25.05.08 22:08
nrw1979
NEW 25.05.08 22:08 
в ответ zwerjok24 25.05.08 21:15
коэффициент корреляции можно посчитать только для кардинальных переменных
#11 
  Князь Грязин коренной житель25.05.08 23:07
NEW 25.05.08 23:07 
в ответ nrw1979 25.05.08 22:08
А Спирмана?
#12 
nrw1979 коренной житель25.05.08 23:43
nrw1979
NEW 25.05.08 23:43 
в ответ Князь Грязин 25.05.08 23:07, Последний раз изменено 25.05.08 23:43 (nrw1979)
В ответ на:
А Спирмана?

Да, конечно. Если бы болезнь была ординальной переменной, а она номинальная. А кендал и спирман только для ординальных.
#13 
nrw1979 коренной житель25.05.08 23:47
nrw1979
NEW 25.05.08 23:47 
в ответ Князь Грязин 25.05.08 23:07
для номинальной переменной Болезнь существует два равносильных варианта ранжирования и соответственно получатся два коэффициента. Какой из них брать абсолютно неясно.
#14 
nrw1979 коренной житель25.05.08 23:50
nrw1979
NEW 25.05.08 23:50 
в ответ Князь Грязин 25.05.08 23:07
да, но в любом случае там логистическая регрессия напрашивается просто.
#15 
  Князь Грязин коренной житель26.05.08 08:28
NEW 26.05.08 08:28 
в ответ nrw1979 25.05.08 23:50
Напрашивается. Но вот ее в Экселе делать - то еще развлечение.
#16 
nrw1979 коренной житель26.05.08 09:32
nrw1979
NEW 26.05.08 09:32 
в ответ Князь Грязин 26.05.08 08:28
ну ясен пень. Не... можно конечно, если ничего другого нет, но это геморрой.
#17 
zwerjok24 знакомое лицо26.05.08 18:41
zwerjok24
NEW 26.05.08 18:41 
в ответ zwerjok24 25.05.08 17:53
большое спасибо за ответы!
у меня есть СПСС, если точно понять, каким тестом воспользоваться, то можно посчитать и на нём.
Я не совсем понимаю, почему в етом случае напрашивается регрессия?? Моя идея была перепроверить "дейвствительно ли с возрастом болезнь проявляется чаще? Ето же коррелатия: если ли связь между возрастом и болезнью?! Или не так?
А каузальная зависимость как можно применить??? Является ли возраст причиной болезни? Ето не совсем то, что мне нужно показать...
Я по зифрам уже вижу, что в старшей возрастной группе болеют чаще! Но каким тестом ето перепроверить, так и не прояснилось...:)
#18 
  Князь Грязин коренной житель26.05.08 19:33
NEW 26.05.08 19:33 
в ответ zwerjok24 26.05.08 18:41
В ответ на:
Моя идея была перепроверить "дейвствительно ли с возрастом болезнь проявляется чаще? Ето же коррелатия: если ли связь между возрастом и болезнью?! Или не так?

Проблема в том, что у вас одна переменная дихотомная (принимает только два значения), а вторая метрическая (ну или ординальная), а стандартные коэффициенты корреляции (Пирсона и Спирмана) на ситуации метрических либо ординальных переменных придуманы. В вашем случае можно коэффициент Gini (он же Sommer's D) считать, это можно и вручную сделать, но лучше воспользоваться тем, что логистическая регрессия его сама вам посчитает (в SAS это точно так, в SPSS тоже должно быть так, но не уверен). Правда, не думаю, что это то, что вам нужно.
В ответ на:
Я по зифрам уже вижу, что в старшей возрастной группе болеют чаще! Но каким тестом ето перепроверить, так и не прояснилось.

Если нужно только протестировать разницу количества заболеваний в двух группах, то это хи-квадрат-тест, насколько я помню.
#19 
zwerjok24 знакомое лицо26.05.08 20:59
zwerjok24
NEW 26.05.08 20:59 
в ответ Князь Грязин 26.05.08 19:33
В ответ на:
Если нужно только протестировать разницу количества заболеваний в двух группах, то это хи-квадрат-тест, насколько я помню.

дело в том, что у меня только одна группа... что же тогда можно сделать...?
#20 
nrw1979 коренной житель27.05.08 13:12
nrw1979
NEW 27.05.08 13:12 
в ответ zwerjok24 26.05.08 18:41
В ответ на:
Моя идея была перепроверить "дейвствительно ли с возрастом болезнь проявляется чаще? Ето же коррелатия: если ли связь между возрастом и болезнью?! Или не так?

Корреляция это мера связи изначально между метрическими переменными (на непрерывной шкале), а потом между ординальными (дискретные переменные имеющие определенный порядок расстановки). Коэффициент корреляции Пирсона показывает степень линейной зависимости между двумя метрическими переменными. Спирмана и Кендалла показывают есть ли вообще некая связь между переменными. (что правда опять же может ни о чем не говорить)
У вас болезнь это номинальная переменная, для нее не существует порядка расстановки. Поэтому коэффициенты корреляции неприменимы. Зато для определения зависимости можно использовать Kontingenztafeln. Ну и в контексте с ними хи квадрат тест. Там могут быть и номинальные переменные. Там две переменные: в вашем случае Болезнь (0 болен, 1 здоров) и Возраст (1, 2, 3, 4 - возрастные группы). Составляется таблица, заносится туда количество разных случаев, ну и считается. Правда у хи квадрат теста есть множество условий, которые не всегда выполняются. Если нет - то есть тест Фишера. Он всегда хорош. Правда в книгах описаны только таблицы 2 на 2, хотя он есть и для любых таблиц.
#21 
nrw1979 коренной житель27.05.08 13:14
nrw1979
NEW 27.05.08 13:14 
в ответ zwerjok24 26.05.08 20:59
В ответ на:
дело в том, что у меня только одна группа... что же тогда можно сделать...?

У вас 2 переменных: Болезнь 2 значения принимает и Возраст 4 значения принимает. Как раз на таблицу по горизонтали одна переменная, по вертикали другая. Это несложно.
#22 
nrw1979 коренной житель27.05.08 13:16
nrw1979
NEW 27.05.08 13:16 
в ответ zwerjok24 26.05.08 18:41
В ответ на:
у меня есть СПСС, если точно понять, каким тестом воспользоваться, то можно посчитать и на нём.

Найти как в нем считаются Kontingenztafeln и Fischers Test и Chi-Quadrat Test. Но только по этой теме!!! А то Хиквадрат тестов имеется большое количество.
#23 
zwerjok24 знакомое лицо27.05.08 19:46
zwerjok24
NEW 27.05.08 19:46 
в ответ nrw1979 27.05.08 13:16
спасибо за обяснения!!!!
Контингенцтафел я знаю как сделать в СПСС. А имеет значение, что именно пойдёт по горизонтали или вертикали?
И что именно я установлю применив хи2-Тест?? Наличие взаимосвязи между болезней и возрастом?
#24 
nrw1979 коренной житель28.05.08 07:58
nrw1979
NEW 28.05.08 07:58 
в ответ zwerjok24 27.05.08 19:46
В ответ на:
А имеет значение, что именно пойдёт по горизонтали или вертикали?

нет
В ответ на:
И что именно я установлю применив хи2-Тест?? Наличие взаимосвязи между болезней и возрастом?

В данном тесте, как вобщем и в любом другом все зависит от нулевой гипотезы. В случае с контингенцтафелями нулевая гипотеза будет, что Болезнь и Возраст стохастически независимы. Так вот может быть только два исхода теста: Нулевая гипотеза отвергается, Нулевая гипотеза не отвергается на сигнификантном уровне альфа. Установить или подтвердить ничего нельзя. Можно только отвергнуть гипотезу или не отвергнуть.
#25 
dgek посетитель29.05.08 01:31
NEW 29.05.08 01:31 
в ответ nrw1979 28.05.08 07:58
можно еще доказать алтернатив-гипотезу, если установить бета-ошибку
#26 
nrw1979 коренной житель29.05.08 07:33
nrw1979
NEW 29.05.08 07:33 
в ответ dgek 29.05.08 01:31
1. Доказать гипотезу ни при каких условиях нельзя. Можно ее либо отклонить, либо не отклонить.
2. Для того, чтобы работать с альтернативой нужно знать распределение Статистики под альтернативой. А вот это как раз часто и неизвестно.
#27 
1 2 все