рефераты рефераты
 

Главная

Разделы

Новости

О сайте

Контакты

 
рефераты

Авиация и космонавтика
Административное право
Арбитражный процесс
Архитектура
Астрология
Астрономия
Банковское дело
Безопасность жизнедеятельности
Бизнес-план
Биология
Бухучет управленчучет
Водоснабжение водоотведение
Военная кафедра
География и геология
Геодезия
Государственное регулирование и налогообложение
Гражданское право
Гражданское процессуальное право
Животные
Жилищное право
Иностранные языки и языкознание
История и исторические личности
Коммуникации связь цифровые приборы и радиоэлектроника
Краеведение и этнография
Кулинария и продукты питания
Культура и искусство
Литература
Логика
Логистика
Маркетинг
Масс-медиа и реклама
Математика
Медицина
Международное и Римское право
Уголовное право уголовный процесс
Трудовое право
Журналистика
Химия
География
Иностранные языки
Без категории
Физкультура и спорт
Философия
Финансы
Фотография
Химия
Хозяйственное право
Цифровые устройства
Таможенная система
Теория государства и права
Теория организации
Теплотехника
Технология
Товароведение
Транспорт
Трудовое право
Туризм
Уголовное право и процесс
Управление
Радиоэлектроника
Религия и мифология
Риторика
Социология
Статистика
Страхование
Строительство
Схемотехника
История
Компьютеры ЭВМ
Культурология
Сельское лесное хозяйство и землепользование
Социальная работа
Социология и обществознание

рефераты
рефераты

НАУЧНАЯ БИБЛИОТЕКА - РЕФЕРАТЫ - Курсовая работа

Курсовая работа

Лабораторная работа № 1.

Тема: «Сводка, группировка, статистические таблицы».

Цель: выявление обобщающих закономерностей, характерных для изучаемой

совокупности объектов наблюдения как целостной системы.

Цель исследования—определение уровня успеваемости студентов 1-ого курса, а

так же факторов на него влияющих.

В качестве исследуемых признаков я рассматриваю:

1. средний балл по итогам экзаменов за 1-ый курс (баллы).

2. посещаемость занятий в университете на 1-ом курсе.

3. самообразование (дополнительное обучение, курсы) (ч/нед).

4. сон (ч/сутки).

5. пол (м, ж).

6. подготовка к семинарским и практическим занятиям (ч/нед).

7. нравятся ли студенту на 1-ом курсе занятия в университете (да, нет).

Из представленных признаков я выделяю признак-результат—средний балл

зачётки по итогам 1-ого курса, так как его значение отвечает цели

исследования. Остальные шесть признаков являются признаками-факторами, т.

к. они оказывают влияние на признак-результат.

Наблюдение единовременное ауд. 722, 522 СПбГИЭУ. Дата проведения:

03.11.2000г. по форме проведения—опрос. Объектом наблюдения являются 2

группы студентов (1093 и 1094) 2-ого курса. единица наблюдения—студент.

Исследование основного массива.

Таблицы с исходными данными.

Таблица 1

|Средний |Посещаемост|Самообразо|Подготовка|Сон |Пол |Нравятся |

|балл |ь занятий |вание |к |(ч/сут) |(м, ж) |ли |

|зачётки |на первом |(доп. |семинарски| | |занятия в|

|по |курсе |Курсы) |м занятиям| | |университ|

|итогам | |ч/нед |(ч/нед) | | |ете (да, |

|экзамено| | | | | |нет) |

|в за | | | | | | |

|1-ый | | | | | | |

|курс | | | | | | |

|(баллы) | | | | | | |

|4,7 |19,5 |0 |5 |7 |Ж |Да |

|4,5 |22 |2 |6 |9 |Ж |Да |

|4,2 |22 |0 |2 |6 |М |Да |

|4,3 |19,5 |0 |7 |7 |Ж |Да |

|4,5 |17,5 |0 |3 |7 |Ж |Нет |

|4,2 |9,5 |6 |12 |10 |Ж |Да |

|4,0 |12,5 |0 |5 |5 |Ж |Да |

|4,7 |22 |4 |7 |6 |Ж |Да |

|4,6 |17,5 |3 |4 |8 |Ж |Да |

|4,7 |9,5 |0 |2 |7 |Ж |Да |

|4,5 |11,5 |6 |3 |7 |Ж |Да |

|4,0 |11,5 |2 |3 |9 |Ж |Да |

|4,2 |19,5 |4 |8 |8 |Ж |Нет |

|4,0 |20,5 |6 |9 |5 |Ж |Да |

|3,2 |9,5 |0 |0 |10 |М |Нет |

|4,0 |17,5 |0 |8 |8 |М |Нет |

|3,2 |14,5 |0 |2 |8 |М |Нет |

|3,5 |14,5 |0 |2 |8 |М |Нет |

|4,8 |22 |0 |10 |10 |Ж |Нет |

|4,6 |8,5 |0 |1 |8 |М |Да |

|4,5 |22 |0 |4 |7 |Ж |Да |

|4,5 |22 |6 |2 |7 |М |Да |

|4,2 |17,5 |4 |4 |9 |М |Нет |

|4,5 |14,5 |6 |4 |10 |Ж |Да |

|4,2 |11,5 |2 |2 |8 |Ж |Нет |

|4,8 |17,5 |0 |4 |9 |Ж |Нет |

|4,0 |10,5 |0 |2 |7 |Ж |Да |

|4,2 |17,5 |2 |6 |5 |Ж |Да |

|3,0 |9,5 |0 |0 |9 |М |Нет |

|4,8 |19,5 |2 |2 |8 |Ж |Да |

|4,8 |19,5 |2 |6 |9 |Ж |Да |

|4,3 |17,5 |4 |2 |7 |Ж |Да |

|3,2 |6,0 |0 |0 |5 |М |Нет |

|4,5 |22 |2 |5 |9 |Ж |Нет |

|4,7 |22 |4 |3 |6 |Ж |Да |

|4,2 |22 |3 |5 |8 |Ж |Да |

|4,6 |9,5 |0 |1 |8 |Ж |Нет |

|3,0 |14,0 |0 |2 |10 |М |Нет |

|3,0 |6,5 |0 |5 |9 |М |Нет |

|4,0 |22 |2 |5 |9 |Ж |Да |

|4,7 |17,5 |6 |0 |10 |Ж |Нет |

|3,5 |11,5 |0 |6 |7 |М |Нет |

|4,7 |22 |6 |2 |5 |Ж |Да |

|4,5 |22 |0 |0 |8 |Ж |Да |

|3,2 |17,5 |4 |8 |9 |Ж |Да |

|4,8 |22 |0 |0 |5 |М |Да |

|3,2 |9,5 |0 |5 |10 |М |Да |

|4,5 |17,5 |0 |3 |10 |Ж |Да |

|3,0 |14,5 |5 |3 |7 |М |Нет |

|4,7 |11,5 |5 |3 |7 |М |Нет |

Структурные группировки.

1 группировка.

Таблица 2

|Средний балл по |Число студентов |% к итогу |Fi |

|итогам экзаменов | | | |

|за 1 курс, баллы | | | |

|[3-3,5] |9 |18 |9 |

|[3,5-4] |3 |6 |12 |

|[4-4,5] |15 |30 |27 |

|[4,5-5] |23 |46 |50 |

|Итог: |50 |100 | |

Для удобства разбиваем вариационный ряд на 4 равных интервала. Величину

интервала определяем по формуле:

h = R / n = (X max – X min) / n = (5-3) / 4 = 0,5

гистограмма:

кумулята:

[pic]

считаем по несгруппированным данным для большей точности:

Х = (4,7 + 4,5 + 4,2 + 4,2 +4,5 + 4,2 + 4,0 + 4,7 + 4,6 + 4,7 + 3,5 + 4,0 +

3,2 + 4,0 + 3,2 + 3,5 + + 4,8 + 4,6 + 4,5 + 4,5 + 4,2 + 4,5 + 4,2 + 4,8 +

4,0 + 4,2 + 3,0 + 3,2 + 4,8 + 4,8 + 4,3 + 4,5 + 4,7 + 4,2 + 4,6 + 3,0 + 3,0

+ 4,0 + 4,7 + 3,5 + 4,7 + 4,5 + 3,2 + 4,5 + 4,8 + 3,2 + 3,0 + 4,5 + 4,7) /

50 = 4,27 (балла)

Ме = x0 + ( Ме (N/2 – F(x0) / NMe

Me = 4+ 0,5 (25 –12) / 15 = 4,4 (балла)

Мо = х0 + ( Мо (NМо – NМо-1) / (NМо – NМо-1) + (NМо – NМо+1)

Mo = 4,5 + 0,5 (25-15) / ((23-15) + (23-0)) = 4,6 (балла)

D = ( (xi – x)2 / n считаем по несгруппированным данным.

D = 0,3 (кв. балла)

bx = (D

bx = (0,3 = 0,55 (балла)

V = bx / x ( 100%

V = (0,55 / 4,27) ( 100% = 128%

R = xmax – xmin

R = 5 – 3 = 2 (балла)

Вывод: средний балл зачётки по итогам экзаменов за 1-ый курс для данной

совокупности составляет 4,27 балла. Т. к. коэффициент вариации является

величиной незначительной (128%), можно предполагать, что такой средний балл

является типичным для данной совокупности. Наиболее распространённым

является балл зачётки 4,6 балла. Средний балл у 50% студентов не больше 4,4

балла.

Группировка 2

Таблица 3

|Посещаемость, |Число студентов, |% к итогу |Fi |

|ч/нед |чел | | |

|[6-10] |9 |18 |9 |

|[10-14] |8 |16 |17 |

|[14-18] |15 |30 |32 |

|[18-22] |18 |36 |50 |

|Итог: |50 |100 | |

Разбиение на интервалы аналогично группировке 1.

Для несгруппированных данных, значит более точный результат.

Х = ( xi / n

X = 16, 13 (ч/нед)

Ме = x0 + ( Ме (N/2 – F(x0) / NMe

Ме = 14 + 4 (25 – 17) / 15 = 17,3 (ч/нед)

[pic]

D = ( (xi – x)2 / n

D = 19,4 ((ч/нед)2)

bx = (D = 4,4 (ч/нед)

V = bx / x ( 100% = (4,4 / 16,13) ( 100% = 27,2%

R = xmax – xmin

R = 22 – 16 = 16 (балла)

Вывод: средняя посещаемость в группах составляет 16,13 ч/нед (70% от часов

в неделю назначенных расписанием). Коэффициент вариации является величиной

незначительной (28,6%), следовательно. Такая средняя посещаемость типична

для студентов данной совокупности. Большинство студентов посещало 17,3

ч/нед. Посещаемость занятий у 50% студентов меньше 19 ч/нед, у 50% больше

19 ч/нед.

Группировка 3

Таблица 4

|Самообразование, |Число студентов |% к итогу |Fi |

|курсы (ч/нед) | | | |

|0 |25 |50 |25 |

|2 |8 |16 |33 |

|3 |2 |4 |35 |

|4 |6 |12 |41 |

|5 |2 |4 |43 |

|6 |7 |14 |50 |

|Итог: |50 |100 | |

Полегон частот:

кумулята

Х = ( xi (i / ( (i = (0 ( 25 + 2 ( 8 + 3 ( 2 + 4 ( 6 + 5 ( 2 + 6 ( 7) / 50

= 1,96 (ч/нед)

NMe = (n+1) / 2 = 51 / 2 = 25,5

Me = x NMe ; Me = 2 (ч/нед) ; Мо = 0 (ч/нед)

D = ( (xi – x)2 (i / ( (I = ((0 – 1,96)2 ( 25 + (2 – 1,96)2 ( 8 + (3 –

1,96)2 ( 2 + (4 – 1,96)2 ( 6 + (5 – 1,96)2 ( 2 + (6 – 1,96)2 ( 7) / 50 =

5,1 (ч/нед)2

bx = 2,26 (ч/нед)

V = (2,26 / 1,96) ( 100% = 115%

R = 6 – 0 = 6 (ч/нед)

Вывод: среднее количество часов, затраченное студентами на самообразование

1,96 ч/нед. Т. к. коэффициент вариации является величиной значительной

(115%), то среднее количество является не типичным для данной совокупности.

Наиболее распространённым является количество часов самообразования равное

0 ч/нед. Ровно половина из 50 опрошенных студентов не занимались на первом

курсе дополнительным самообразованием.

Группировка 4

Таблица 5

|Подготовка к |Число студентов |% к итогу |Fi |

|семинарам, ч/нед | | | |

|[0-3] |21 |42 |21 |

|[3-6] |18 |36 |39 |

|[6-9] |8 |16 |47 |

|[9-12] |3 |6 |50 |

Для удобства разбиваем вариационный ряд на 4 равных интервала. Величину

интервала определяем по формуле: h = R / n. h = 3.

[pic]

Х = ( xi / n

Х = 4,08 (ч/нед)

Ме = 3 + 3 (25 – 21) / 18 = 3,6 (ч/нед)

Мо = 0 + 3 (21 – 0) / ((21 – 0) + (21 – 8)) = 1,85 (ч/нед)

D = ( (xi – x)2 / n

D = 7,2 ((ч/нед)2)

bx = 2,7 (ч/нед)

V = (2,7 / 4,08) ( 100% = 65,6%

R = 12 – 0 = 12 (ч/нед)

Вывод: среднее время, затраченное на подготовку к семинарским занятиям у

студентов на 1 курсе 4,08 ч/нед. Т. к. коэффициент вариации является

величиной значительной, то среднее время подготовки является величиной не

типичной для данной совокупности студентов. Наиболее распространённым

количеством часов на подготовку равно 1,85 ч/нед. Число студентов,

занимающихся больше 3,6 ч/нед равно числу студентов, занимающихся

подготовкой к занятиям больше 3,6 ч/нед.

Группировка 5

Таблица 6

|Сон, ч/сутки |Число студентов |% к итогу |Fi |

|5 |6 |12 |6 |

|6 |3 |6 |9 |

|7 |13 |26 |22 |

|8 |11 |22 |33 |

|9 |8 |16 |41 |

|10 |9 |18 |50 |

|Итог: |50 |100 | |

X = (5 6 + 6 3 + 7 13 + 8 11 + 9 8 + 10 9) / 50 = 7,78 (ч/сут)

NMe = (n+1) / 2 Me = 8 (ч/сут)

Мо = 7 (ч/сут)

D = ( (xi – x)2 (i / ( (I

D = 2,4 ((ч/сут)2)

bx = 1,55 (ч/сут)

V = (1,55 / 7,78) ( 100% = 19,9%

R = 10 – 5 = 5 (ч/сут)

Вывод: среднее значение часов сна 7,78 ч/сутки. Т. к. коэффициент вариации

является величиной незначительной (19,9%), то такое среднее значение часов

сна является типичным для данной совокупности. Наиболее распространённым

является количество часов сна 7 ч/сутки. Количество студентов, которые спят

больше 8 ч/сутки равно количеству студентов, спящих меньше 8 ч/сут.

Группировка 6

Таблица 7

|пол |Число студентов, |% к итогу |Fi |

| |чел | | |

|Ж |33 |66 |30 |

|М |17 |34 |50 |

|Итог: |50 |100 | |

Вывод: из таблицы видно, что большинство опрошенных студентов женского

пола.

Группировка 7

Таблица 8

|Нравятся ли |Число студентов, |% к итогу |Fi |

|занятия на 1 |чел | | |

|курсе | | | |

|Да |30 |60 |30 |

|Нет |20 |40 |50 |

|Итог: |50 |100 | |

[pic]

Вывод: из таблицы видно, что большинству студентов данной совокупности

нравились занятия на 1 курсе в академии.

Комбинационные группировки.

Таблица 9

|сон |Средний балл зачётки |Всего|

|Неудовлетворительная |21 |3,7 |

|Удовлетворительная |18 |4,3 |

|Хорошая |8 |4,4 |

|Отличная |3 |4,5 |

|Всего: |50 | |

Вывод: из таблицы видно, что зависимость между фактором и признаком

существует.

Группировка 2

Таблица 12

Введём обозначения:

1. 1/3 всех занятий [6-12] ч/нед

2. половина [12-18] ч/нед

3. все занятия [18-22] ч/нед

|Посещаемость занятий |Число студентов, чел |Средний балл зачётки за|

| | |1 курс |

|1/3 всех занятий |13 |3,3 |

|половина |19 |4,0 |

|все занятия |18 |4,5 |

|Всего: |50 | |

Вывод: из таблицы видно, что зависимости между признаком-фактором и

признаком-результатом явной нет.

Группировка 3

Таблица 13

|Самообразование |Число студентов, чел |Средний балл зачётки за|

| | |1 курс |

|Посещали доп. курсы |25 |4,2 |

|Не посещали доп. курсы |25 |4,0 |

Вывод: не наблюдается явной зависимости между признаком-фактором и

признаком результатом.

Лабораторная работа № 2

Тема: Корреляционный анализ, множественная линейная регрессия.

Цель: выбор оптимальной модели многофакторной регрессии на основе анализа

различных моделей и расчитан для них коэффициентов множественной

детерминации и среднеквадратических ошибок уравнения многофакторной

регрессии.

Корреляционная матрица

Таблица 1

| |0 |1 |2 |3 |4 |

|0 |1 |0,572 |0,115 |0,486 |0,200 |

|1 |0,572 |1 |0,218 |0,471 |-0,112 |

|2 |0,115 |0,218 |1 |0,452 |-0,048 |

|3 |0,438 |0,471 |0,452 |1 |-0,073 |

|4 |-0,2 |-0,112 |-0,048 |-0,073 |1 |

Где х0 – средний балл зачётки (результат), х1 – посещаемость занятий, х2 –

самообразование (доп. курсы), х3 – подготовка к семинарским занятиям, х4 –

сон.

Введём обозначения признаков-факторов: 1 – посещаемость занятий на 1 курсе

(ч/нед); 2 – самообразование (ч/нед); 3 – подготовка к семинарским и

практическим занятиям (ч/нед); 4 – сон (ч/сут); 0 – средний балл зачётки по

итогам экзаменов за 1 курс.

Расчётная таблица для моделей многофакторной регрессии.

Таблица 2

|Модель многофакторной |R2 |E2 |

|регрессии | | |

|1-2-3-4 |0,39 |0,45 |

|1-2-3 |0,37 |0,46 |

|2-3-4 |0,23 |0,51 |

|1-3-4 |0,38 |0,45 |

|1-2 |0,33 |0,47 |

|1-3 |0,36 |0,46 |

|1-4 |0,35 |0,47 |

|2-3 |0,20 |0,52 |

|2-4 |0,05 |0,56 |

|3-4 |0,22 |0,51 |

По трём критериям выбираем оптимальную модель.

1. число факторов минимально (2)

2. max R, R = 0,36

3. min E, E = 0,46

Следовательно, оптимальной моделью является модель 1-3. Значит, признаки-

факторы «посещаемость занятий на 1 курсе» и «подготовка к семинарским

занятиям» влияют значительнее других факторов на признак-результат.

Среднеквадратическая ошибка уравнения многофакторной регрессии небольшая по

сравнению с ошибками, рассчитанными для других моделей многофакторной

регрессии.

Составляю для этой модели уравнение регрессии в естественных масштабах.

Х0/1,3 = a + b1x1 + b3x3

Корреляционная матрица.

Таблица 3

| |0 |1 |3 |

|0 |1,00 |0,57 |0,48 |

|1 |0,57 |1,00 |0,47 |

|3 |0,43 |0,47 |1,00 |

t0/1,3 = (1t1 + (3t3

0,57 = (1 + 0,47(3 0,57 = (1 + 0,47(0,44 – 0,47(1)

(1 = 0,4

0,44 = 0,47(1 + (3 (3 = 0,44 – 0,47(1

(3 = 0,25

t0/1,3 = 0,4t1 + 0,25t3

b1 = ((0 / (x1) (1 = (0,47 / 4,4) 0,4 = 0,071

b3 = ((0 / (x3) (3 = (0,79 / 2,68) 0,25 = 0,073

a = x0 – b1x1 – b3x3 = 4,27 – 0,071 ( 16,13 – 0,073 ( 4,08 = 2,8

имеем: х0/1,3 =2,8 + 0,071х1 + 0,073х3 – уравнение линейной множественной

регрессии.

R0/1,3 = ((1r01 + (3r03

R0/1,3 = (0,4 ( 0,58 + 0,25 ( 0,48 = 0,6

Вывод: коэффициент (1 говорит о том, что признак-результат—средний балл

зачётки за 1 курс на 0,4 долю от своего среднеквадратического отклонения

(0,4 ( 0,79 = 0,316 балла) при изменении признака-фактора—посещаемости на 1

курсе на одно своё СКО (4,4 ч/нед).

(3 – средний балл зачётки изменится на 0,25 долю от своего СКО (0,25 0,79

= 0,179 балла) при увеличении признака-фактора—подготовки к семинарским

занятиям на одно своё СКО (2,68 ч/сут).

Т. к. (1 < (3, следовательно фактор 1—посещаемость занятий влияет на

средний балл зачётки больше, чем фактор 3—подготовка к занятиям.

R2 говорит о том, что 36% общей вариации значений среднего балла зачётки на

1 курсе вызвано влиянием посещаемости и подготовки к занятиям. Остальные

60% вызваны прочими факторами.

R = 0,58 свидетельствует о том, что между посещаемостью занятий и

подготовкой к ним и средним баллом зачётки существует заметная линейная

зависимость.

Коэффициент b1 говорит о том, что если посещаемость занятий увеличится на

1 ч/нед, то средний балл зачётки увеличится в среднем на 0,071 балла, при

условии неизменности всех остальных факторов. b2 говорит о том, что если

подготовка к занятиям увеличится на 1 ч/нед, то средний балл зачётки в

среднем увеличится на 0,073 балла.

(1 = 0,4

(3 = 0,25

r01 = 0,52

r03

= 0,44

r13 = 0,47

Граф связи признаков-факторов: х2 – подготовки к семинарским занятиям,

ч/нед; х1 - посещаемости занятий, ч/нед с признаком-результатом х0 –

средним баллом зачётки по итогам экзаменов за 1 курс.

(1 – мера непосредственного влияния на признак-результат посещаемости

занятий.

(3 – мера непосредственного влияния подготовки к занятиям на средний балл

зачётки.

r01 = (1 + r13(3, где r01 – общее влияние х1 на r13(3 – мера

опосредованного влияния х1 через х3 на х0.

r01 = 0,4 + 0,47 ( 0,25 = 0,52

r03 = (3 + r31(1, где r03 – общее влияние х3 на r31(1 – мера

опосредованного влияния х3 через х1 на х0.

Лабораторная работа № 3.

Тема: «Дисперсионное отношение. Эмпирическая и аналитическая регрессии.»

Цель: выявление зависимости между признаками-факторами и признаком-

результатом.

Таблица с исходными данными.

Таблица 1

|Средний балл |Посещаемость |Самообразование |Подготовка к |

|зачётки по |занятий на первом |(доп. Курсы) |семинарским |

|итогам |курсе (ч/нед) |(ч/нед) |занятиям (ч/нед) |

|экзаменов за | | | |

|1-ый курс | | | |

|(баллы) | | | |

|4,7 |19,5 |0 |5 |

|4,5 |22 |2 |6 |

|4,2 |22 |0 |2 |

|4,3 |19,5 |0 |7 |

|4,5 |17,5 |0 |3 |

|4,2 |9,5 |6 |12 |

|4,0 |12,5 |0 |5 |

|4,7 |22 |4 |7 |

|4,6 |17,5 |3 |4 |

|4,7 |9,5 |0 |2 |

|4,5 |11,5 |6 |3 |

|4,0 |11,5 |2 |3 |

|4,2 |19,5 |4 |8 |

|4,0 |20,5 |6 |9 |

|3,2 |9,5 |0 |0 |

|4,0 |17,5 |0 |8 |

|3,2 |14,5 |0 |2 |

|3,5 |14,5 |0 |2 |

|4,8 |22 |0 |10 |

|4,6 |8,5 |0 |1 |

|4,5 |22 |0 |4 |

|4,5 |22 |6 |2 |

|4,2 |17,5 |4 |4 |

|4,5 |14,5 |6 |4 |

|4,2 |11,5 |2 |2 |

|4,8 |17,5 |0 |4 |

|4,0 |10,5 |0 |2 |

|4,2 |17,5 |2 |6 |

|3,0 |9,5 |0 |0 |

|4,8 |19,5 |2 |2 |

|4,8 |19,5 |2 |6 |

|4,3 |17,5 |4 |2 |

|3,2 |6,0 |0 |0 |

|4,5 |22 |2 |5 |

|4,7 |22 |4 |3 |

|4,2 |22 |3 |5 |

|4,6 |9,5 |0 |1 |

|3,0 |14,0 |0 |2 |

|3,0 |6,5 |0 |5 |

|4,0 |22 |2 |5 |

|4,7 |17,5 |6 |0 |

|3,5 |11,5 |0 |6 |

|4,7 |22 |6 |2 |

|4,5 |22 |0 |0 |

|3,2 |17,5 |4 |8 |

|4,8 |22 |0 |0 |

|3,2 |9,5 |0 |5 |

|4,5 |17,5 |0 |3 |

|3,0 |14,5 |5 |3 |

|4,7 |11,5 |5 |3 |

Рассматриваю первую пару признаков: признак-фактор—посещаемость занятий на

1 курсе (ч/нед) и признак-результат—средний балл зачётки по итогам

экзаменов за 1 курс (баллы). Далее обосную взаимосвязь между ними.

Расчётная таблица №1

Таблица 2

|Посещаемость|Число |xi |yi |(yi |(2yi |(2yi |yi - y|(yi–y)|

|занятий |наблюде| | | | |(i | |2(I |

|(ч/нед) |ний | | | | | | | |

|[6-10] |9 |8,6 |3,7 |0,71 |0,5 |4,5 |-0,5 |2,25 |

|[10-14] |8 |11,5 |4,1 |0,38 |0,14 |1,12 |-0,1 |0,08 |

|[14-18] |15 |16,4 |3,7 |1,01 |1,02 |15,3 |-0,5 |3,75 |

|[18-22] |18 |19,6 |4,4 |0,31 |0,09 |1,62 |0,4 |2,88 |

|Сумма |50 |- |- |- |- |22,54 |- |8,96 |

|Средняя |- |15,3 |4,0 |- |- |5,6 |- |2,24 |

(2y = (((yi–y)2(I)

( 2y = 8,96 / 50 = 0,1792 (балла)2

E2y= ((б2yi(I) / ((I

E2y = (4,5 + 1,12 + 15,3 + 1,62) / 50 = 0,4508(балла)2

б2y = E2y + ( 2y = 0,4508 + 0,1792 = 0,63 (балла)2

(2 = ( 2y / б2y = 0,1792 / 0,63 = 0,28 (0,28%)

построение аналитической регрессии.

yx = a + bx

xy = ((xy(I) / ((I = 62,52

б2x = 19,4 (ч/нед)2

b = (xy – x y) / б2x = (62,52 – 15,3 ( 4,0) / 19,4 = 0,068

a = y – bx = 4,0 – 0,068 ( 15,3 = 2,96

Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс

от посещаемости: строим по двум точкам

yx = 2,96 + 0,068х

1. yx = 2,96 + 0,068 ( 6 = 3,358

2. yx = 2,96 + 0,068 ( 22 = 4,446

rxy = (xy – x y) / бxбy = 0,37

Корреляционное поле

Эмпирическая линия регрессии

Аналитическая линия регрессии

Распределение среднего балла зачётки за 1 курс по признаку-

фактору—посещаемости занятий на 1 курсе.

Вывод: (2 свидетельствует о том, что 28% общей вариации результативного

признака вызвано влиянием признака фактора—посещаемостью. Остальные 72% -

вызваны влиянием прочих факторов. Можно сказать, что это слабая

корреляционная зависимость. Интерпретируя параметр b, предполагаем, что для

данной совокупности студентов с увеличением посещаемости занятий на 1 курсе

на 1 ч/нед средний балл зачётки увеличивается на 0,068 балла. rxy говорит о

том, что между признаком-результатом и признаком-фактором заметная линейная

связь.

Рассматриваю вторую пару признаков:

Расчётная таблица № 2.

Таблица 3

|Подготовка|Число |xi |yi |(yi |(2yi |(2yi |yi - y|(yi–y)|

|к |наблюде| | | | |(i | |2(i |

|семинарски|ний | | | | | | | |

|м занятиям| | | | | | | | |

|(ч/нед) | | | | | | | | |

|[0-3] |20 |1,2 |3,78 |0,63 |0,39 |7,8 |-0,22 |0,96 |

|[3-6] |18 |4,0 |4,31 |0,45 |0,2 |3,6 |0,31 |1,72 |

|[6-9] |9 |6,8 |4,46 |0,28 |0,07 |0,63 |0,46 |1,9 |

|[9-12] |2 |9,5 |4,4 |0,399 |0,15 |0,3 |0,4 |0,32 |

|Сумма |50 |- |- |- |- |2,33 |- |4,9 |

|средняя |- |3,5 |4,0 |- |- |3,08 |- |1,2 |

(2y = (((yi–y)2(I)

( 2y = 4,9 / 50 = 0,098 (балла)2

E2y= ((б2yi(I) / ((I

E2y = 12,33 / 50 = 0,25 (балла)2

б2y = E2y + ( 2y = 0,35 (балла)2

(2 = ( 2y / б2y = 0,098 / 0,35 = 0,28 (0,28%)

( = 0,53

построение аналитической регрессии.

yx = a + bx

xy = ((xy(I) / ((I

xy = 15,2

б2x = 7,2 (ч/нед)2

b = (xy – x y) / б2x = (15,2 – 3,5 ( 4,0) / 7,2 = 0,16

a = y – bx = 4,0 – 0,16 ( 3,4

Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс

от подготовки к семинарским занятиям:

yx = 2,96 + 0,068х

x = 0 y = 3,4

x = 7 y = 4,5

rxy = (xy – x y) / бxбy = (15,2 – 14) / 2,6 = 0,46

Корреляционное поле

Эмпирическая линия регрессии

Аналитическая линия регрессии

Распределение среднего балла зачётки за 1 курс по признаку-

фактору—подготовке к семинарским занятиям.

Вывод: (2 свидетельствует о том, что 28% общей вариации результативного

признака вызвано влиянием признака фактора—подготовкой к семинарским

занятиям. Остальные 72% - вызваны влиянием прочих факторов. Можно сказать,

что это слабая корреляционная зависимость. Интерпретируя параметр b,

предполагаем, что для данной совокупности студентов с увеличением

подготовки к занятиям на 1 курсе на 1 ч/нед средний балл зачётки

увеличивается на 0,16 балла. rxy говорит о том, что между признаком-

результатом и признаком-фактором есть умеренная линейная связь.

Рассматриваю третью пару признаков:

Расчётная таблица № 3

Таблица 4

|Самообразовани|Число |xi |yi |(yi |(2yi |(2yi |yi - y|(yi–y)|

|е (ч/нед) |наблюд| | | | |(i | |2(i |

| |ений | | | | | | | |

|0 |25 |0 |4,07 |0,68 |0,46 |11,5 |-0,03 |0,022 |

|2 |8 |2 |4,38 |0,3 |0,09 |0,72 |0,28 |0,62 |

|3 |2 |3 |4,40 |0,2 |0,04 |0,08 |0,3 |0,18 |

|4 |6 |4 |4,22 |0,5 |0,25 |1,5 |0,12 |0,08 |

|5 |2 |5 |3,35 |0,35 |0,12 |0,24 |-0,75 |1,16 |

|6 |7 |6 |3,3 |0,40 |0,16 |1,12 |0,2 |0,28 |

|Сумма |50 |- |- |- |- |15,88 |- |2,34 |

|средняя |- |1,96 |4,1 |- |- |0,31 |- |0,39 |

(2y = (((yi–y)2(I)

( 2y = 2,34 / 50 = 0,046 (балла)2

E2y= ((б2yi(I) / ((I

E2y = 15,88 / 50 = 0,31 (балла)2

б2y = E2y + ( 2y = 0,31 + 0,046 = 0,36 (балла)2

(2 = ( 2y / б2y = 0,046 / 0,36 = 0,13 (13%)

( = 0,36

построение аналитической регрессии.

yx = a + bx

xy = ((xy(I) / ((I

xy = 8,22

б2x = 5,1 (ч/нед)2

b = (xy – x y) / б2x = (8,22 – 8,036) / 5,1 = 0,032

a = y – bx = 4,1 – 0,032 ( 1,96 = 4,03

Линейное уравнение регрессии зависимости среднего балла зачётки за 1 курс

от самообразования:

yx = 2,96 + 0,068х

x = 0 y = 3,4

x = 7 y = 4,5

rxy = (xy – x y) / бxбy = (8,2 – 8,036) / 2,25 ( 0,6 = 0,12

Корреляционное поле

Эмпирическая линия регрессии

Аналитическая линия регрессии

Вывод: (2 свидетельствует о том, что 13% общей вариации результативного

признака вызвано влиянием признака фактора—самообразованием. Можно сказать,

что это очень слабая корреляционная связь. Зная коэффициент b,

предполагаем, что для данной совокупности студентов с увеличением

самообразования на 1 ч/нед средний балл зачётки увеличивается на 0,032

балла. rxy говорит о том, что между признаком-результатом и признаком-

фактором есть слабая прямая линейная связь.

Министерство Высшего Образования РФ

Санкт-Петербургский Государственный Инженерно-Экономический Университет

Лабораторные работы

По статистике

Студентки 1 курса

Группы 3292

Специальность коммерция

Харькиной Анны.

Преподаватель: Карпова Г. В.

Оценка:

СПб 2001

-----------------------

Х1

[pic]

Х0

Х3

рефераты
© РЕФЕРАТЫ, 2012

рефераты