Guide Book Analyze Phase Analyze 1 Rev 0
프로젝트 실습교육 Guide Book Ⅳ. Analyze Phase Analyze - 1 Rev. 0 - 0501
Analyze 목차 3. 1 데이터 수집 3. 2 데이터 분석 3. 3 Vital Few X’s 선정 Analyze - 2 Rev. 0 - 0501
Analyze 4 -1. 데이터 수집 Analyze - 6 Rev. 0 - 0501
Analyze 4 -2. 데이터 분석 Analyze - 11 Rev. 0 - 0501
그래프 분석 “항상 데이터를 두 가지 이상 그래프로 그려보자” “좋은 그림은 백마디 말보다 가치 있다” 주요 그래프 유형 분포 비교 : Scatter plot, Marginal plot, Matrix plot, Box plot 분포 파악 : Dot plot, Histogram 시간적변화 : Time series plot 종합정보 : Display Descriptive Statistics 기타 : Pie Chart, 3 D Plot, Variable: Re Call Anderson-Darling Normality Test A-Squared: 1. 479 P-Value: 0. 001 0 10000 20000 30000 40000 50000 Mean St. Dev Variance Skewness Kurtosis N Minimum 1 st Quartile Median 3 rd Quartile Maximum 95% Confidence Interval for Mu Contour Plot 31219. 1 15190. 8 2. 31 E+08 -9. 3 E-01 -2. 2 E-01 30 2132. 0 23659. 5 34895. 0 44313. 5 49640. 0 95% Confidence Interval for Mu 25546. 8 36891. 5 25000 30000 35000 95% Confidence Interval for Median 40000 95% Confidence Interval for Sigma 12098. 0 20421. 2 95% Confidence Interval for Median 31108. 4 40037. 8 Analyze - 14 Rev. 0 - 0501
Analyze 4 -3. Vital Few X’s 선정 Analyze - 17 Rev. 0 - 0501
Vital Few X’s 선정 q 잠재 원인인자(X’s)를 검증하여 CTQ에 영향을 주는 핵심적인 몇 개의 인자를 찾고 영향을 정량화함 정성적, 정량적 분석 Y=f(x 1, x 2…) 파레토도 Y 유의한 원인변수 C&E Diagram 사람 환경 Y PIPE PC’s 개정요인 X Input Variable Process Variable 가설 검정 Two-sample T for #1 Dock vs #2 Dock N Mean St. Dev SE Mean #1 25 51. 909 0. 755 0. 15 #2 25 51. 065 0. 690 0. 14 P-Value = 0. 000 DF = 48 Both use Pooled St. Dev = 0. 723 절차 방법 유의한 인자 1 유의한 인자 2 Chi-Square Test 1 2 1팀 2팀 Total 550 600 1450 537. 18 602. 18 12 24. 82 30 67 27. 82 Total 562 630 1517 DF = 2, P-Value = 0. 000 유의한 인자 3 . . . Vital Few X’s 확정 Analyze - 19 Rev. 0 - 0501
Analyze 기본 Tools 1. 1. 그래프 분석 2. 2. t-Test 3. 3. F-Test 4. 4. ANOVA 5. 5. Chi-square 6. 6. 단순 회귀분석 7. 7. 비수치적 분석 8. 벤치 마킹 Analyze - 21 Rev. 0 - 0501
DMAIC 기본 Tools A-1. 그래프 분석 Analyze - 22 Rev. 0 - 0501
Histogram q 데이터의 구간을 구분하여 분포형태와 중심위치 및 산포를 보여 주 며 막대 그래프와는 달리 연속형 자료에 대한 분포모양을 볼 수 있다. 예제 1 다음은 블록 용접부의 인장강도에 미치는 원인들을 찾기 위해 우선 예열온도를 조사한 데이터이다. 데이터를 이용하여 히스토그램을 작성하여 보자. 35. 1981 33. 9015 33. 5145 34. 9771 36. 2131 36. 0891 35. 6352 34. 4051 34. 3717 35. 2188 35. 4727 33. 7525 34. 2916 34. 7394 35. 8707 36. 3496 35. 3812 34. 1875 34. 4132 35. 0004 35. 0595 34. 0051 34. 4985 35. 1947 35. 9832 36. 0549 35. 0877 34. 5096 34. 7903 34. 9291 34. 9729 34. 1707 34. 1336 35. 1619 36. 1740 36. 1022 34. 8158 34. 3182 34. 9028 35. 5452 35. 0336 33. 9961 34. 1674 35. 3287 36. 2067 35. 7226 34. 8197 34. 0066 34. 1018 35. 6916 34. 8429 34. 4750 34. 4210 35. 3215 36. 3826 36. 0135 34. 2750 33. 9709 34. 1923 35. 6217 34. 7256 34. 4570 34. 2714 35. 7153 36. 3475 35. 6486 34. 7564 34. 1441 34. 2105 35. 9447 34. 4073 34. 0926 34. 9350 35. 9855 35. 6419 35. 5985 34. 7606 34. 3071 34. 7218 35. 8260 (예열온도(히스토그램). mtw) Analyze - 26 Rev. 0 - 0501
Histogram l 단계 1. 워크시트에 데이터 입력 l 단계 2. Graph > Histogram 데이터 열 선택 Analyze - 27 Rev. 0 - 0501
Pareto Chart l 단계2. Stat > Quality Tools > Pareto Chart • Chart defects table 을 선택 - Labels in 란에 항목 - Frequencies in 란에 빈도 에 해당하는 열을 선택 Pareto Chart의 제목 Analyze - 42 Rev. 0 - 0501
Pareto Chart Stat > Quality Tools > Pareto Chart □ 방법 2 데이터 분석 조건입력 분석 결과 Analyze - 44 Rev. 0 - 0501
Pareto 데이터 Chart Stat > Quality Tools > Pareto Chart 분석 조건입력 Analyze - 45 Rev. 0 - 0501
Pareto Chart Analyze - 46 Rev. 0 - 0501
Pie Chart l 단계 3. 미니탭 실행 결과 Analyze - 49 Rev. 0 - 0501
산점도(Plot) l 단계2. Graph > Plot 변수 입력 Analyze - 52 Rev. 0 - 0501
Time Series Plot l 단계2. Graph > Time Series Plot Date/time Stamp : Date/Time 형태의 열 선택 Calendar : 시간 간격을 지정 Y 변수 열 선택 시작 시점 지정 Analyze - 56 Rev. 0 - 0501
DMAIC 기본 Tools A-2, 3. F-Test, t-Test Analyze - 58 Rev. 0 - 0501
Analyze - 62 Rev. 0 - 0501
정규성 검정 q 사용절차(방법) • Stat → Basic Statistics → Normality Test • Data는 아래의 Worksheet와 같이 Column 기준으로 입력 • Stat → Basic Statistics → Normality Test 1 2 No 입력항목 1 Variables 입력내용 데이터가 입력되어 있는 Column선택 • Anderson-Darling(일반적으로 사용) 2 Test for Normality 경험적 누적분포 함수에 기초한 Test • Ryan-Joiner : 상관관계에 기초한 Test • Kolmogorov-Smirnov : 카이제곱에 기초한 Test Analyze - 75 Rev. 0 - 0501
분산검정 [ Session Window 분석결과 ] Test for Equal Variances Level 1 Level 2 Conf. Lvl • Data 수집현황에 대 한 정보 A company B company 95. 0000 Bonferroni confidence intervals Lower Sigma Upper 4. 49 E-02 5. 20 E-02 0. 061793 7. 48 E-02 8. 68 E-02 0. 103092 for standard deviations N Factor Levels 100 A company 100 B company F-Test (normal distribution) Test Statistic: 0. 359 P-Value : 0. 000 Levene's Test (any continuous distribution) Test Statistic: 24. 250 P-Value : 0. 000 Analyze - 81 • 개별집단에 대한 95% 신뢰구간 및 분산에 대한 분석 정보 제공 • F 및 Levene's test는 분산 의 동질성을 분석하기 위한 방법이며 전부 P 값 에 의하여 해석을 함 (P-Value가 0. 05보다 적을 경우 분산의 유의한 차이가 있음) Rev. 0 - 0501
DMAIC 기본 Tools A-4. 분산분석(ANOVA) Analyze - 94 Rev. 0 - 0501
ANOVA 단계 3 : ANOVA표의 작성 Minitab: Stat > ANOVA > One-way 잔차/적합치 선택 그래프 선택 Analyze - 104 Rev. 0 - 0501
ANOVA 단계 5 : 잔차 분석 모델의 적합성 검정(Error에 대한 가정은 유효한가 ? ) Minitab: Stat > Regression > Residual Plots Analyze - 108 Rev. 0 - 0501
DMAIC 기본 Tools A-5. 이산형 데이터의 가설검정 Analyze - 111 Rev. 0 - 0501
Chi-square 검정 • 미니탭 분석 Chi-Square Test: 기계1, 기계2, 기계3, 기계4 1 2 Total 기계1 6 10. 80 기계2 14 9. 20 기계3 13 12. 00 기계4 7 8. 00 Total 40 48 43. 20 32 36. 80 47 48. 00 33 32. 00 160 40 200 54 46 60 Chi-Sq = 2. 133 + 2. 504 + 0. 083 + 0. 125 + 0. 533 + 0. 626 + 0. 021 + 0. 031 = 6. 058 DF = 3, P-Value = 0. 109 • 결론 p-value( = 0. 109) > 유의수준 0. 05 이므로 H 0를 기각할 수 없다. 즉 기계에 따라 불량률이 다르다고 할 수 없다. Analyze - 116 Rev. 0 - 0501
Chi-square 검정 • 미니탭 분석( p-Value 계산 Chi-Square Test: A, B 1 A 65 58. 19 B 53 59. 81 Total 118 2 59 66. 57 76 68. 43 135 3 48 44. 87 43 46. 13 91 4 43 45. 37 49 46. 63 92 Total 215 221 436 Chi-Sq = 0. 797 + 0. 218 + 0. 776 + 0. 212 + 0. 861 + 0. 123 + 0. 838 + 0. 120 = 3. 945 DF = 3, P-Value = 0. 267 • 결론 p-value( = 0. 267) > 유의수준 0. 05 이므로 H 0를 기각할 수 없다. 즉 지역에 따라 기호도가 다르다고 할 수 없다. Analyze - 118 Rev. 0 - 0501
Chi-square 검정 • 미니탭 분석( p-Value 계산 Chi-Square Test: A, B, C, D 1 A 22 12. 30 B 22 18. 00 C 10 20. 70 D 6 9. 00 Total 60 2 11 15. 58 18 22. 80 36 26. 22 11 11. 40 76 3 8 13. 12 20 19. 20 23 22. 08 13 9. 60 64 Total 41 60 69 30 200 Chi-Sq = 7. 650 1. 346 1. 998 DF = 6, P-Value + 0. 889 + + 1. 011 + + 0. 033 + = 0. 000 5. 531 + 3. 648 + 0. 038 + 1. 000 + 0. 014 + 1. 204 = 24. 362 • 결론 p-value( = 0. 000) < 유의수준 0. 05 이므로 H 0를 기각할 수 있다. 고등학교 내신성적이 대학 1학년 성적과 관계가 있다고 할 수 있다. Analyze - 120 Rev. 0 - 0501
Chi-square 검정 - Minitab : Stat > Tables > Chi-Square Test 데이터 입력 Analyze - 123 Rev. 0 - 0501
Chi-square 검정 - p-value 계산( 미니탭 실행 결과 ) Chi-Square Test: A 사, B 사, C 사, D 사, E 사 Expected counts are printed below observed counts 1 A 사 B 사 C 사 D 사 E 사 Total 13 5 8 21 43 90 11. 53 7. 60 19. 37 31. 39 20. 11 2 18 19. 08 10 12. 59 36 32. 07 56 51. 97 29 149 33. 29 3 16 16. 39 16 10. 81 35 27. 55 51 44. 64 10 128 28. 60 47 31 79 Total 128 82 367 Chi-Sq = 0. 189 + 0. 891 + 6. 677 + 3. 439 + 26. 058 + 0. 061 + 0. 531 + 0. 481 + 0. 313 + 0. 553 + 0. 009 + 2. 489 + 2. 013 + 0. 905 + 12. 096 = 56. 705 DF = 8, P-Value = 0. 000 p-Value Analyze - 124 Rev. 0 - 0501
DMAIC 기본 Tools A-6. 상관분석 및 회귀 분석 Analyze - 126 Rev. 0 - 0501
회귀분석(Regression) q R 2 이 의미하는 것은 ? Regression Plot Y = 182. 807 + 0. 476288 X R-Sq = 0. 695 420 R 2 = 0. 695 410 400 Customer 390 즉, 회귀 공식으로 산포의 69. 5% 가 설명될 수 있다는 것이다. 380 370 360 350 산포의 31. 5%는 다른 원인으로 인한 것이다. 340 330 320 350 400 450 Supplier Analyze - 136 Rev. 0 - 0501
회귀분석(Regression) Step 1 워크시트에 데이터 입력 Step 2 Stat > Regression 출력변수열 선택 입력변수열 선택 (Regression. mtw) Analyze - 138 Rev. 0 - 0501
회귀분석(Regression) 회귀방정식의 적합성 여부 평가 해석 방법은? Regression > Regression… The regression equation is Evap = 0. 069 + 0. 00383 Velocity Predictor Coef St. Dev Constant 0. 0692 0. 1010 Velocity 0. 0038288 0. 0004378 S = 0. 1591 R-Sq = 90. 5% 결정계수(R-Sq) = SSR / SST ← 회귀방정식 T 0. 69 8. 75 = 1. 9351/2. 137 P 0. 512 0. 000 R-Sq(adj) = 89. 3% Analysis of Variance Source DF Regression 1 Residual Error 8 Total 9 SS 1. 9351 0. 2024 2. 137 MS 1. 9351 0. 0253 F 76. 49 P 0. 000 S = MS_Residual Error = √ 0. 0253 = 0. 1591 ① s(표준편차) 값은? : 절대지수로써 큰지 작은지는 엔지니어가 판단한다. ② R-sq(때로는 R-sq(adj)값은 ? : 65% 이상이면 적합하다. (클수록 더 적합) ③ ANOVA의 P 값은? : 0. 05 이하면 유의하다. (유의수준 5%일 때) ④ 잔차 분석을 하여 잔차의 특성에 적합해야한다. ( 잔차의 특성 : 정규성, 독립성, 렌덤성) Analyze - 143 Rev. 0 - 0501
회귀분석(Regression) Step 2 그래프 결과 확인 Analyze - 145 Rev. 0 - 0501
회귀분석(Regression) Step 2 Stat > Regression 종속변수열 선택 독립변수열 선택 • Storage Residuals(잔차) 체크 Fits(적합값) 체크 Analyze - 148 Rev. 0 - 0501
회귀분석(Regression) Step 3 워크시트 결과 확인 Step 4 Stat > Regression > Residual Plots 적합값열 선택 잔차와 적합값이 저장 됨 잔차열 선택 Analyze - 149 Rev. 0 - 0501
회귀분석(Regression) Step 5 그래프 확인 Analyze - 150 Rev. 0 - 0501
DMAIC 기본 Tools A-7. 비수치적 분석 Analyze - 152 Rev. 0 - 0501
- Slides: 160