斯瑞通科技开发有限公司

輕鬆學統計(3)

    1.學以致用
     

        第三次上課的進度是『統計的推定』,以前作菜鳥老師時,一上課一定先正經八百的在黑板上先寫下這五個字,這是什麼東東?學生暗自滴咕,這一滴咕教室的氣氛馬上涼了一半,等到學生們的學習熱情被澆熄之後,才再來冷灶熱燒,那就累了。

        教書教久了,才體會到一上課最好先把場子炒熱,這樣教到主題才會事半功倍,所以先丟個可以暖場的問題給他們。

      『你們知不知道在美國統計專家密度最高的城市是那一個?』
      ???!!!大家既有興趣卻又茫然。

      『猜猜看嘛!』試著再鼓勵他們
       
      『老師,可不可以給一點提示?』又開始討價還價了。
      『好,那個城市在沙漠之中,雖然不大但國際馳名』
      『是不是拉斯維加斯?』馬上有人興奮搶答。
      『答對了,但是為什麼那個鳥不生蛋的地方會吸引一票統計專家呢?』
      『是不是和賭有關?』
      『對!但是賭和統計有什麼關係呢?』
      『如果能設計一種遊戲讓大家都認為自己很容易贏,那就會吸引一票傻蛋。』
       
      『沒錯,那些在賭城的統計專家,其實就是專門幫賭場設計那些表面看起來吸引力十足,但事實上莊家最後必贏的遊戲,由此可見統計並不只是艱深的理論,它更可以應用在生活之中,所以今天就讓我們來想一想如何將統計用在工廠之中好嗎?』
       
      『好!』大家都顯得興奮莫名,這十足表現了中國人見賭心喜的本性。
      『那你們認為在工廠中會賭那些事呢?』
      『賭“席芭啦”!』這個回答馬上引起全班哄堂大笑。
      『賭“席芭啦”,你瘋啦!工廠不但不感激你還會開除你,如果你不想被開除那麼還是趁早賭點正經的。』

      再逼著剛才那位搗蛋鬼把聰明用上正途,他把手上的原子筆當作竹蜻蜒轉了兩圈之後,若有所悟──

      『在生管單位決定發料數量時,他們是不是會先賭一下這批產品的良品率?』
      『沒錯,這是正經賭法之一,但是統計還有沒有其他的用途呢?』同學又陷入了沈思,沈思後有人靈光一閃──
      『老師,會不會有的公司要賭一下產品出廠後的平均使用壽命,以免將來客戶抱怨連連?』
       
      『太棒了,這件事不但要賭,而且還要算的非常精確,不然很可能就會大禍臨頭,歸納剛才兩位同學的想法,我們可以發現一個共同點,那就是他們都在想一個如何用統計來作預測的問題,這種用統計來作預測的問題,術語就叫做“推定”(Estimation)』。

    輕鬆學統計(3)                                       張忠樸著

    2.未卜先知
     

        『在統計應用上,推定佔了一席非常重要的地位,尤其像在訂貨生產的公司,如果生管無法推定出報廢率來作發料寬放的依據,那麼不是會造成無效良品的麻煩,就是會搞出數量不足延誤出貨的飛機,前者會造成資金的浪費,後者會引起客戶的抱怨,都很糟糕的事,為了不要將來倒楣,所以讓我們現在就來學推定好不好?』

      『好!』學生的眼睛慢慢亮了起來,但是我卻反而不想馬上讓他們如願以償,因為Easy Coming, Easy Go本來就是教學大忌。所以決定先拿一個問題來釣他們──

      『請問推定和憑空瞎猜有什麼不同?』
      『憑空瞎猜可以毫無根據,但是推定可能需要嚴謹一點』
      『請問您說嚴謹是什麼意思?』
      『就是說推定的值要先有一些根據』
      『你的意思是不是說,被推定的未知狀況必須要先根據一些看得見的己知結果而來?』
      『對!我就是這種想法』
      『好極了,剛才這位同學的想法其實就是推定的起點,任何推定都必須先根據一些樣本的數據來作推衍的基礎,我們不妨先來看一個例子』
       
      某公司希望能預測其產品厚度之範圍,試問應如何下手?及考慮那些因素?

        假設已量測25個成品,其厚度分別為(單位:mm):

      53  48 54 51 48
      52 46 50 51 49
      47 55 52 53 47
      51 50 50 48 52
      50 48 52 49 47

          參考此數據在若95%的把握下,請問該公司成品平均厚度在何範圍內?

      『現在我們有了25組數據,那麼請問下一步我們該怎麼辦?』
      『計算』他們已很清楚的瞭解統計就是數據透過計算產生出有意的情報。
      『沒錯,此例經過計算之後我們得到= 50.12
                                      σ= 2.403
      接下來下一步該怎麼辨呢?』
       
      『老師,下一步是不是就要回答95%的產品厚度範圍有多寬了?』
      『沒錯,但是這該如何推測』
      『老師,如果您能夠告訴我們95%的產品被含蓋在幾個σ之內,我們就可以推測出它的範圍』
       
      利害!利害!這個學生不但學會了用反問法來脫身這一招,而且反問的還是一個命中要害的問題,但是老薑當然自有辣法,所以仍要四兩撥千金一下──
       
      『這位同學的想法的確很高明,他的想法是機率和多少個σ之間一定會有關係,而且彼此一定可以換算,這個想法其實就是常態分配機率論的基礎,因此現在讓我們來看一下常態分配機率表(如附表一),這個表的縱軸是到小數點第一位的σ個數值,橫軸則是小數點第二位的σ個數值,而表內的數字就是圖中斜線區的機率,現在請大家一起來想一想95%的產品應含蓋在多少個σ之內?』
       
      同學們紛紛努力思索,個個都想拔頭籌,結果居然還是剛才反問我的學生找到了答案。
       
      『老師,是1.96個σ』他與奮的大叫。
      『沒錯,但是您是如何找到的呢?』
      『老師,我先算出斜線的機率是2.5%也就是0.025,然後我就查表.......』
      『等一下』我先打斷他的話,『能不能請你先說明一下0.025的來龍去脈?』
      『老師,因為這個題目要預測的範圍95%,而斜線區正代表此範圍之外的機率,因此兩邊斜線區加起來的機率應該是5%(100% - 95%),而如果我們假設左右斜線區各佔一半,那麼單一斜線區的機率,就是2.5%也就是0.025』
      『很好,然後呢?』
      『然後我就先在常態分配機率表中找到0.025這個數字。從這個數字往左看對應的縱軸數字是1.9,而往上對應的橫軸數字是6.0,參考老師剛才的說明,我就得到了1.96個σ的答案。』
       
        他一面說明,其他的同學紛紛點頭,看到這種感人的場景,我不禁明白其實在學習中導引學生領悟,反而比口沫橫飛的填鴨法還更有效呢!
       
        看到學生都若有所悟,這時該給他們更大的成就感,『既然,大家都已明白95%的產品是被含蓋在±1.96個σ之內,所以我們現在可以更確實地回答原來的問題了嗎?』
       
      『老師,95%產品的平均厚度會落在 50.12 ±1.96x2.403 之間』大家幾乎是異口同聲地回答了這個在15分鐘之前還摸不著頭緒的問題,這真是學習的一大興趣。

       

    輕鬆學統計(3)                                       張忠樸著
     
    3.康莊大道
     
        用實例可以幫助我們走過前人推理的思維過程,但是實例仍然有它的限制性,因此若要能舉一反三觸類旁通,那就必須在大家明白實例之後,再將其中的精華從表象中抽離出來(這就所謂的抽象),成為一種可以反覆運用的模型,因此,必須利用學生破解例子後興高彩烈的時刻,順便將他們帶入推定的理論模型。

      『同學們,你們希望將來無論遇到任何統計推定的問題時都能迎刃而解嗎?』
      『希望』興奮的回應。
      『那我們來重新整理一下剛才的過程好嗎?』
      『好!』
      『請回想一下,剛才這個過程和我們的第一節統計課有什麼關係?』
      『老師,整個討論好像還是延著I→P→O 的過程在進行嘛!』一位平常蠻沈默的同學倒先發言了。
      『好極了,這是正確的觀察,於是又在黑板上畫出了。
      I→P→O程序圖,只是比以前又多加上三個空的框框
       
       

           

       
      然後,反身問同學
      『你們猜老師剛才多加的框框內該填什麼?』
       
      『老師,答對了有沒有獎品?』教室氣氛一好,同學居然會開始撒嬌了。
      『跟我來這套!當然有獎品啊!答對的,下課時,可以先來擦黑板。』吐嘈回去,反而逗得全班同學大樂。
      『請問您還要不要先搶答?』
      『老師,如果擦黑板是獎品,那擦黑板也沒有關係,我猜第一個框框內應該填“樣本值”也就是剛才那個例子中的25個樣本的厚度值。』
      『答對了,請大家給這位自告奮勇擦黑板的同學掌聲鼓勵好不好?』熱烈的掌聲讓那位同學好不得意。
      『那麼第二個框框內該填什麼呢?』
       
      馬上有同學舉手,我故意逗他『你也想來擦黑板啊?』他嘿嘿傻笑,真是老實的可愛,於是幫他解圍──
       
      『好,那請你先告訴大家你認為第二個框框內該填什麼?』
      『該填統計量就是和σ』連回答都很老實。
      『又答對了!』這時同學的掌聲己自動響起,真是一群會互相鼓勵的學生。
       
      『那第三個框框該填什麼呢?』這個問題似乎讓有些同學很為難,看到他們痛苦的表情,不免又大動側隱之心,於是說:『老師也想擦黑板,所以最後一個框框可不可以由老師替大家來回答?』
      『老師,沒有關係,你替我答,我替你擦黑板』一位同學馬上很阿莎力的回應。
      『好,那我們一言為定,第三個框框請填“推定結論”也可直接寫成“95%的產品厚度在±1.96σ的範圍內”』順便我又在黑板的另一邊寫下“推定的步驟”五個大字,然後轉身告訴同學──
       
      『剛才三個框框的推理過程其實就是統計推定的步驟。』
      然後我轉身在黑板上寫上:

      步驟1. 隨機抽取樣本
      步驟2. 計算統計量(,σ)
      步驟3. 作出推定結論,下結論時可再細分成兩步驟
      步驟3A.決定信賴水準(Level of Confidence ,此例為95%)
      步驟3B.決定信賴區間(Confidence interval ,此例即為±1.96σ)

      『請各位記得這幾個步驟,那麼將來無論你們遇到什麼推定的問題都可以很容易地迎刃而解了』
      『由於各位上課很認真尤其又肯熱烈參與討論,所以我再送各位一套錦囊,好不好?』
      『老師,那我也替你來擦黑板』嚴肅的班長居然也學會幽默了,這下非傾囊相授不可,打開投影機,影幕上出現了──
       
       
      常用信賴區間與σ個數對照表

           信賴水準          含蓋σ個數          信賴區間

       
                90%      1.645      ±1.645σ
                95%      1.96        ±1.96σ
                99%      2.575      ±2.575σ
                99.73%       3          ±3 σ

       
      『這張表其實就是從剛才的常態分配機率表上整理出來的,如果將來各位碰上一些特殊的信賴水準,只要回去查表也一定會得到答案的。』
       

    輕鬆學統計(3)                                       張忠樸著
     
    4.精益求精
     
        雖然下課時間快到了,但是看著他們眼眸中的熱情,我就捨不得不再多教他們一點,使他們能真正成為善用推定的高手。
       
      『同學們,統計的推定好不好玩啊?』
      『粉好玩!』居然有人學董月花。
      『粉好玩的事有時候反而粉危險,其中最大的危險就是說不定您的推定會"貢姑",換句話說實際結果與您的推定可能會有很大的出入,請各位想想看,為什麼會出現這種狀況?』
       
      『老師,會不會是樣本有問題?』
      『你認為樣本可能會出現什麼問題?』
      『會不會所謂的樣本其實不太具有代表性?』
      『能不能舉例說明?』
       
      『譬如樣本是工程師在實驗室作出來的,而將來實際大量生產的產品卻是由生產線上的作業員生產的,這兩者之間有許多不同,不知道這是不是就會造成推定"貢姑"?』
       
      『太好了,這位同學的想法正是推定步驟1在樣本抽取上的大忌,像剛才他舉的例子,如果我們要推定一般的量產能力,結果卻選取了工程師的特製產品來作樣本,這種樣本就叫做偏差樣本(Biased Sample),用已有偏差的樣本來作推定,那當然會繆以千里了』
       
      『老師,那我們該怎麼辦?』
       
      『最具體可行的辦法,就是隨機抽樣(Random Sampling),換言之,以剛才的例子我們其實應該讓生產線的所有在製品都有相同被抽中的機會,這樣抽出的樣本就可稱為不偏樣本(Unbiased Sample),從不偏樣本得到的推論才會具有代表性,這就是統計學家為何一再強調必須隨機抽樣(Random Sampling)的原因了。』
      當大多數同學正陶醉在若有所悟時,卻有一位同學狡黠地問了另一個問題──

      『老師,偏差樣本是推定中唯一的陷阱嗎?』
      『那你認為呢?』反將他一軍。
       
      『我猜應該還有別的。』
      『別的又會是什麼呢?』再用一次不僨不啟的老招。
       
      『剛才老師提到的第一個陷阱是有關樣本品質(Quality)的問題,所以我推想可能也有與品質相對的樣本數量(Quantity)問題,不知道這種猜測是否合理?』
       
      當一群學生學會思考,而且肯深入思考時,其實他們本來就有機會無師自通的,眼前就是一個最佳例證。
       
      『好極了,你的推論的確有道理,但是能不能再想一想是樣本大時推定比較準?還是樣本小時推定比較準?』
      『當然是樣本愈大愈準囉!』
      『為什麼?』
       
      『因為如果樣本量愈來愈大,大到與全部產品一樣多時,那麼推定結果其實就和實際結果完全一樣了嘛!這樣當然最準囉!』
      他那種無師自通的悟道神情,條條有理的陳述,不禁引爆了全班同學的掌聲。
      『太好了,推定的精確性(Precision)的確是由樣本大小(n)來決定的,但是我們真的能讓樣本不斷加大嗎?』
       版權所有"尋智專業顧問有限公司"~
      『不行!』
      『為什麼?』
      『因為這樣成本會愈來愈高。』
      『答對了,如果有成本限制而我們又不太希望犧牲推定的精確性,那這就是統計學家所研究的最小樣本數的問題,一般如果是用計量值(如上例的厚度)來作推定,那麼最小樣本數不應小於25(n≧25),是一個應該被遵循的遊戲規則。』

        下課鐘聲正好又在高潮中響起,這次學生倒沒有匆匆趕出教室,有幾位反倒跑上講台來搶擦黑板,這真是一群可愛的學生。
       
      『黑板要擦的粉乾淨才可以下課哦!』故意再開個玩笑來表達對這群可愛學生的欣喜。

         
           

    1 2 3                 

>> 关闭窗口 <<


CopyRight(C)2002 深圳市斯瑞通科技开发有限公司
地址:深圳市福田区彩田路海天大厦2027室  邮编:518033
电话:(0755)83461486,83460678 传真:(0755)83461208
sales@szsunrise.net 
  最佳浏览器:IE5.0以上 分辨率:800X600