科技與醫學寫作大都包含實驗所產生的數據,而實驗數據最重要的就是其準確性與精確度,唯有可靠的數據才能歸納出合理的結論,否則錯誤的數據很可能會把事實導向完全相反的方向。由此可知,科技與醫學論文首重正確的數據資料,而整體研究工作的品質,也就取決於實驗與分析時的精確程度。本文目的是簡介常見誤差來源(包括隨機與系統性誤差)、如何避免誤差,以及不同誤差的統計分布型態。也會討論多次測量某定量値的誤差,如何影響最終的測量値或計算值。
大部分研究論文中,經過整合呈現數據或分析結果,通常需考慮下列事項,確保數據的正確性,才能表示得到的結果具有可信度及綜合性:
- 考慮實際情況或數據的收集方法(涉及試驗設計與試驗方法)。
- 定義誤差來源(隨機或系統性):所有數據都會有誤差,但絕不能是錯誤!
- 檢驗並納入各種誤差來源。
- 訂定測量値或計算值可允許的誤差範圍。
誤差可分為隨機誤差與系統性誤差,讓我們先來看看什麼是隨機誤差:
- 相同的定量樣品,多次測量結果所包含的誤差:測量值的分布情形,是根據發生的機率而來,產生所謂的機率分布。
- 隨機誤差的來源:
- 統計影響:根據試驗設計選擇正確的統計方式,避免擴大誤差,得出錯誤的結果(顯著?還是不顯著?)。
- 測量過程的限制:例如儀器的偵測極限,或是儀器本身的誤差範圍。
- 常見機率分布型態
兩種型態的二項 (binomial) 分布圖:
1. 測量次數或樣本數少,機率不連續且不對稱:卜瓦松 (Poisson) 分布。
(該圖擷取自維基百科 Poisson distribution)
2. 測量次數或樣本數多,機率連續且對稱(常態分布)。
(該圖擷取自維基百科 Normal distribution)
接下來,再看看什麼是系統性誤差:
- 系統性誤差傾向為「事先存有偏見」的測量值。
- 系統性誤差的可能來源:
- 測量儀器不準確。
- 設備或技術使用錯誤。
- 避免或減少系統性誤差的方法:
- 檢查、分析測量儀器與技術。
- 謹慎進行研究。
- 不同實驗室進行相似的實驗,因為環境條件與使用儀器不同,就可能出現特定的系統性誤差。
- 如果相同定量樣品的兩份實驗報告結果不同,可能是由於其中之一,或是兩者都處理不當所造成的系統性誤差。
整體而言,避免不合理誤差的方法包含下列各項:
- 防止並定量各種隨機與系統性誤差的來源。
- 注意誤差來源加成:多次(項)測量數值累積的誤差。
- 由於多項測量數値的程序,可能彼此獨立,也可能非獨立,造成不同的誤差。
- 經過嚴格與徹底的誤差分析,才能確保引用數值的可信度。
- 正確的數值,加上適當的error bar,才能讓同儕尊重您研究論文的結果
參考資料:
Enago英文部落格 Accuracy: Random and Systematic Errors