Download - Reliability engineering edit

Transcript
Page 1: Reliability engineering edit

Kejuruteraan Keboleharapan

Keboleharapan ialah kebolehan sesuatu sistem atau komponen untuk beroperasi berdasarkan

fungsi mengikut ketetapan tertentu pada tempoh masa yang telah ditentukan.

Overview

Rajah blok keboleharapan

Kebolehharapan boleh didefinisikan dalam beberapa cara iaitu seperti;

Idea/pemikiran mengenai sesuatu yang menepati tujuan/kegunaan yang tertakluk kepada

masa

Kapasiti sesuatu peralatan atau sistem berfungsi mengikut rekabentuk yang ditetapkan

Ketahanan peralatan atau sistem daripada kegagalan

Kebolehan sesuatu peralatan atau sisetm untuk beroperasi mengikut fungsi sebagaimana yang

ditetapkan dalam tempoh masa yang telah ditetapkan

Kebarangkalian sesuatu bahagian akan berfungsi mengikut fungsi yang telah ditetapkan

dalam jangkawaktu mengikut keadaan-keadaan yang telah ditetapkan.

Kajian keboleharapan sebenarnya banyak bergantung kepada data statistic, teori

kebarangkalian dan teori keboleharapan. Pelbagai.teknik digunakan dalam kajian

keboleharapan contohnya seperti menjangka atau ramalan keboleharapan, analisa Weibull,

ujian kebolehharapan dan sebagainya. Disebabkan pelbagai teknik boleh digunakan dalam

Page 2: Reliability engineering edit

menentukan keboleharapan, sesuatu sistem yang bergantung kepada keadaan tertentu,kajian

keboleharapan difokuskan kepada tugas tertentu.

Apapun takrifan/definisi yang dikaitkan dengan keboleharapan, fungsi kejuruteraan

keboleharapan adalah untuk membangunkan keperluan keboleharapan untuk sesuatu produk,

menetapkan program keboleharapan yang mencukupi dan melaksanakan analisa yang tepat

serta bertanggungjawab dalam memastikan produk menepati keperluan yang telah ditetapkan.

Keboleharapan juga berkait rapat dengan kebolehsenggaraan seuatu peralatan atau sistem.

Seperti yang telah dinyatakan sebelum ini bahawa keboleharapan penting dalam semua

bidang terutamanya bidang kejuruteraan yang menggunakan kaedah dan alatan yang sama.

Misalnya, Jurutera sistem merekabentuk sistem yang kompleks perlu mempunyai ketetapan

keboleharapan yang perlu dipatuhi. Manakala Jurutera Mekanikal perlu merekabentuk mesin

atau sistem berpandukan kepada keboleharapan yang telah ditetapkan. Begitu juga dengan

jurutera elektronik yang perlu merekabentuk produk dan menguji produk yang dihasilkan

mengikut keboleharapan yang telah ditetapkan.

Teori keboleharapan adalah asas kepada kejuruteraan keboleharapan. Diadalam kejuruteraan

keboleharapan ditakrifkan sebagai

Kebarangkalian peralatan melakukan fungsi yang ditetapkan selama jangka waktu tertentu

dalam keadaan yang tertentu yang telah ditetapkan.

Secara matematik keboleharapan ditentukan seperti persamaan berikut;Mathematically, this

may be expressed as,

,

Di mana ialah fungsi kegagalan ketumpatan kebarangkalian dan t adalah tempoh

masa (dengan anggapan bermula dari masa sifar)

Kejuruteraan keboleharapan menitikberatkan empat elemen yang didefinisikan seperti

berikut;

Page 3: Reliability engineering edit

Pertama : keboleharapan adalah kebarangkalian, bermaksud kegagalan

dianggapkan sebagai fenomena rawak: iaitu peristiwa yang berulang, it is a

recurring event, dan kita tidak menekankan apa-apa maklumat tentang

kegagalan individu, penyebab kegagalan, atau hubungan antara kegagalan,

kecuali kemungkinan untuk kegagalan terjadi berbeza-beza dari masa ke masa

sesuai dengan fungsi kebarangkalian yang diberikan. Keboleharapan adalah

kebarangkalian kejayaan yang ditentukan pada aras keyakinan tertentu.

Kedua: keboleharapan adalah jangkaan sesuatu yang menepati fungsi dimana

sistem berfungsi tanpa gagal. Ini bermaksud, walaupun tiada

bahagian/komponen sistem yang gagal berfungsi, namun sistem dikatakan

gagal sekiranya keseluruhan sistem tidak memenuhi keboleharapan sistem

yang telah ditetapkan.

Ketiga keboleharapan digunakan pada tempoh masa yang ditetapkan. Secara

paraktikalnya ia bermaksud sistem mempunyai peluang yang ditetapkan yang

akan beroperasi tanpa gagal sebelum masa (t) yang ditentukan. Keboleharapan

memastikan komponen dan bahan berfungsi mengikut ketetapan pada masa

yang ditetapkan.Unit pengukuran selain masa juga digunakan dalam

menentukan keboleharapan. Misalnya Keboleharapan dalam Industri

Automotif ditentukan dalam unit kilometer manakala dalam bidang

ketenteraan keboleharapan sesuatu senjata ditentukan dengan jumlah /bilangan

tembakan.

Keempat keboleharapan adalah terhad kepada operasi didalam keadaan yang

telah ditetapkan. Had tersebut perlu kerana adalah mustahil sesuatu sistem

direkabentuk tanpa had atau spesifikasi. Sesuatu sistem direkabentuk

berdasarkan kepada persekitaran ianya digunakan dan ianya bergantung

Page 4: Reliability engineering edit

kepada kos. Misalnya kebolehharapan Kapal angkasa mestilah berbeza dengan

kaan dan persekitaran yang berbeza sama sekali. palterbang disebabkan kedua-

duanya berfungsi pada

Perancangan program keboleharapan

Perancangan program keboleharapan didokumenkan berdasarkan situasi sebenar dimana

tugas, kaedah, alatan, analisa dan ujian yang diperlukan oleh sesuatu sistem yang tertentu.

Untuk sistem yang kompleks pelan program keboleharapan didokumenkan berasingan.Untuk

sistem yang mudah ia boleh digabungkan dengan sistem

Keperluan Keboleharapan

Untuk sistem apapun, salah satu salah satu fungsi utama keboleharapan adalah untuk

menentukan sistem mematuhi keperluan keboleharapan. Keperluan Keboleharapan

mengambarkan sistem itu sendiri. Syarat-syarat Keandalan alamat sistem itu sendiri, uji dan

penilaian keperluan, dan tugas-tugas yang berkaitan dan dokumentasi. Syarat-syarat

Keandalan termasuk dalam sistem yang sesuai keperluan subsistem / spesifikasi, rancangan

uji, dan kenyataan kontrakFor any system, one of the first tasks of reliability engineering is to

adequately specify the reliability requirements. Reliability requirements address the system

itself, test and assessment requirements, and associated tasks and documentation. Reliability

requirements are included in the appropriate system/subsystem requirements specifications,

test plans, and contract statements.

Parameter sistem keboleharapan

Keboleharapan sesuatu sistem biasanya ditentukan dengan parameter Mean Time Between

Failure (MTBF). Parameter ini dapat menentukan kadar kegagalan atau bilangan kegagalan

dalam tempoh masa yang ditetapkan. Parameter ini sangat berguna bagi sistem yang sentiada

beroperasi secara kerap seperti kenderaan mesin dan peralatan elektronik. Keboleharapan

yang tinggi ditunjukan dengan MTBF yang tinggi. Unit pengukuran bagi MTBF biasanya

dalam masa(jam), jarak(kilometer) atau kitaran.

Page 5: Reliability engineering edit

Dalam kes berbeza, Keboleharapan ditentukan dalam bentuk kejayaan sesuatu misi sebagai

contoh Keboleharapan Penerbangan yang dijadualkan ditentukan dalam bentuk peratusan

(tiada dimensi).

Terdapat kes tertentu dimana Keboleharapan ditentukan dengan kejayaan misi operasi

tunggal sesuatu sistem. Sebagai contoh kejayaan sistem airbag dan peluru berpandu hanya

dapat ditentukan apabila alatan tersebut sekali operasi(tiada ulangan).

Bagi sistem tersebut keboleharapan diukur dengan probability of failure on demand (PFD).

PFD diterbitkan daripada kadar kegagalan dan masa misi bagi sistem yang tidak boleh

dibaiki(non-repairable system). Bagi Sistem yang boleh dibaiki(Repairable system) PFD

diterbitkan daripada kadar kegagalan dan Mean Time To Repair(MTTF) serta sela ujian.

Ukuran tersebut bergantung pada jenis permintaan.

Reliability modelling

Model Keboleharapan ialah proses untuk meramal atau memahami keboleharapan sesuatu

sistem. Dua pendekatan yang selalu digunakan ialah kaedah kegagalan fizikal dan model

ketegasan bahagian. Kaedah kegagalan fizikal digunakan untuk memahami kegagalan

mekanisma yang terlibat contohnya seperti perambatan retak atau kakisan kimia. Manakala

pendekatan model tegasan bahagian ialah kaedah Kaedah ramalan empirial berdasarkan

pengiraan jumlah dan jenis komponen sistem, dan tegasan yang dihadapi semasa operasi.

Kajian peringkat kegagalan awal ditentukan taburan tingkat kegagalan menurun sepanjang

bahagian pertama dari bathtub curve. Pada bahagian ini, stres sederhana umumnya

diperlukan. Stres diterapkan untuk jangka masa terhad dalam apa yang disebut censored test.

Oleh kerana itu, hanya sebahagian daripada taburan dengan kegagalan awal dapat ditentukan.

Dikenali juga sebagai eksperimen kecacatan sifar dimana hanya maklumat yang terhad

berkenaan taburan kegagalan diperlukan. Disini tegasan, masa tegasan, atau saiz sampel

sangat rendah secara tidak langsung tiada kegagalan yang berlaku. Disebabkan kekurangan

saiz sampel hanya limit atas kadar kegagalan awal boleh ditentukan. Pada sebarang kadar

ianya kelihatan baik pada pengguna kerana tiada kegagalan.

Dalam satu kajian tentang taburan kegagalan intrinsik, yang biasanya mengenai sifat bahan,

tegasan tinggi diperlukan untuk mendapatkan kegagalan dalam jangka masa yang

Page 6: Reliability engineering edit

munasabah. Beberapa darjah tegasan harus dikenakan untuk menentukan model percepatan.

Taburan kegagalan empirik selalunya sama dengan Weibull atau model log-normal

Reliability test requirements

Disebabkan keboleharapan juga adalah kebarangkalian, semua sistem mesti mempunyai

peluang untuk gagal walaupun keboleharapannya tinggi. Keperluan ujian keboleharapan

bermasalah Ujian tunggal tidak mencukupi untuk menhgasilkan data statistic. Ujian secara

berulang atau ujian pada jangka masa yang lama pula selalunya melibatkan kos yang tinggi.

Oleh itu kejuruteraan keboleharapan digunakan untuk merekabentuk satu ujian yang realistik

serta berpatutan yang boleh menyediakan data yang mencukupi bagi membuktikan sistem

menepati keperluan yang telah ditetapkan. Tahap keyakinan statistik (statistical confidence

level) digunakan untuk mengatasi beberapa masalah ini. Satu parameter tertentu dinyatakan

bersama tahap keyakinan sebagai contoh MTBF bagi 10000jam pada 90% tahap keyakinan.

Daripada spesifikasi ini reliability engineer boleh merekabentuk satu ujian dengan kriteria

jelas mengikut masa(jam) atau bilangan kegagalan samada memenuhi spesifikasi atau gagal.

Kombinasi nilai parameter keboleharapan dan tahap keyakinan memberikan kesan yang

ketara kepada kos dan risiko terhadap pengeluar dan pengguna. Ketelitian amat diperlukan

untuk memilih kombinasi tersebut. Ujian Keboleharapan boleh dilaksanakan pada pelbagai

peringkat seperti komponen, sub sistem dan sistem. Selain itu banyak factor lain yang perlu

diambilkira semasa ujian tersebut seperti suhu yang keterlaluan, kelembapan, kejutan, getaran

dan haba. Keboleharapan menentukan keberkesanan ujian supaya semua komponen atau

bahagian diuji dalam persekitaran yang releven.

Keboleharapan Ramalan/Jangkaan

Jangkaan keboleharapan adalah elemen penting dalam proses pemilihan peralatan untuk

digunakan dalam oleh penyedia perkhidmatan telekomunikasi dan begitu juga dengan

pembeli peralatan elektronik. Keboleharapan diukur dengan frekuensi kegagalan peralatan

mengikut fungsi masa. Keboleharapan juga menberi impak besar dalam penyelenggaraan dan

kos pembaikan serta kelangsungan perkhidmatan. Keboleharapan jangkaan dapat;

Page 7: Reliability engineering edit

Membantu menilai kesan kebaoleharapan produk untuk aktiviti penyelenggaraan dan kuantiti

alat ganti yang diperlukan. Sebagai contoh jangkaan frekuensi penyelenggaraan yang boleh

ditentukan.

Menyediakan input kepada sistem model kekeboleharapan. Seterusnya Sistem tahap model

kebolehharapan dapat digunakan untuk menjangka, misalnya, kerosakan yang dijangka dalam

satu tahun dan ketersediaan sistem.

Menyediakan input kepada unit dan tahap sistem Life Cycle Cost Analyses.Kajian kos hayat

kitaran menentukan kos sesuatu produk sepanjang hayat. Oleh kerana itu, kekerapan sesuatu

unit atau komponen perlu diganti mestilah diketahui. Input untuk proses ini meliputi kadar

kegagalan unit dan sistem termasuklah frekuensi unit dan sistem gagal semasa tahun pertama

operasi mahupun dalam tahun berikutnya.

Membantu membuat keputusan untuk pembelian sesuatu produk yang bersaing dipasaran.

Boleh digunakan di industri sebagai satu standard ujian bagi produk yang memerlukan

ujian keboleharapan.

Boleh digunakan untuk menetapkan standard pencapaian prestasi sesuatu perkhidmatan

sebagai pengukuran prestasi sebenar serta tindakan yang perlu diambil

Rekabentuk untuk Keboleharapan

Rekabentuk Untuk Keboleharapan (DFR), adalah sebuah disiplin baru yang merujuk pada

proses perancangan keboleharapan sesuatu produk. Proses ini meliputi beberapa kaedah dan

amalan yang menerangkan bahawa sesuatu organisasi perlu mempraktikannya bagi

menggerakan kepada keboleharapan produk yang dikeluarkan. Biasanya, langkah pertama

dalam proses DFR adalah untuk menetapkan keperluan keboleharapan sistem. Keboleharapan

harus "direka" untuk sistem. Semasa rekabentuk sistem, keperluan peringkat tertinggi

keboleharapan tersebut kemudian diperuntukkan untuk subsistem dengan jurutera reka

bentuk dan jurutera kehandalan bekerja sama.

Keboleharapan rekabentuk bermula dengan pembangunan model. Keboleharapan model

menggunakan rajah blok dan fault tree bagai menunjukan maklumat dalam bentuk grafik

Page 8: Reliability engineering edit

hubungan antara pelbagai bahagian dari sistem. Model ini menggabungkan jangkaan

berdasarkan tahap kegagalan bahagian atau komponen yang diambil dari rekod sebelumnya.

Walaupun jangkaan atau ramalan tidak tepat secara mutlak, namun ianya penting untuk

menilai dan membandingkan perbezaan relatif dalam rekabentuk alternatif.

Rajah Fault Tree

Salah satu teknik yang sering digunakan ialah Redundensi. Teknik ini menunjukan jika salah

satu daripada bahagian atau komponen sistem gagal, terdapat alternatif lain seperti sistem

sokongan bagi membolehkan sistem terus beroperasi. Sebagai contoh jika salah satu lampu

brek gagal, masih terdapat satu lagi lampu yang boleh berfungsi.

Redundansi secara signifikan meningkatkan keboleharapan sistem. Namun, redundansi sukar dan

mahal untuk dilaksanakan, oleh itu ianya terhad pada bahagian-bahagian kritikal yang penting

daripada sistem.

Selain itu Kegagalan Fizikal adalah juga merupakan satu teknik yang digunakan dalam rekabentuk

keboleharapan. Teknik ini bergantung kepada pemahaman mengenai proses fizikal seperti tegasan,

kekuatan dan kegagalan pada tahap yang sangat terperinci. Kemudiannya bahan atau bahagian

boleh direkabentuk semula untuk mengurangkan kemungkinan kegagalan.

Secara umumnya terdapat banyak teknik dan analisa yang khusus untuk aplikasi dalam industri-

industri tertentu. Antaranya seperti:

Page 9: Reliability engineering edit

Built-in test (BIT)

Failure mode and effects analysis (FMEA)

Reliability simulation modeling

Thermal analysis

Reliability Block Diagram analysis

Fault tree analysis

Root cause analysis

Reliability Growth analysis

Weibull analysis

Keboleharapan adalah salah satu daripada keperluan sistem. kajian kejuruteraan digunakan dalam

menentukan keseimbangan yang optimum di antara keperluan keboleharapan dan keperluan lain

serta halangan-halangan.

Ujian Keboleharapan

Rancangan Ujian Keboleharapan Turutan (Reliability Sequential

Test Plan)

Page 10: Reliability engineering edit

Reliability testing may be performed at several levels. Complex systems may be tested at

component, circuit board, unit, assembly, subsystem and system levels. (The test level

nomenclature varies among applications.) For example, performing environmental stress

screening tests at lower levels, such as piece parts or small assemblies, catches problems

before they cause failures at higher levels. Testing proceeds during each level of integration

through full-up system testing, developmental testing, and operational testing, thereby

reducing program risk. System reliability is calculated at each test level. Reliability growth

techniques and failure reporting, analysis and corrective active systems (FRACAS) are often

employed to improve reliability as testing progresses. The drawbacks to such extensive

testing are time and expense. Customers may choose to accept more risk by eliminating some

or all lower levels of testing.

Tujuan dari ujian keboleharapan adalah untuk mencari potensi masalah yang bakal berlaku

semasa rekabentuk dengan seawal mungkin dan akhirnya memberikan keyakinan bahawa

sistem yang memenuhi keperluan keboleharapan yang ditetapkan.

Ujian Keboleharapan boleh dilakukan di beberapa peringkat. sistem yang kompleks misalnya

boleh diuji pada komponen, papan litar, unit, perakitan, subsistem dan tahap sistem. Ujian di

peringkat tertentu sistem berbeza mengikut aplikasi masing-masing. Sebagai contoh,

melakukan kajian awal diperingkat bawah seperti kajian alam sekitar dapat mengesan

masalah yang bakal berlaku sebelum sesuatu projek mengalami kegagalan pada tahap yang

lebih tinggi.

Ujian dilaksanakan pada setiap peringkat integrasi melalui ujian sistem lengkap melalui ujian

perkembangan dan ujian operasi bagi mengurangkan risiko. Keboleharapan sistem dikira

pada setiap peringkat ujian. Teknik Pertumbuhan Keboleharapan dan laporan kegagalan,

analisis dan sistem pembetulan aktif (Reliability growth techniques and failure reporting,

analysis and corrective active systems -FRACAS) sering digunakan untuk meningkatkan

keboleharapan katika ujian dilaksanakan. Untuk mengelakan ujian-ujian tersebut akan

memberi kesan terhadap masa dan kos. Sesetengah pihak mungkin bersedia memilih untuk

menerima risiko yang lebih dengan mengelakkan ujian di beberapa atau semua peringkat.

A key aspect of reliability testing is to define "failure". Although this may seem obvious,

there are many situations where it is not clear whether a failure is really the fault of the

system. Variations in test conditions, operator differences, weather, and unexpected situations

create differences between the customer and the system developer. One strategy to address

Page 11: Reliability engineering edit

this issue is to use a scoring conference process. A scoring conference includes

representatives from the customer, the developer, the test organization, the reliability

organization, and sometimes independent observers. The scoring conference process is

defined in the statement of work. Each test case is considered by the group and "scored" as a

success or failure. This scoring is the official result used by the reliability engineer.

As part of the requirements phase, the reliability engineer develops a test strategy with the

customer. The test strategy makes trade-offs between the needs of the reliability organization,

which wants as much data as possible, and constraints such as cost, schedule, and available

resources. Test plans and procedures are developed for each reliability test, and results are

documented in official reports.

Antara Ujian lain ialah Sequential Nisbah Kebarangkalian Turutan. Ujian ini menggunakan

kedua-dua kaedah statistik iaitu type 1error dan type 2 error yang digabungkan dengan

nisbah diskriminasi sebagai masukkan utama (bersama-sama dengan keperluan R). Ujian ini

diset secara bebas sebelum dimulakan ujian bagi kedua jenis ujian iaitu ujian risiko kesilapan

menerima rekabentuk yang tidak baik (risk of incorrectly accepting a bad design -Type 2

error) dan risiko menolak rekabentuk yang baik ( risk of incorrectly rejecting a good design -

type 1 error) bersama-sama dengan nisbah diskriminasi dan parameter keboleharapan

minimum yang diperlukan. Ujian ini lebih terkawal dan menghasilkan lebih maklumat untuk

kawalan kualiti. Jumlah sampel bagi ujian ini tidak tetap, tetapi dikatakan bahawa ujian ini

pada umumnya lebih cekap (memerlukan sampel kurang) dan menyediakan maklumat lebih

daripada ujian lain misalnya ujian kegagalan sifar.

Tidak semua sistem perlu diuji secara keseluruhan. Sesetengah sistem terlalu mahal untuk

diuji, kegagalan sesuatu sistem mungkin mengambil masa bertahun-tahun untuk diamati

kegagalannya; sesetengahnya pula mempunyai keputusan yang kompleks dalam sejumlah

besar ujian , dan sesetengah ujian memerlukan penggunaan julat ujian yang terhad atau

bergantung kepada sumber-sumber yang lain. Dalam kes tersebut, pendekatan yang berbeza

untuk ujian boleh digunakan iaitu seperti accelerated life test, design of experiments dan

simulasi.

Tahap keyakinan statistik juga memainkan peranan penting dalam ujian keboleharapan.

Keyakinan Statistik meningkat dengan bertambahnya waktu ujian atau jumlah produk yang

Page 12: Reliability engineering edit

diuji. Perancangan Ujian keboleharapan direka untuk mencapai keboleharapan tertentu di

tahap keyakinan yang ditentukan dengan jumlah minimum unit ujian dan masa ujian.

Perancangan ujian yang berbeza menghasilkan pelbagai peringkat risiko kepada pengeluar

dan pelanggan. Keboleharapan yang dikehendaki, keyakinan statistik, dan tahap risiko

masing-masing mempengaruhi perancangan ujian terakhir. Keperluan ujian yang baik adalah

dengan memastikan bahawa pelanggan dan pengeluar bersetuju terlebih dahulu tentang

kaedah bagaimana keperluan keboleharapan akan diuji.

Sebuah aspek kunci dari ujian keboleharapan adalah untuk mendefinisikan "kegagalan".

Walaupun ini mungkin tampak jelas, ada banyak situasi di mana tidak jelas apakah kegagalan

benar-benar kesalahan atau kelemahan sistem. Perbezaan dalam ujian, perbezaan pembekal,

keadaan cuaca dan situasi tak dijangka adalah perkara yang menyebabkan perbezaan antara

pengguna dan pengeluar sesuatu. Salah satu strategi untuk mengatasi masalah ini adalah

dengan menggunakan proses penilaian.

Penilaian Keboleharapan operasi

Bagi sesuatu sistem yang baru beroperasi atau produk yang baru dikeluarkan pasukan jurutera

akan memantau, menilai serta membetulkan kecacatan yang dikesan ketika itu. Pemantauan

ini melibatkan penggunakan sistem pemantauan elektronik bagi parameter kritikal yang

diikenalpasti semasa peringkat analisa fault tree. Penganalisaan data secara tetap

menggunakan kaedah statistic seperti analisa Weibull dan linear regression bagi memastikan

keboleharapan sistem memenuhi keperluan yang ditetapkan. Pengumpulan data sangat

bergantung kepada sifat sistem. Bagai syarikat yang besar mereka mempunyai kumpulan

kualiti yang mengambil data pada produk seperti kenderaan, peralatan dan mesin. Kecacatan

Produk pengguna biasanya dikesan melalui bilangan produk yang dikembalikan.

Satu kaedah paling banyak digunakan didalam penilaian operasi keboleharapan ialah Failure

Reporting, Analysis and Corrective Action Systems (FRACAS). Merupakan pendekatan

yang lebih sistematik untuk pembangunan penilaian keboleharapan, keselamatan dan lojistik.

Data-data dikumpul berdasarkan laporan kerosakan/kegagalan/kemalangan, laporan

terrmasuk MTBF, MTTR, penggunaan alat gantian, Reliability Growth, Failure/Incidents

distribution by type, location, part no., serial no, symptom dan lain-lain.

Page 13: Reliability engineering edit

Mean time between failures (MTBF) is the predicted elapsed time between inherent failures of a system during operation.[1] MTBF can be calculated as the arithmetic mean (average) time between failures of a system. The MTBF is typically part of a model that assumes the failed system is immediately repaired (zero elapsed time), as a part of a renewal process. This is in contrast to the mean time to failure (MTTF), which measures average time between failures with the modeling assumption that the failed system is not repaired.

The definition of MTBF depends on the definition of what is considered a system failure. For complex, repairable systems, failures are considered to be those out of design conditions which place the system out of service and into a state for repair. Failures which occur that can be left or maintained in an unrepaired condition, and do not place the system out of service, are not considered failures under this definition.[2] In addition, units that are taken down for routine scheduled maintenance or inventory control, are not considered within the definition of failure.

Overview

For each observation, downtime is the instantaneous time it went down, which is after (i.e. greater than) the moment it went up, uptime. The difference (downtime minus uptime) is the amount of time it was operating between these two events.

MTBF value prediction is an important element in the development of products. Reliability engineers / design engineers, often utilize Reliability Software to calculate products' MTBF according to various methods/standards (MIL-HDBK-217F, Telcordia SR332, Siemens Norm, FIDES,UTE 80-810 (RDF2000), etc.). However, these "prediction" methods are not intended to reflect fielded MTBF as is commonly believed. The intent of these tools is to focus design efforts on the weak links in the design.

Formal definition of MTBF

By referring to the figure above, the MTBF is the sum of the operational periods divided by the number of observed failures. If the "Down time" (with space) refers to the start of

Page 14: Reliability engineering edit

"downtime" (without space) and "up time" (with space) refers to the start of "uptime" (without space), the formula will be:

The MTBF is often denoted by the Greek letter θ , or

The MTBF can be defined in terms of the expected value of the density function ƒ(t)

where ƒ is the density function of time until failure – satisfying the standard requirement of density functions –

Variations of MTBF

There are many variations of MTBF, such as mean time between system aborts (MTBSA) or mean time between critical failures (MTBCF) or mean time between unit replacement (MTBUR). Such nomenclature is used when it is desirable to differentiate among types of failures, such as critical and non-critical failures. For example, in an automobile, the failure of the FM radio does not prevent the primary operation of the vehicle. Mean time to failure (MTTF) is sometimes used instead of MTBF in cases where a system is replaced after a failure, since MTBF denotes time between failures in a system which is repaired.

Mean time to repair (MTTR) is a basic measure of the maintainability of repairable items. It represents the average time required to repair a failed component or device.[1] Expressed mathematically, it is the total corrective maintenance time divided by the total number of corrective maintenance actions during a given period of time.[2] It generally does not include lead time for parts not readily available, or other Administrative or Logistic Downtime (ALDT).

In fault-tolerant design MTTR is usually considered to also include the time the fault is latent (the time from when the failure occurs until it is detected). If a latent fault goes undetected until an independent failure occurs, the system may not be able to recover.

Page 15: Reliability engineering edit

MTTR is often part of a maintenance contract, where a system whose MTTR is 24 hours is generally more valuable than for one of 7 days if mean time between failures is equal, because its Operational Availability is higher.