信頼性(読み)しんらいせい(英語表記)reliability

翻訳|reliability

ブリタニカ国際大百科事典 小項目事典の解説

信頼性
しんらいせい
reliability

機械や電子部品などが,どの程度故障しないで,所定の機能を果すかという程度を表わす用語。故障要因について物理的原因にさかのぼって,確率論,推理統計学を利用し,また品質管理の面から解明し,総合したデータの判定結果から信頼性を決めることができる。そのときの判定結果を信頼度という。より正確な信頼度を得るためには,できるだけ多くの実験を繰返さなければならない。最重要ではあるが,最も困難なことは,故障要因の加速を行うことである。このようにして加速係数を定めることができれば,きわめて短時間に多くの実験を繰返して信頼度を高めることが可能となる。加速を行わせるために最も一般的なものは温度である。

出典 ブリタニカ国際大百科事典 小項目事典ブリタニカ国際大百科事典 小項目事典について 情報

世界大百科事典 第2版の解説

しんらいせい【信頼性 reliability】

工学分野でいう信頼性とは,JISによれば〈対象が与えられた条件で,規定の期間中,要求された機能を果たすことが出来る性質〉と定義されている(JIS Z 8115)。ここでいう対象とは必ずしも物ばかりでなく,コンピュータープログラムのようなソフトウェアや人間行動を含む概念である。また,信頼度も英語ではreliabilityであるが,信頼度とは,上述の性質のかわりに確率で信頼性を表現したものである。たとえば,宇宙船の信頼度90%とは,打ち上げた10台の宇宙船のうち1台が故障(機能喪失)するということを意味している。

出典 株式会社平凡社世界大百科事典 第2版について 情報

最新 心理学事典の解説

しんらいせい
信頼性
reliability

テスト理論における信頼性とは,テスト得点を真の得点と誤差に分けたとき,テスト得点のばらつきのうち,真の得点のばらつきが占める割合のことである。この定義により,信頼性が高ければ高いほどテストの質は高いことがわかる。真の得点true scoreとは,同じテストを何度も(理論的には無限回)繰り返し実施して得られたテスト得点の平均である。同じテストとは,測定の目的とする性質(構成概念)が共通であり,かつ真の得点が同じであるテストを指す。同じテストの繰り返しのそれぞれにおいて得られるテスト得点は,真の得点が同じでも,誤差の部分が変動するため,異なる値を取る。

【信頼性の推定】 信頼性の推定のために,真の得点が同じで誤差の部分は真の得点と独立であり,その分散の大きさは被験者を通して等しい二つのテストの相関係数が信頼性係数に等しいという事実を利用する。真の得点が同じで,誤差の分散が等しいような二つのテストを平行テストparallel testという。信頼性係数を推定する方法の基本は,二つの平行テストの間の相関係数を得る方法であるといってもよいが,そのための具体的方法にはいくつかの種類がある。すなわち,

⑴平行テスト法parallel test estimation method 二つのテストを平行テストになるように開発し,適切なサンプルに実施して相関係数を得る。この方法は,テストを作るための労力が大きく,しばしば実現が困難である。以下の方法は,平行テストを二つ作る方法より簡便である。

⑵再テスト法test-retest estimation method 同じテストを2回実施して,その二つの結果の相関係数を得る。これは,わかりやすい方法であるが,1回目のテストの結果が2回目のテストに影響を与えないことが前提である。たとえば,1回目のテストの答えを記憶していることが有利な影響を与える場合や,1回目の受験によって,テスト内容に関して学習できる場合には,この2回のテストは平行テストであるとはいえない。このような欠点はあるが,再テスト法は,テスト得点が時間の経過によってどの程度の変動を生じるか,すなわち時間的安定性を評価できる利点がある。

⑶折半法split-half estimation method テストを構成する項目を二つの平行テストになるように,二つの等質な群に分け,その間の相関係数を計算する。ただし,この相関係数は,二つに分けられたテストの信頼係数であり,もともとのテストの信頼性係数は,スピアマン-ブラウンの公式によって復元される必要がある。すなわち折半されたテスト間の相関係数をhとするとき,信頼性係数は,

 

となる。とくに,項目の並び方に特段の規則性がない場合に,奇数番目の項目と偶数番目の項目それぞれの合計を別の二つのテストとみなすことがある。折半法は二つの平行テストに分けたが,三つや四つ,あるいはそれ以上の平行テストに分けることも可能である。個の部分テストに分けた場合に,もともとのテストの信頼性係数は,それぞれの部分テスト間の相関が同じであるとき(pとおく),

 

によって得られる。この方法は,先に説明した方法の一般化であり,スピアマン-ブラウン21の方法Spearman-Brown formula 21とよばれる。

 テストをいくつかの平行テストに分けることは可能であるが,可能ではあっても現実には難しい。平行テストではなくても,いくつかの条件を満たせば信頼性係数の推定を行なうことができる。平行テストの厳密性を一般化した仮定の代表的なものは,タウ線形とよばれる仮定と,本質的タウ線形と呼ばれる仮定である。タウ線形の仮定は,部分テストの真の得点(τj)とテストの真の得点(τk)の間に,

 

という関係がある場合をいう。

 本質的タウ線形の仮定は二つのテストの間の関係をさらに拡張し,

 

というように,二つの真の得点間に線形関係が成立する場合を指す。部分テストが,本質的タウの仮定を満たす場合に,信頼性係数の推定値を与えるのが,クロンバックのα係数Cronbach's α coefficientである。この係数は,本質的タウの仮定を満たさないときには,信頼性の推定値としては低めの値を与えることが多い。その意味では,クロンバックのα係数は,信頼性係数の評価として保守的で慎重な推定値であるといえる。

 本質的タウの仮定よりも平行性の要件をさらに緩め,二つのテストが共通の因子によって説明されるという仮定をおくことがある。これは因子分析モデルにほかならない。この定義に従ってどの程度の信頼性をテストがもつかについては,因子分析の共通性の推定値が指標になる。すなわち共通性が大きいほど,信頼性が高いということになる。α係数も因子分析における共通性も,時間的に安定しているかどうかの意味での信頼性の評価値にはなりえず,テストの等質性の指標である。

【測定の標準誤差standard error for measurement】 テストの信頼性を示す指標として,信頼性係数を中心として説明してきたが,信頼性を示すために,誤差の標準偏差を用いることがある。これを測定の標準誤差という。標準誤差は,推定値や予測値などの統計量の標準偏差を示す用語でもあるので,差異化するためにとくに「測定の標準誤差」という。ただし,単に標準誤差とよばれることもある。測定の標準誤差は,各被験者に対して一定であることを仮定している。言い換えれば,どのような真の値に対応する測定の標準誤差も同じであることを仮定している。

 一方,古典的テスト理論に対して,現代的テスト理論とも称される項目反応理論を利用すれば,さまざまな真の得点のそれぞれを所与として測定の標準誤差を推定することができる。

【一般化可能性generalizability】 一般化可能性とは,どの程度の範囲内で安全性を保つかを示す概念である。統計学的には,真の得点のモデルと分散分析モデルは類似したモデルである。すなわち真の得点のモデルは,分散分析の一元配置モデルと同じであり,意味のあるパラメータは,各個人ごとの真の得点である。分散分析モデルの文脈においては,信頼性係数の推定の問題は,単純な測定モデル(一元配置的)の分散の推定の問題である。個人に対する回目の繰り返しにおける測定値は真の得点τと誤差εに分け,次のように書くことができる。

 

上の式のモデルにおいて,τiとεikの分散を推定してσ2x=σ2τ+σ2εという関係を利用して,=σ2τ/σ2xを計算する。ところで,分散分析が用いられる実験計画法において,複数の要因が関与する場合があるように,テスト得点のばらつきに影響する要因が個人の真の得点だけではなく,ほかにも複数の要因があるときがある。たとえば,論述試験に対して,複数の評定者がおり,それぞれの評定者によって評価が違うとすると,被験者を評定者が採点した番目の結果ijkは,となる(ここで,βjは評定者の効果。γijは,個人と評定者との交互作用を示す)。信頼性は,評定者の偏りを残差とみなすならば,二元配置分散分析によって,分散成分を推定し,の分散のうち,τの分散との分散の比を取って,信頼性係数の推定値とする。真の得点を期待値として定義したが,この期待値は,同じ被験者に対して同じ条件における繰り返しにおける平均である。しかし,条件が異なると期待値も異なる。先述の例では,被験者の真の得点以外に安定して得られる意味のあるパラメータとして評定者を想定したが,そのほかの要因も想定できる。適切な分散分析モデルを仮定し,想定したパラメータのうち,真の得点とみなすべきパラメータの和の分散が,テスト得点の分散のうちどの程度を説明するかを問う手法を一般化可能性の理論とよぶ。単純な信頼性係数の推定の場合よりも,テスト得点がどのような状況で使われるのかに対応して実際的なテスト作製のために有用な情報となる。 →項目反応理論 →古典的テスト理論 →妥当性
〔繁桝 算男〕

出典 最新 心理学事典最新 心理学事典について 情報

世界大百科事典内の信頼性の言及

【故障】より

…信頼性工学においては,信頼性や保全性に関する数量的尺度を信頼性特性値と呼んでいる。このなかには,信頼度reliability(信頼性)のほか,保全性に対する保全度maintainabilityがある。これは,対象に故障が発生したとき,ある規定の期間内(たとえば1時間以内)に修復を完了する確率である。…

【安全性】より

…JIS(ジス)では,安全性を〈人間の死傷又は資材に損失若しくは損傷を与えるような状態のないこと〉と定義している(JIS Z 8115(1981))。一般にシステムあるいは製品を新しく開発するに当たっては,所要の性能を確保し,所定の寿命の間は,その使命の達成を阻害する機能上の故障を起こさず(信頼性),使用者あるいは一般大衆の生命,財産に危険を与えないこと(安全性)が要求される。信頼性では使命達成を妨げる故障を主対象とするのに対し,安全性では不可抗力の天災,あるいは人間が予期しない事象または不注意によって起きる危険な状態(ハザードhazard)を対象とし,このような状態になったとき,人命あるいは資材の損失または損傷を伴う事故の発生を防止するか,万一事故が発生したときは,それによる被害を最小にするための事後処理を含め,使用者および一般大衆の生命と財産を守ることを目的とする。…

※「信頼性」について言及している用語解説の一部を掲載しています。

出典|株式会社平凡社世界大百科事典 第2版について | 情報

今日のキーワード

台風一過

台風が通り過ぎたあと、空が晴れ渡りよい天気になること。転じて、騒動が収まり、晴れ晴れとすること。...

続きを読む

コトバンク for iPhone

コトバンク for Android

信頼性の関連情報