What is the unit of analysis and why should I care?

November 26, 2018

Share on Facebook. This will open a new window.
Share on Twitter. This will open a new window.
Share on LinkedIn. This will open a new window.
Share via Email. This will open a new window.

Analysts have words for things that no one else even thinks need words. A couple of my favorite terms in analyst-speak are unit of analysis and unit of observation. I use them a lot and people stare at me when I do.

Not just jargon

The unit of analysis is the entity being studied; the unit of observation is the entity you are collecting data from. They can be the same thing, but often are not. Here is an example:

Study question:

分析単位が観察単位と同じ場合の例です。

分析単位が観察単位と同じでない場合の例：調査やフォーカスグループで、医療ガイドラインについての見解やそれに従う意思を報告する医療従事者。診療所への訪問、患者、または処置に基づいてEpicからデータを取得し、それぞれのケースで臨床ケアガイドラインが遵守されたか否かを評価します。観察結果は医療従事者まで集計され、各医療従事者が独自のコンプライアンス率を持つようになります。医療提供者は、我々が知りたい医療提供者の行動であるため、分析の単位となる。

観察単位は、分析単位を記述するデータソースです。下の図では、個人、医療提供者、診療所、病院という4つのレベルで観察・分析が可能です。もちろん、もっと多くのレベルを追加することもできます。

図1: 研究や品質改善プロジェクトの多くで考えられる分析および観察の単位

違いを知ることが役立つ理由

まず、統計テストを行うとき、必要なサンプルサイズは観察の単位ではなく分析の単位に基づきます。臨床ケアガイドラインの医療従事者のコンプライアンスについての例では、医療従事者の行動を変えているかどうかを判断するために、50 人の医療従事者のデータを収集する必要があります。しかし、50の医療機関のデータは、何千もの患者の訪問の集計であるかもしれません。もし私たちの目的が、患者が診療ガイドラインを遵守しているかどうかを知ることであるならば、全体の割合が適切です（個々の医療機関がどのような行動をしているかは知る必要がありません）。

第二に、分析単位と観察単位が異なり、それについて混乱している場合、ある種の間違いが起こる可能性があります：

(a) 異なる分析単位を非系統的に混ぜるため、まったく分析できないデータセットをまとめてしまうこと。

(b)観察単位のみに基づいて結論を出し、このグループのサンプルサイズは非常に大きくなる傾向があるため、統計的結論が誤解を招く（つまり、分析単位に基づく調査結果よりも統計的に有意である可能性が高くなる）。

(c)私たちは、分析単位を研究することによって観察単位についての結論を導き出すという、いわゆる「生態学的誤謬」を犯しています。たとえば、ある医療機関が診療ガイドラインに 70%準拠しており、彼女の患者訪問の 30% が地理的に離れたクリニックであった場合、ガイドラインに準拠していないのは、ほとんどが離れたクリニックでの訪問であると結論付けたいと思うかもしれません。しかし、それを証明するものはない。それが真実かどうかを判断するには、個々の観察結果を分析する必要があります。

それから

図 1 は、異なる分析単位と観察単位の間の明確な区別を示唆しています。しかし、これは、異なるレベルの分析単位が互いに本当に独立していることを前提としています。その仮定は通常、あてはまりません。

図2は、発達する子どもの周囲の社会的階層に関する1つの視点を示しています（これは発達システム理論で使用されています）。子どもを研究するために、家族または仲間集団を分析単位として使用することに興味があるかもしれません。そして、これらすべてのレベル間の相互作用は想像に難くありません。

図2: 発達システム理論による子どもの発達モデル

たとえば、私が幸運にも取り組んだ研究で、私の素晴らしい同僚であるデイビッドヘンリーが、子どもの攻撃的行動を研究するために仲間集団を分析単位として用いました。私たちは、多くの教室で3年生の子どもたちからデータを集めました。子どもたちは、自分自身の行動と、教室（あるいは仲間集団）の規範について調査を受けました。

彼はこれを「攻撃性の返報性」と呼びました。つまり、ある集団は攻撃的な行動に報酬を与え、そうすることで子どもたちが他の場合よりも互いに攻撃的に行動するよう動機付けるということです。

したがって、どの分析単位を使用するかを選択する際の課題の1つは、誰の行動を変えようとしているのか、QIプロジェクトはどんな引き金を引こうとしているのか、それらに反応する責任を負うのは誰なのか、といった行動がどこにあるのかを考えることと、現実には複数の「レベル」で行動があり、おそらくそれらの間で何らかの相互作用があることを知っていることなのです。 David は、まだ十分に調査されていないピアグループで起こっている何かがあり、それが個人の行動を駆り立てているという、非常に教育的な直感を持っていました。

一部の研究では、それぞれのレベルを測定し、どの場所の行動が最も効果的か、または興味深いかを事後的に判断しようとします。数年前に私が監督した研究はまさにこのようなもので、学校で行われ、生徒、教師、学校からデータを集めました。当初の分析単位は生徒でしたが、データが揃った時点で変更されました。サンプリング計画によって、学校を分析単位とすることに切り替えたのですが、これは非常に堅牢で、実際にそこで最も興味深い差異が見つかりました。そして、先生や生徒のある種の特徴を「コントロール」し、学校のタイプによって、先生にとってよりよい授業プロセスが、生徒にとってよりよい学習プロセスがどのように実現されるかを探ることができたのです。とても素晴らしいことです。

明らかに、このような入れ子モデルはすぐに複雑になってしまいます。

明らかに、このような入れ子モデルは、すぐに複雑になってしまいます。これは、あなたと分析担当者が苦労して決める、タフで複雑な決定のひとつです。このような葛藤を乗り越えれば、データが何を語っているのか理解しようとするときに、大きな配当を得ることができます。

Not just jargon

違いを知ることが役立つ理由

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル