散布図と相関分析|2変数の関係を可視化する品質分析手法
「炉の温度が上がると不良率も上がる気がする」——現場で長く働いていれば、こうした肌感覚を持つ場面は少なくありません。しかし感覚だけでは対策の根拠になりません。その仮説を客観的なデータで検証するために使うのが散布図です。2つの変数の関係をグラフ上に「見える化」することで、仮説の正否を視覚的・定量的に判断できます。本記事では、散布図の基本から書き方・相関の読み方・品質管理での活用事例、そして相関と因果の違いとなぜなぜ分析との連携まで、実務に直結する形で解説します。
散布図とは
散布図は、2種類の変数を縦軸と横軸に配置し、それぞれのデータを座標上に打点(プロット)したグラフです。QC7つ道具のひとつとして位置づけられており、パレート図・ヒストグラム・管理図・特性要因図・チェックシート・層別とともに、品質管理の基本ツールとして製造業を中心に広く普及しています。
散布図が威力を発揮するのは、「2つのデータの間に関係性があるかどうか」を知りたいときです。たとえば次のような問いに答える場面です。
- 加工温度が高いほど寸法不良率は高くなるのか
- 設備の稼働時間が長いほど故障件数は増えるのか
- 原材料の硬度が高いほど製品の引張強度は上がるのか
これらの関係は、データを集計表で見ているだけでは判断しにくいです。散布図にすることで、2変数の分布パターンが一目で把握できます。
散布図の縦軸(Y軸)には結果側の変数(品質特性・不良率・故障件数など)を、横軸(X軸)には原因側の変数(温度・時間・材料特性など)を設定するのが基本です。この向きを守ることで、どちらが「原因候補」でどちらが「結果」かが視覚的に明確になります。
散布図の書き方
散布図を正しく作成するには、データ収集から判読まで3つの段階があります。
ステップ1:データを収集する
まず、関係を調べたい2変数の対データを収集します。一般的に30〜50組以上のデータがあると相関の傾向が安定して見えやすくなります。データ数が少ないと偶然の分布パターンを誤って相関と判断するリスクがあります。
収集時のポイントは次の3点です。
- 同一条件のデータを揃える: 使用設備・担当者・原材料ロットが異なるデータが混在すると、本来の関係がノイズで見えにくくなります。必要に応じて層別してから分析します。
- 時系列を揃える: 温度と不良率の対データであれば、同じ時間帯・同じシフトのデータを組み合わせます。時刻がずれたデータを組み合わせると意味のある関係が検出できません。
- 外れ値の確認: データ収集のミスや異常な工程条件によって生じた外れ値は、事前に記録を確認した上で扱い方を判断します。
ステップ2:グラフにプロットする
軸のスケールは、各変数の最小値から最大値まで収まるように設定します。余白を設けすぎると点が密集して見えにくくなるため、データ範囲の約1割程度の余白が目安です。
同じ値のデータが複数ある場合は、点が重なって見えなくなる可能性があります。このときは点を少しずらして描く「ジッタリング」や、重なり数を円の大きさで表す工夫が有効です。
ステップ3:パターンを判読する
プロット後、点の散らばり方の傾向を見て相関の有無と方向性を読み取ります。詳しいパターンの判別方法は次のセクションで解説します。
相関の種類
散布図を読み取る際に最初に判断するのが「相関の種類」です。主に4つのパターンがあります。
正の相関
X軸の値が増えるにつれてY軸の値も増える傾向がある状態です。打点が左下から右上にかけての帯状に並びます。たとえば「炉の温度が高いほど熱処理後の硬度が高い」といった関係が正の相関に該当します。
相関の強さは**相関係数(r)**で定量的に表せます。r = +1 に近いほど強い正の相関、r = 0 に近いほど相関が弱いとされます。実務では「r ≥ 0.7 なら強い正の相関」「0.4 ≤ r < 0.7 なら中程度の正の相関」を目安とするケースが多いです。
負の相関
X軸の値が増えるにつれてY軸の値が減る傾向がある状態です。打点が左上から右下にかけての帯状に並びます。「メンテナンス頻度が高いほど故障件数が少ない」といった関係が負の相関に該当します。r が -1 に近いほど強い負の相関です。
無相関
2変数の間に一定の傾向が見られない状態です。打点が特定のパターンを持たず、グラフ全体に散らばります。この結果は「2変数に線形の関係はない」ことを示しますが、「全く関係がない」を意味するわけではありません。後述する曲線相関の可能性も考慮する必要があります。
曲線相関(非線形相関)
2変数に関係性はあるものの、直線ではなく曲線状のパターンを示す状態です。たとえば「樹脂の成形温度が低すぎると充填不良が増え、高すぎると熱劣化不良が増える」という場合、適正温度域を中心としたU字型の分布が見られます。曲線相関は通常の相関係数では検出できないため、散布図を目視で確認することが重要です。
また、層別を行わずに複数の工程・機械・製品グループのデータを混在させると、本来は相関のないデータが相関があるように見える「疑似相関」が生じることがあります。異なるグループを色分けしてプロットする層別散布図を活用すると、こうした誤判断を防げます。
品質管理での活用事例
事例1:炉の温度×不良率の分析
金属加工工場のA課長は、熱処理工程の不良率が月によって大きく変動することに気づいていました。工程担当者からは「夏場は炉の温度管理が難しい」という報告があり、温度と不良率に関係があるという仮説を立てていました。
そこで過去6ヶ月分・50ロットのデータを使い、炉内温度(X軸)と不良率(Y軸)の散布図を作成しました。結果として、設定温度±5℃を超えた範囲では不良率が急激に上昇するという傾向が明確に現れ、正の相関(r = 0.78)が確認されました。
この分析をもとに、温度管理の許容範囲を設定温度±3℃に厳格化し、外れた場合のアラート基準を設けた結果、翌月以降の不良率は約40%低減しました。散布図がなければ「夏場だから仕方ない」で終わっていた問題が、具体的な管理基準の改訂につながった事例です。
事例2:稼働時間×故障件数の分析
機械設備を多く抱える製造ラインでは、「月間の稼働時間が増えると故障件数も増えているように感じる」という現場の声がありました。設備保全担当者が過去1年間の月次データ(12ヶ月×8台 = 96データ点)を使い、月間稼働時間(X軸)と故障件数(Y軸)の散布図を作成しました。
分析の結果、稼働時間が月600時間を超えた区間で故障件数が急増するパターンが判明しました(r = 0.72)。ただし、この傾向は設備によって異なることもわかり、層別(設備ごとに色分け)した散布図を追加作成したところ、特定の2台の設備が傾向を引っ張っていることが明確になりました。
この分析を起点にして、当該2台に対して月600時間を超える前にオーバーホールを実施するという予防保全ルールを設け、その後6ヶ月間での突発故障件数が半減しました。
相関と因果の違い:散布図の結果をなぜなぜ分析で深掘りする
散布図で相関が確認されたとき、最も注意しなければならないのが「相関は因果関係を証明しない」という点です。
たとえば「アイスクリームの売上と溺死事故件数には正の相関がある」というデータが知られています。しかしこれは「アイスを食べると溺死しやすくなる」という意味ではありません。どちらも「夏の気温上昇」という第三の変数(交絡因子)によって引き起こされているに過ぎません。
品質管理の現場でも同様のリスクがあります。「温度と不良率に相関がある」という散布図の結果は、次のいずれかを示している可能性があります。
- 真の因果関係: 温度の変動が直接的に不良を引き起こしている
- 交絡因子の存在: 温度と不良率の両方に影響している第三の変数(例:季節による湿度変化、夏場の作業者の変更など)がある
- 逆因果: 工程異常が発生したときに温度管理が難しくなるという逆の因果
- 偶然の一致: データ数が少ない場合に起こりうる
散布図で相関を確認した後、その相関が真の因果関係かどうかを検証するプロセスが不可欠です。ここで有効なのがなぜなぜ分析です。
散布図で「温度が高いと不良率が上がる」という傾向が確認できたとします。ここからなぜなぜ分析を行います。
- なぜ温度が高いと不良が増えるのか? → 材料の粘度が変化し、充填量がばらつくから
- なぜ粘度が変化すると充填量がばらつくのか? → 充填バルブの設定が温度補正なしで固定されているから
- なぜ温度補正がないのか? → 設備導入時に温度変動の影響が考慮されていなかったから
- なぜ考慮されていなかったのか? → 温度変動の大きい夏場のデータを取得せずに設備仕様を決定したから
このように散布図で「相関のある変数ペア」を特定し、なぜなぜ分析で「因果のメカニズム」を解明するという連携が、真の根本原因への到達を確実にします。
散布図は「どこを掘るべきか」を示すコンパス、なぜなぜ分析は「根本原因まで掘り下げるスコップ」です。この2つのツールを組み合わせることで、「相関があるからとりあえず温度を下げる」という表面対処ではなく、「バルブ制御に温度補正ロジックを追加する」という根本的な対策が立案できます。
WhyTrace Plusで相関から根本原因まで一気通貫で分析
散布図で相関を発見した後のなぜなぜ分析を、WhyTrace PlusのAIがサポートします。相関の確認された変数ペアを入力すると、AIが因果メカニズムの仮説を提示し、5Whyの深掘りをガイドします。分析ツリーはリアルタイムで可視化され、チーム全員が同じ画面を見ながら議論を進めることができます。
まとめ
散布図は「2つの変数の間に関係があるかどうか」を視覚的に確認するためのQC7つ道具のひとつです。この記事でお伝えしたポイントを整理します。
- 散布図の基本: 結果側の変数をY軸、原因候補をX軸に設定し、30〜50組以上のデータをプロットする
- 書き方の手順: データ収集(層別・同一条件の確保)→プロット→相関パターンの判読、という3ステップで進める
- 相関の4種類: 正の相関・負の相関・無相関・曲線相関を目視と相関係数(r値)で判別する
- 活用事例: 温度×不良率、稼働時間×故障件数など、現場の仮説をデータで検証し管理基準の改訂や予防保全ルールの設定につなげる
- 相関と因果の違い: 散布図は相関を示すツールであり、因果関係の証明はなぜなぜ分析との組み合わせで初めて可能になる
散布図で「気になる変数ペア」を見つけたら、そこで分析を止めずに原因のメカニズムまで掘り下げることが再発防止の鍵です。相関の発見を起点にしたなぜなぜ分析を効率的に進めたい方は、WhyTrace Plus のご活用をご検討ください。
参考資料
- 散布図とは?品質改善に役立つQC7つ道具 相関関係をわかりやすく解説 | 製造現場出身の経営コンサルタント!工場経営を総合サポート
- 散布図とは?相関の考え方と散布図の作り方について解説 | カイゼンベース / KAIZEN BASE
- QC7つ道具の基本③ 散布図とは? | アイアール技術者教育研究所
- 散布図(QC7つ道具)の書き方と見方。正の相関・負の相関はどのように打点されるか
- 相関分析とは?分析手順や結果の書き方・注意点を解説 | 株式会社glorious future
関連サービス
原因分析・品質改善の知見を広げるために、姉妹サービスの関連記事もご活用ください。
- なぜなぜ分析の完全ガイド(GenbaCompass)
- QC7つ道具とナレッジ管理(know-howAI)
- なぜなぜ分析の知見をナレッジベースに蓄積(know-howAI)