- ユーザビリティテストの目的と種類
- テスト手法の比較と選び方
- テスト設計の具体的な方法(タスク設計・被験者選定)
- テスト結果の分析と改善の優先順位の付け方
- 低コストで始めるユーザビリティテストの方法
ユーザビリティテストとは
ユーザビリティテストとは、実際のユーザー(またはターゲットに近い人)にシステムやWebサイトを操作してもらい、使いやすさの問題を発見する調査手法です。
開発チームは自分たちが作ったシステムに慣れているため、「初めて使う人がどこで迷うか」に気づきにくい。ユーザビリティテストは、この盲点を客観的に明らかにします。
ユーザビリティの専門家であるヤコブ・ニールセンの研究によると、5人のユーザーでテストすれば、ユーザビリティ問題の約85%を発見できるとされています。大規模な調査が必要なわけではなく、少人数でも大きな効果が得られるのが特徴です。
ユーザビリティテストの種類
対面テスト(モデレーテッド)
進行役(モデレーター)が同席し、被験者にタスクを依頼しながら観察する方法です。
- メリット — 被験者の表情や迷いをリアルタイムに観察できる。質問で深掘りできる
- デメリット — 日程調整が必要。1人あたり30分〜1時間かかる
- 向いているケース — 複雑な業務システム、重要な画面フローの検証
リモートテスト(アンモデレーテッド)
ツールを使い、被験者が自分のPCやスマホで自由にテストする方法です。進行役は同席しません。
- メリット — 地理的制約なし。多人数に同時実施可能。コストが低い
- デメリット — 深掘りができない。被験者が途中で離脱するリスク
- 向いているケース — Webサイト・アプリの基本的な操作フロー、A/Bテスト
- 代表的なツール — Maze、UserTesting、Lookback
ヒューリスティック評価
UXの専門家が、確立されたガイドライン(ニールセンの10原則等)に基づいてUIを評価する方法です。ユーザーは参加しません。
- メリット — 短時間・低コスト。ユーザーリクルートが不要
- デメリット — 専門家の主観に依存。実ユーザーの行動とズレる場合がある
- 向いているケース — 開発初期のプロトタイプ評価、リリース前のクイックレビュー
テスト手法の比較
| 手法 | コスト | 所要時間 | 発見の深さ | 必要な人数 |
|---|---|---|---|---|
| 対面テスト | 中〜高 | 1〜2週間 | ◎ 深い | 5〜8人 |
| リモートテスト | 低〜中 | 3〜5日 | ○ 中程度 | 10〜20人 |
| ヒューリスティック評価 | 低 | 1〜3日 | ○ 中程度 | 専門家2〜3人 |
テスト設計の進め方
ステップ1:テストの目的を明確にする
「使いやすさを確認したい」では漠然としすぎます。具体的な検証仮説を立てましょう。
- 「初めてのユーザーが会員登録を5分以内に完了できるか」
- 「商品検索から購入完了まで、迷わず進めるか」
- 「設定画面で目的の項目を見つけられるか」
ステップ2:タスクを設計する
被験者に依頼するタスクは、実際の利用シーンに即した自然な形で設計します。
悪い例
- 「左上のメニューから設定を開いてください」→ 操作手順を教えてしまっている
良い例
- 「パスワードを変更してみてください」→ ユーザーが自分で手順を見つける必要がある
タスクは5〜8個程度が適量です。多すぎると被験者が疲れて後半のデータの質が落ちます。
ステップ3:被験者をリクルートする
被験者はターゲットユーザーに近い人を選びます。
- BtoB業務システム — 実際の業務担当者、または同じ業種・職種の人
- BtoC Webサイト — ターゲット層の年齢・ITリテラシーに合った人
- 社内ツール — 別部署の社員(開発に関わっていない人)
人数の目安はニールセンの研究に基づき5人。3回に分けて5人ずつテスト→改善→再テストするサイクルが理想的です。
ステップ4:テスト環境を準備する
- テスト対象 — 本番環境、ステージング環境、またはFigmaのプロトタイプ
- 画面録画 — 操作画面と表情を記録(同意を取得)。OBS Studio(無料)で十分
- 記録シート — タスクごとの完了/未完了、所要時間、観察メモを記録
- 思考発話法(Think Aloud) — 被験者に操作中の思考を声に出してもらう
テスト結果の分析と改善
データの整理
テスト後、以下のデータを整理します。
- タスク完了率 — 各タスクを完了できた被験者の割合
- タスク完了時間 — 各タスクにかかった時間
- エラー数 — 誤操作や行き詰まりの回数
- 被験者の発言 — 困惑、不満、提案などのコメント
- 観察者のメモ — 表情の変化、迷いのポイント
問題の分類と優先順位
発見された問題を以下の基準で分類し、優先順位を付けます。
| 深刻度 | 定義 | 対応 |
|---|---|---|
| 致命的 | タスクが完了できない | リリース前に必ず修正 |
| 重大 | 大幅に迷うが最終的に完了できる | 優先的に修正 |
| 中程度 | 多少の迷いがあるが大きな支障はない | 次のイテレーションで修正 |
| 軽微 | 気づくが操作に影響しない | 余裕があれば修正 |
改善サイクル
ユーザビリティテストは1回で終わりではありません。以下のサイクルを繰り返します。
- テスト実施(5人)→ 問題を発見
- 分析・優先順位付け → 致命的・重大な問題を特定
- 改善の実施 → UIを修正
- 再テスト(5人)→ 改善効果を確認+新たな問題を発見
この「テスト→改善→再テスト」のサイクルを2〜3回繰り返すことで、ユーザビリティは大幅に向上します。
低コストで始めるユーザビリティテスト
予算やリソースが限られている場合でも、ユーザビリティテストは実施できます。
ゲリラテスト
同僚や知人に5〜10分だけ操作してもらう簡易テストです。正式なリクルートは不要で、ランチタイムやミーティングの前後に実施できます。
5秒テスト
画面を5秒間だけ見せて、「何のページだと思いますか?」「最初にどこをクリックしますか?」と聞く方法。第一印象の評価に有効です。UsabilityHubなどのツールで無料で実施できます。
Figmaプロトタイプでのテスト
開発前のFigmaプロトタイプでテストすれば、実装のやり直しを防げます。Mazeと連携すれば、リモートで数十人規模のテストも低コストで実施可能です。
Hotjar・Microsoft Clarityでの行動分析
ヒートマップと画面録画で、実際のユーザーの行動を分析するツールです。Microsoft Clarityは完全無料。テストの代替にはなりませんが、ユーザビリティ問題の発見には有効です。
まとめ
- ユーザビリティテストは5人で85%の問題を発見できる。大規模である必要はない
- 対面テスト・リモートテスト・ヒューリスティック評価を目的と予算で使い分ける
- タスク設計が成否を分ける。操作手順ではなく、目標を提示する
- 「黙って見守る」が鉄則。被験者の迷いこそが最も価値あるデータ
- テスト→改善→再テストのサイクルを回す。1回では終わらない
- 低コストでも始められる。ゲリラテスト、5秒テスト、Microsoft Clarity(無料)を活用
ユーザビリティテストやUI/UX改善のご相談は、お問い合わせからお気軽にどうぞ。FUNBREWでは、ユーザー目線のシステム設計を大切にしています。
この記事をシェア