システム開発

ユーザビリティテストのやり方【2026年版完全ガイド】手順・ツール・チェックリスト付き

2026年3月9日約12分で読めます

この記事でわかること

ユーザビリティテストの目的・種類・手法の選び方
6ステップの具体的な実施手順（計画〜改善サイクルまで）
2026年版おすすめツール（無料・有料）比較
タスク設計・被験者選定・当日進行のチェックリスト
5人・費用ゼロから始める低コスト実践法
中小企業・システム開発現場でのリアルな活用事例

ユーザビリティテストとは何か

ユーザビリティテストとは、実際のユーザー（またはターゲットに近い人）にシステムやWebサイトを操作してもらい、使いにくさの問題を発見する調査手法です。

開発チームは自分たちが作ったシステムに慣れてしまっているため、「初めて使う人がどこで迷うか」に気づきにくい。ユーザビリティテストは、この盲点を客観的に明らかにします。

UXの専門家ヤコブ・ニールセンの研究によると、5人のユーザーでテストすれば、ユーザビリティ問題の約85%を発見できるとされています。大規模な調査が必要なわけではなく、少人数でも大きな効果が得られるのが特徴です。

「システムを作ったのに現場で使われない」「お問い合わせフォームの途中離脱率が高い」といった問題の多くは、ユーザビリティテストで事前に発見できます。開発完了後よりプロトタイプ段階でテストする方が、修正コストを最大100分の1に抑えられます。

ユーザビリティテストが必要な場面

以下のような場面で特に効果を発揮します。

新規システム・Webサイトの開発時 — リリース前に問題を発見し、手戻りコストを削減
既存システムの改修・リニューアル時 — 「使いにくい」という声の具体的な原因を特定
コンバージョン率の改善 — 離脱ポイントや操作のつまずきを可視化
業務効率化システムの導入前 — 現場スタッフが実際に使いこなせるか検証
アプリのストア評価が低い時 — 星1〜2の低評価レビューの根本原因を特定

ユーザビリティテストの種類と手法比較

対面テスト（モデレーテッド）

進行役（モデレーター）が同席し、被験者にタスクを依頼しながら観察する方法です。被験者の表情・迷い・つぶやきをリアルタイムで把握でき、深い洞察を得られます。

メリット — 行動の背景を深掘りできる。その場で追加質問が可能
デメリット — 日程調整が必要。1人あたり30〜60分かかる
向いているケース — 複雑な業務システム、初回テスト、重要な画面フローの検証

リモートテスト（アンモデレーテッド）

ツールを使い、被験者が自分のPCやスマホで自由にテストする方法です。進行役は同席せず、録画・ログを後から分析します。

メリット — 地理的制約なし。多人数に同時実施可能。コストが低い
デメリット — 深掘りができない。被験者が途中離脱するリスクがある
向いているケース — Webサイト・アプリの基本操作フロー、A/Bテストの補完

ゲリラテスト（廊下テスト）

カフェや廊下で通りかかった人に5〜10分だけテストしてもらう非公式な手法です。「コストゼロで今すぐ始めたい」という場合の最初の一歩に最適です。

ヒューリスティック評価

UXの専門家が、ニールセンの10原則などのガイドラインに基づいてUIを評価する手法です。ユーザーは参加しません。

手法比較表

手法	コスト	期間	発見の深さ	推奨人数
対面テスト	中〜高	1〜2週間	深い	5〜8人
リモートテスト	低〜中	3〜5日	中程度	10〜20人
廊下テスト	ほぼ0円	半日〜1日	浅め	3〜5人
ヒューリスティック評価	低	1〜3日	中程度	専門家2〜3人

2026年版ユーザビリティテストツール比較

リモートテスト・録画ツール

ツール名	料金	特徴	向いているケース
Maze	無料〜$99/月	プロトタイプ（Figma連携）のテストに強い。定量データが自動集計	UIプロトタイプの大量テスト
UserTesting	要見積もり	英語圏中心だがパネルが豊富。動画録画＋AI分析	グローバルサービスの検証
Lookback	$25〜/月	対面・リモート両対応。観察者用の別窓あり	定性的な深掘りテスト
Zoom + OBS	無料〜	既存ツールで代替可能。画面録画・同時観察が容易	低コストな対面・リモートテスト
Figma	無料〜	プロトタイプ作成＋共有URLでブラウザ内テスト可能	設計段階の早期検証

アンケート・定量測定ツール

Googleフォーム（無料）— SUS（System Usability Scale）調査に最適
Typeform（無料〜）— 回答体験が良く離脱率が低い。事後インタビューに
Hotjar（無料〜）— ヒートマップ・セッション録画。リリース後の継続改善に
Microsoft Clarity（無料）— Hotjar類似。無料で使えるヒートマップ・録画ツール

最初の1回は「Figma（無料）でプロトタイプ → Zoom画面共有で録画 → Googleフォームでアンケート」の組み合わせで十分です。コスト0円でもプロ品質のテストが実施できます。

ユーザビリティテストの進め方【6ステップ】

ステップ1：テスト計画を立てる

「使いやすさを確認したい」という漠然とした目的では、テスト後に何も改善できません。具体的な検証仮説を立てることから始めます。

計画で決めるべき5項目：

検証仮説 — 「新規ユーザーが会員登録を5分以内に完了できるか」など具体的に
被験者の条件 — ターゲットユーザー層（年齢・職種・ITリテラシー等）
実施方法 — 対面 or リモート、使用デバイス（PC/スマホ）
評価指標 — タスク完了率、所要時間、エラー回数、SUSスコア
スケジュール — 計画〜改善完了までのマイルストーン

テスト計画チェックリスト：

□ テストの目的・検証仮説が明確になっている
□ ターゲットユーザーのプロフィールが定義されている
□ テスト環境（デバイス・ブラウザ等）が決まっている
□ 実施スケジュールが確定している
□ 録画・観察ツールが準備できている

ステップ2：タスクと質問を設計する

タスクは「実際の業務・利用シーン」に近い形で設計することが最重要です。「ボタンを押してください」ではなく、「友人に商品を贈るため、3,000円以内のギフトを選んで購入してください」のように、ゴールを自然な言葉で伝えます。

良いタスク設計のポイント：

操作手順を直接指示しない（「左上のメニューをクリック」はNG）
現実の業務・利用シーンに近いシナリオにする
1タスクは5〜15分で完了できる粒度にする
重要な画面フローを3〜5タスク程度に絞る
難易度が低い→高いの順番で並べる

思考発話法（シンクアラウド法）の活用：
テスト中は「今、何を考えているか声に出して教えてください」と被験者に伝えます。これにより「なぜそのボタンを押したか」「なぜ迷ったか」という内部状態が把握でき、UIの改善ポイントを特定しやすくなります。

タスク設計チェックリスト：

□ 操作手順を誘導する表現が含まれていない
□ 現実の利用シーンに即したシナリオになっている
□ タスクの難易度が被験者のスキルに合っている
□ 思考発話法の説明を準備している
□ 事前アンケート・事後インタビューの質問が用意されている

ステップ3：被験者をリクルートする

ニールセンの研究に基づけば、最低5人でテストすれば問題の85%を発見できます。予算に応じて以下の方法を選んでください。

被験者リクルートの選択肢：

廊下テスト（コスト0円） — 社内の別部署スタッフに5〜10分だけ依頼。最初の一歩に最適
知人・既存顧客（低コスト） — 実際のユーザー層に近い人を紹介してもらう
クラウドソーシング — ランサーズ・クラウドワークスで条件を指定して募集（リモートテスト向け）
リクルートサービス（中〜高コスト） — popinsight等の専門会社に委託。質の高い被験者を短期間で確保

被験者選定チェックリスト：

□ ターゲットユーザー像（ペルソナ）を定義している
□ ITリテラシーレベルが実際の利用者と合っている
□ 開発関係者・社内スタッフは除外している
□ 謝礼・同意書・秘密保持の準備ができている
□ スクリーニング質問で条件に合う人を事前選別している

ステップ4：テストを実施する

テスト当日は被験者がリラックスできる環境づくりが最優先です。「テストされているのはシステムであり、あなたの能力を評価しているわけではない」と冒頭に必ず伝えましょう。

テスト当日の流れ（60分の場合）：

アイスブレイク・自己紹介（5分）
テストの目的・思考発話法の説明（5分）
思考発話法の練習（「コーヒーを淹れる手順を声に出しながら説明する」等）（3分）
タスク実施・観察・録画（30〜40分）
事後インタビュー・SUSアンケート（10〜15分）

モデレーターが注意すべきこと：

被験者が迷っていても、ヒントを与えない（観察が目的）
「正解があります」「使いにくいですか？」などの誘導発言をしない
被験者の発言・行動・表情を逐一メモする
タスク完了/未完了の判断基準を事前に決めておく（制限時間を設定する等）
被験者の沈黙が2分以上続いたら「今何を考えていますか？」と中立的に聞く

テスト当日チェックリスト：

□ 録画・録音の許可を同意書で取得している
□ テスト環境（URL・アカウント・デモデータ）が整備されている
□ モデレーターガイド（進行台本）を準備している
□ 観察者向けの別室またはリモート視聴環境がある
□ タスクシートを被験者に渡す準備ができている

ステップ5：結果を分析する

テスト結果は「発生頻度×影響度」で優先順位をつけます。5人中4人以上が詰まった問題は最優先で改善します。

問題の優先度分類：

優先度	基準	対応方針
最優先（Critical）	5人中4人以上がタスク未完了	次のスプリントで即修正
高（High）	5人中3人以上が大きな迷いあり	1ヶ月以内に改善
中（Medium）	2人が指摘した問題	次回アップデートで対応
低（Low）	1人のみの指摘・好みの問題	バックログに追加

SUS（System Usability Scale）スコアの活用：
SUSは10問の標準アンケートでユーザビリティを0〜100点で数値化できます。無料で実施でき、改善前後の比較に有効です。一般的に68点以上が「平均的」、80点以上が「優れている」の基準です。

アフィニティダイアグラム（KJ法）による分析：
複数の被験者の発言・行動を付箋に書き出し、類似のものをグルーピングすることで、根本的な問題の構造を可視化できます。

ステップ6：改善して再テストする

ユーザビリティテストは1回で終わりにせず改善→再テストのサイクルを回すことが重要です。「5人でテスト→主要問題を修正→3人でもう一度テスト」という短いサイクルが最も効果的です。

改善サイクルの目安：

Critical問題の修正後：1〜2週間以内に再テスト
通常の改善サイクル：月1〜2回のペースで継続
大規模リニューアル後：必ずリリース前に5人テスト

SUS（System Usability Scale）スコアの測り方

SUSは1986年にジョン・ブルックが開発した、ユーザビリティを数値化する標準的なアンケートです。10の質問に「全く思わない（1点）〜強くそう思う（5点）」で回答し、計算式で0〜100点のスコアを算出します。

SUSの10項目（日本語訳）：

このシステムを頻繁に使いたいと思う
このシステムは必要以上に複雑だと感じた
このシステムは簡単に使えると思った
このシステムを使うには技術的な支援が必要だと思う
このシステムの様々な機能はうまく統合されていると思った
このシステムには一貫性がないと思った
多くの人がすぐにこのシステムの使い方を覚えられると思う
このシステムはとても使いにくいと思った
このシステムを使うのは自信を持ってできると感じた
このシステムを使い始める前に多くのことを学ぶ必要があった

スコアの解釈：

90点以上：Excellent（卓越している）
80〜89点：Good（優れている）
68〜79点：OK（平均的・許容範囲）
51〜67点：Poor（問題あり）
50点以下：Awful（深刻な問題あり）

中小企業・低コストで始めるユーザビリティテスト

「専門家がいない」「予算がない」という中小企業でも、以下の方法で低コストにテストを始められます。

コストゼロで始める「廊下テスト」

同僚や社内の別部署スタッフに5〜10分のタスクをやってもらうだけで、最初のフィードバックが得られます。開発したシステムに慣れていない人であれば、社内スタッフでも有効です。

無料・低コストツールの組み合わせ

プロトタイプ作成 — Figma（無料プランで共有・テスト可能）
録画・観察 — Zoom/Google Meet（画面共有+録画機能）
リモートテスト — Maze（無料プランあり・Figma連携）
アンケート — Googleフォーム（SUSアンケートに最適）
ヒートマップ — Microsoft Clarity（無料・制限なし）

プロトタイプ段階でのテストが最もコスパが高い理由

開発完了後にユーザビリティ問題が見つかった場合の修正コストは、設計段階の10〜100倍になるとも言われています。UIの画面遷移を1つ変えるだけで数十時間の修正が発生することもあります。プロトタイプ段階でテストすることで、後工程の大幅なやり直しを防げます。

プロトタイプ開発の詳細は、プロトタイプ開発とは？メリット・費用・進め方をご覧ください。

UI/UX設計プロセスへの組み込み方

ユーザビリティテストはUI/UX設計のプロセスと組み合わせることで最大の効果を発揮します。

開発フェーズ	テスト内容	推奨手法
要件定義	既存システムの問題点調査	対面インタビュー
設計・プロトタイプ	画面遷移・操作フローの検証	対面テスト（廊下テスト）
開発中	主要機能の操作性確認	廊下テスト・リモートテスト
リリース前	総合的なタスク完了率確認	対面テスト（5人以上）
運用中	継続的な改善	Hotjar/Clarity＋定期テスト

システム開発全体の品質管理については、システム開発の検収ガイドとシステム開発のテスト工程も参考にしてください。

よくある失敗と対策

失敗1：被験者にヒントを与えてしまう

「ここをクリックすればいいですよ」「わかりにくいですよね？」という発言はテストを台無しにします。
対策：モデレーターガイドに「誘導しない」を明記し、「困ったら声に出してください、でも私はヒントを出しません」と事前に伝える。

失敗2：社内スタッフ・開発者のみでテストする

システムを知っている人がテストしても、実際のユーザーの体験は再現できません。
対策：開発関係者は除外し、最低2〜3人は社外・実際のユーザー層から確保する。

失敗3：テスト結果を改善につなげない

「テストして終わり」では意味がありません。
対策：テスト後48時間以内に問題リストを作成し、優先度をつけて次のスプリントに組み込む。

失敗4：リリース直前にしかテストしない

リリース直前では修正コストが高く、大きな変更ができません。
対策：プロトタイプ段階から小さくテストを繰り返す。「1回5人×複数回」の方が「1回30人」より効果的です。

失敗5：定性データだけで判断する

「被験者が褒めた」「1人が問題を指摘した」だけでは優先度の判断が難しい。
対策：SUSスコアやタスク完了率などの定量データと組み合わせて判断する。

FUNBREWのプロジェクトでは、プロトタイプをFigmaで作ってユーザビリティテストを実施してから開発を始めるフローを標準化しています。「作ってみたら全然使われなかった」という最悪のケースを、小さな投資（テスト半日〜1日）で予防できます。

まとめ

ユーザビリティテストは、システム・Webサイトの「使いにくさ」を客観的に発見するための最も効果的な手法です。

5人のテストで問題の85%を発見できる（ニールセン研究）
廊下テスト（無料）からリモートテスト（有料ツール）まで、予算に応じた方法がある
Figma+Zoom+Googleフォームの組み合わせでコスト0円から始められる
計画→タスク設計→リクルート→実施→分析→改善の6ステップで進める
プロトタイプ段階でのテストが最もコスト効率が高い
SUSスコアで定量的に改善効果を測定できる
改善→再テストのサイクルを継続的に回すことが品質向上のカギ

システム開発やUI/UX改善のご相談は、お問い合わせからお気軽にどうぞ。FUNBREWでは、プロトタイプを作って確認しながら進める開発スタイルで、使いやすいシステムづくりをサポートしています。

よくある質問

ユーザビリティテストは何人で実施すればよいですか？

ヤコブ・ニールセンの研究によると、5人のユーザーでテストすれば問題の約85%を発見できます。初めてのテストであれば5人から始めるのが最もコスパが高いです。被験者の数を増やすより、改善後に再テストするサイクルを回す方が効果的です。

ユーザビリティテストにかかる費用・期間は？

社内スタッフを使った廊下テストであればコスト0円・1日で実施できます。対面テスト（5人）を外部リクルートで実施する場合は3〜10万円・1〜2週間が目安です。専門会社に委託する場合は30〜100万円程度が相場ですが、その分質の高い被験者・詳細な分析レポートが得られます。

ユーザビリティテストとユーザーテスト（受け入れテスト）の違いは？

ユーザビリティテストは「使いやすさの問題を発見する」ことが目的の調査手法で、観察・測定が中心です。一方、ユーザーテスト（受け入れテスト/UAT）はシステムが「仕様通りに動作するか」を確認するテスト工程です。前者はUXリサーチ、後者はQA・品質保証の文脈で使われます。

ユーザビリティテストはどの開発フェーズで実施すべきですか？

最もコスパが高いのはプロトタイプ段階です。開発完了後に問題が見つかった場合の修正コストは、設計段階の10〜100倍になることもあります。理想的には「設計→テスト→修正」を小さいサイクルで繰り返すことで、リリース時の品質を高められます。

SUS（System Usability Scale）とは何ですか？

SUSは10問の標準アンケートでユーザビリティを0〜100点に数値化できる手法です。無料で実施でき、改善前後の比較や他システムとのベンチマークに活用できます。一般的に68点以上が「平均的」、80点以上が「優れている」の基準です。Googleフォームで配布すれば簡単に集計できます。

リモートユーザビリティテストにおすすめのツールは？

無料で始めるならFigma（プロトタイプ作成）＋Zoom（録画）＋Googleフォーム（SUSアンケート）の組み合わせが最もコスパが高いです。有料ツールでは、Maze（Figma連携・定量データ自動集計）やLookback（対面・リモート両対応）が人気です。ヒートマップ・セッション録画にはMicrosoft Clarity（完全無料）もおすすめです。

思考発話法（シンクアラウド法）はどう進行しますか？

被験者に「操作しながら今考えていること・感じていることを声に出してください」と説明します。テスト前に練習として「コーヒーを淹れる手順を声に出しながら説明してください」等の簡単なタスクで慣れてもらいます。モデレーターは被験者が黙り込んだら「今何を考えていますか？」と中立的に促し、ヒントや誘導は絶対に行いません。

ユーザビリティテストのタスク設計はどう作ればいいですか？

良いタスクは「現実の行動」を模した具体的な文章で書きます。例：×「商品を検索してください」→○「誕生日プレゼントに3,000円以内のアイテムを探して、カートに入れてください」。タスクに正解や誘導のキーワードを入れないことが重要です（「購入ボタンを押してください」は禁止）。タスク数は1回のテストで3〜5個が集中力の限界で、所要時間は30〜60分を目安にします。

ユーザビリティテストの結果はどうまとめれば開発チームに伝わりますか？

効果的な報告書の構成は①サマリー（発見した主要問題3〜5つ）、②問題の深刻度評価（高・中・低）、③各問題の録画タイムスタンプと被験者コメント、④改善案の提示です。問題の深刻度は「何人の被験者が詰まったか」と「業務影響度」の2軸で評価します。エビデンスとして録画のスクリーンショットや発話引用を添えると、開発チームの優先度判断が格段に速くなります。

社内システム（業務用アプリ）にもユーザビリティテストは有効ですか？

はい、むしろ業務システムこそ効果が高い分野です。社内システムは「慣れて使えるようになる」前提で設計されがちですが、ユーザビリティが低いと習熟コストが高く、操作ミスによるデータ誤入力や業務遅延が発生します。被験者は実際の業務担当者から5人を選べばよく、外部リクルートコストが不要です。新システム導入前の受け入れテスト（UAT）と組み合わせて実施すると移行後のトレーニングコスト削減につながります。

UI/UXの改善・ユーザビリティテストのご相談

使いにくいシステムの改善、ユーザビリティテストの設計・実施支援について、お気軽にご相談ください。

無料で相談する

この記事をシェア

使いやすいシステム開発はFUNBREWへ

FUNBREWでは、プロトタイプを作って確認しながら進める開発スタイルで、使いやすいシステムを提供しています。まずはお気軽にお問い合わせください。

お問い合わせはこちら

まずは気軽にご相談ください

「まだ具体的に決まっていない」「とりあえず話を聞きたい」でも大丈夫。プロトタイプを見ながら、一緒にアイデアを形にしていきましょう。

相談無料オンライン対応 1週間でプロトタイプ

無料でオンライン相談 LINEで気軽に相談