合成データを活用したリサーチの可能性

合成データにより仮説構築のスピードが上がり、新たな問題定義や解決策の発見を促進できる可能性があります。

合成データを活用したリサーチの可能性

合成データって知ってる?

一部の研究によると、AI企業は高品質な自然データを2026年までに使い尽くす可能性があると指摘されています。また、2025年1月にはイーロン・マスク氏が「AI訓練に必要な人類の知識は、実質的に昨年の時点で使い果たされた」と発言しています。もちろん、デジタル化されていない情報は依然として膨大に残っており、実際には学習可能なデータがまだ存在しています。しかし、より複雑なAIモデルを構築するためには、さらに多くのトレーニングデータが必要とされています。

こうした状況への対策として、合成データが注目されています。合成データ(Synthetic Data)とは、現実世界のデータを模倣して人工的に生成されたデータです。合成データは、研究、テスト、新規開発、機械学習の分野で既に利用されています。また、市場はさらに拡大すると予測されています。人によって作られたデータではないので、プライバシーの心配もなく、エッジケースも考慮できるのも注目ポイントです。

AIによる合成データを活用することで、これまで想定していなかったユースケースを多数洗い出せる可能性がでてきました。ユーザー理解を深める活動をAIだけに頼るのは良い方法ではありませんが、膨大なデータから生成された結果であれば、完全に的外れというわけではないかもしれません。また、ユースケースを10や20にとどめず、さらに多く発見できれば、プロダクト開発やリサーチに新たな方向性を示すきっかけとなる可能性があります。

そこで実際、試してみました。

1,000 のユースケースからの分析

Uber Eatsを題材に、1,000ものユースケースと、それぞれのペインポイントを出力しました。共働き3人家族といった一般的なものから、留学生のルームメイトといった少し変わったものまで、多種多様なユースケースが含まれています。これらはすべて架空のケースですが、それっぽいユースケースばかりです。また、短時間で膨大なユースケースを俯瞰するだけでも、多くの発見につながります。

1000件のユースケースをCSV形式でまとめました

たとえば、「研究施設のセキュリティ規定で配達場所が限定される」や、「作業中の集中が途切れることへの焦りから、配達待ち時間にイライラが募る」などのペインポイントを通じて、新たな視点を得るきっかけとなりました。

ユースケースを分析した結果、時間に関連する問題が全体の半分を占めていることが分かりました。一見すると、Uber Eatsには既に追跡機能があるため、時間関連の問題は解決しているようにも見えます。しかし、ユースケースを詳細に見ていくと、時間に関する課題には細かなニュアンスが存在することが分かりました。

合成データが出力したペインポイントの傾向

出力されたユースケースから、ユーザーが求めているのは単なる時間の「追跡」ではなく、「予測と調整」ではないかという仮説が生まれました。つまり、「今どこにいるか」が分かるだけでは不十分で、「全体としていつ届くか」を確実に予測できることが求められているのです。この予測が不確実だと、仕事中や育児中など、特定の文脈では許容できない(ペイン)につながる可能性があるようです。

架空のユースケースに対して仮説を立てたり、想像を膨らませることに意味を感じない人もいるかもしれません。しかし、このユースケースをもとに、どんな人にインタビューを行い、どのような質問をすれば良いかを具体的に決めるヒントを得ることができます。たとえば、「時間に関する問題の文脈依存性」や「追跡機能の実際の使用パターンとその限界」をリサーチするという新たな問いが生まれます。また、わずかな休憩時間しか取れない人や、急な状況変化が起こりやすい医療従事者や子育て中の親などを対象にインタビューを行うといった、リクルーティングの方向性を絞り込む手がかりにもなります。

定量調査をもとにインタビュー計画を立てることがありますが、これに加えて合成データを組み合わせるという、新たな可能性を見出すこともできそうです。

合成データによってインタビューの価値が増す

生成AIの活用に関する話題では、従来の手法が不要になるという論調が目立ちがちです。しかし、私は、合成データの活用はインタビューの本質的な価値をより明確にするチャンスだと考えています。合成データが提供する一貫した解釈に対し、実際のインタビューは予測不可能な発見や、これまでになかったインサイトを引き出す可能性を広げるものだと思います。インタビューは、人間特有の非線形な思考や、予期せぬ文脈を発見する場としての役割がより重要になるのかもしれません。

合成データがリアルではないという点は紛れもない事実です。しかし、だからといって使えないデータとは言い切れません。適切な文脈を提供することで、自社のニーズに合った生成データを出力することが可能になるはずです(今回、Uber Eatsを題材に選んだ理由の一つは、文脈の説明を省けるから)。仮説構築のスピードが上がることで、新たな問題定義や解決策の発見を促進できる可能性があります。リサーチは今後さらに面白くなりそうな予感がしています。

Yasuhisa Hasegawa

Yasuhisa Hasegawa

Web やアプリのデザインを専門しているデザイナー。現在は組織でより良いデザインができるようプロセスや仕組の改善に力を入れています。ブログやポッドキャストなどのコンテンツ配信や講師業もしています。