なぜAIの出力を作り直してしまうのか

なぜAIの出力を作り直してしまうのか

周囲の人が何を考え、どんな悩みを抱えながら仕事をしているのかを知ることが、AI を使ってアウトプットの速度を上げること以上に大切です。

他人の仕事ほど、単純に見える

ChatGPT や Claude に頼めば、それらしいスライド資料が数分ででき上がります。構成は整理されていて、見出しは要点を押さえ、図解まで付いてきます。一見「資料作りはもうAIに任せられる」と感じた人は少なくないはずです。AI による成果物をみて「これで良いじゃない?」と評価する場面も少なくありませんが、いざ自分の仕事を頼むと厳しい目になります。「作り込みが甘い」「考慮が足りていない」「作り直した方が早い」と感じることすらあります。

スライドを作る作業は全体からするとほんの一部です。誰に何を伝えるべきなのか。彼らにとって理解しやすい形式は何か。どの順番なら腹落ちするのか。どこまで言って、何を言わずに残すのか。資料作りはこうした無数の小さな判断でできていて、その判断はでき上がったスライドには映し出されません。完成品がすべてだと思っていると、「この程度ならAIでも作れる」と判断してしまいます。

「AIで置き換えられる」という論調は、たいていはアウトプットの見た目であって、仕事そのものではありません。アウトプットだけを見て、仕事の中身まで分かった気になる場合があります。ただ、多くの仕事はアウトプットだけでは分からないニュアンスが隠れています。これはスライド作りだけでなく、様々な仕事にも当てはまります。

こうした、見た目だけで単純解釈してしまう現象を「 説明深度の錯覚(Illusion of Explanatory Depth 」と呼びます。整った成果物を見れば、その背後にある判断まで分かった気になるという認知バイアスです。表層的な解釈によるAIの仕組み化では、「なんとなく良いけど使えない」みたいなものが出来上がり、ドラフトが出来上がるスピードが上がっても完成までの距離が今までより遠くなることがあります。

Human-in-the-Loopのミスマッチ

AIだけでは高い完成度の成果物を作れないからこそ、人間が最終的にレビューする「Human-in-the-Loop」が欠かせないという論調があります。また、人の判断力や美意識が、成果の質を左右するという主張も耳にします。そのあいだにコンテキストやチェックの仕組みを充実してハーネスを整備していけば、次第に AI の出力品質が上がるという話もあります。しかし、本当にそうなのでしょうか。

料理に例えると「Human-in-the-Loop」が機能するのか疑わしく感じます。
料理が完成したあとに、他の材料を入れるともっと美味しくなると気づいたとします。あとから足せば、料理が思った通りに出来上がるわけではありません。材料は調理の最中に入っているから意味があるのであって、気づいたときには最初から作り直しです。

つまり、材料や手順が言語化されていれば完成するのかというと、そんなことはないわけです。「こんな工夫をすれば、もっと良くなるかもしれない」など、その場で咄嗟に考えたことが良い結果を生み出すことがあります。料理だけでなく、デザインでも暗黙知や人間関係によって、その場の判断が大きく変わります。 今週どこまで踏み込めるかの肌感や、特定の組織役員の関心の向きといった情報が仕事を左右することがありますが、こうした肌感は言葉にしようとした時点でこぼれ落ちます。

どれだけ丁寧に言語化しても、言語化された情報では到達できない粒度があります。ハーネスを整備しても出力が微妙にズレ続けるのは、プロンプトが下手だからではなく、私たちの判断そのものが、言語化されたものに対してレビューするという単純なワークフローではないからだと思います。にもかかわらず、ハーネスの改善に多くの時間を費やし、ようやく良いアウトプットが出たと思っても、「なんとなく違う」という理由で調整を続ける。このサイクルは、果たして仕事の効率化と言えるのでしょうか。

同じことは、エンジニアの仕事でも起きています。プログラミングは、指示通りにコードを書くだけの仕事ではなく、何を作るべきか、どこで妥協するかといった判断の連続です。その複雑さは完成したコードには表れないので、外からは「これならAIに任せられる」と見えてしまう。実際、その見立てで人員削減に踏み切った米国IT企業もありました。ところが、AIによる人員削減に踏み切った企業の半数が、数年内に同じ役割を雇い直すだろうという予測もあります。

一度は単純化して切り離した判断の複雑さに、あとから気づいたからではないでしょうか。

仕事にある判断についてもっと知ろう

もちろん、生成 AI が使えるシーンは幾つかあります。ブレストや壁打ちのように、人の判断を研ぎ澄ませたいときには大変役に立ちます。 また、AIで生成する際に、人がどのタイミングで何を判断する必要があるのか見極めることで、 Human-in-the-Loop のタイミングも変わってくるはずです。 ただ、多くの場合、私たちが最初に想像しているほど単純ではないということに気付くはずです。

私たちは完成品で物事の良し悪しを判断しがちです。しかし、そうした見方では、生成AIを使った業務も質の低い成果を量産し、人の負担をむしろ増やすだけになりかねません。私がデザインをレビューする際も、完成されたデザインに対してではなく、どういう意図でデザインしたのか引き出すようにしています。最初は「ユーザーにとって使いやすくなるよう工夫しました」と模範回答するデザイナーも、次第に複雑な事情を教えてくれます。実は、それが物事の判断の真意であり、言語化が難しい部分でもあります。

私たちの仕事は、ニュアンスや経験、場の雰囲気、人間関係といった要素を踏まえて判断しています。これは他の人の仕事でも同じです。まずは、周囲の人が何を考え、どんな悩みを抱えながら仕事をしているのかを知ることが大切です。それは、AI を使ってアウトプットの速度を上げること以上に重要であり、今後の AI 活用にも大きく響くものだと思います。

Yasuhisa Hasegawa

Yasuhisa Hasegawa

Web やアプリのデザインを専門しているデザイナー。現在は組織でより良いデザインができるようプロセスや仕組の改善に力を入れています。ブログやポッドキャストなどのコンテンツ配信や講師業もしています。