什么是合成用戶?
根據(jù)Neilsen/Norman Group 的說(shuō)法,他們將合成用戶定義為“試圖模仿用戶群的人工智能生成的資料,提供未研究真實(shí)用戶而產(chǎn)生的人工研究結(jié)果”。
UX 研究使用模擬用戶來(lái)獲取用戶洞察,測(cè)試界面、工作流程和設(shè)計(jì)元素,而無(wú)需依賴(lài)人類(lèi)參與者。正如我們所見(jiàn),人工智能正在持續(xù)革新各行各業(yè),UX 研究也不例外。
目前,67% 的科技企業(yè)在其開(kāi)發(fā)工作流程中使用合成數(shù)據(jù),而 2019 年這一比例僅為 23% [4]。許多此類(lèi)公司越來(lái)越多地使用合成用戶來(lái)加速測(cè)試并研究全球市場(chǎng)的用戶行為,從而節(jié)省時(shí)間和成本。然而,這種對(duì)人工智能生成人物角色的日益依賴(lài),引發(fā)了關(guān)于合成用戶研究的準(zhǔn)確性、倫理道德和有效性的關(guān)鍵問(wèn)題(本文稍后將對(duì)此進(jìn)行探討)。
但首先,讓我們更多地了解合成用戶。
它們究竟是如何被創(chuàng)造出來(lái)的?這些虛擬用戶通常是使用人工智能模型構(gòu)建的,這些模型基于大量真實(shí)用戶交互、行為模式和決策過(guò)程的數(shù)據(jù)集進(jìn)行訓(xùn)練。基本上,這些數(shù)據(jù)來(lái)自整個(gè)互聯(lián)網(wǎng)!
傳統(tǒng)的 UX 角色基于對(duì)真實(shí)用戶群的定性和定量研究,而合成用戶則完全由數(shù)據(jù)驅(qū)動(dòng),并通過(guò) AI 或訓(xùn)練有素的 LLM 生成。
我們深知,傳統(tǒng)用戶畫(huà)像需要基于市場(chǎng)調(diào)研手動(dòng)創(chuàng)建和驗(yàn)證。而合成用戶則可以根據(jù)人工智能生成的洞察動(dòng)態(tài)調(diào)整其設(shè)置。因此,企業(yè)對(duì)使用合成用戶的前景充滿興趣,因?yàn)樗灰暈橐环N可擴(kuò)展且經(jīng)濟(jì)高效的替代方案。
無(wú)論如何,合成用戶確實(shí)缺乏人類(lèi)參與者在用戶體驗(yàn)研究中所能展現(xiàn)的真實(shí)人類(lèi)情感的深度和不可預(yù)測(cè)的行為。但了解合成用戶的優(yōu)勢(shì),挖掘其潛力,終將是一個(gè)明智的選擇。
合成用戶確實(shí)為用戶體驗(yàn)研究帶來(lái)了好處
模擬用戶可能會(huì)在設(shè)計(jì)領(lǐng)域引發(fā)負(fù)面情緒,但不可否認(rèn)的是,它有時(shí)在用戶體驗(yàn)研究中是一個(gè)有價(jià)值的工具。將模擬用戶納入用戶體驗(yàn)研究可以帶來(lái)以下一些好處:
優(yōu)點(diǎn)1-成本和時(shí)間效率
這是我們最需要的優(yōu)勢(shì)。根據(jù)項(xiàng)目的性質(zhì),與真實(shí)人類(lèi)用戶進(jìn)行用戶體驗(yàn)研究通常既耗時(shí)又費(fèi)錢(qián),有時(shí)甚至?xí)龅綄擂蔚膶?duì)話。然而,模擬用戶消除了這些障礙,讓我們能夠以更低的成本進(jìn)行快速測(cè)試。
站在一家金融科技初創(chuàng)公司的角度,他們正在開(kāi)發(fā)一款新的移動(dòng)銀行應(yīng)用。與其花費(fèi)數(shù)周時(shí)間進(jìn)行用戶訪談,不如在數(shù)小時(shí)內(nèi)生成數(shù)千名模擬用戶。
在這種情況下,擁有合成用戶可以幫助他們?cè)跁r(shí)間和預(yù)算限制至關(guān)重要的競(jìng)爭(zhēng)激烈的市場(chǎng)中快速迭代。
優(yōu)點(diǎn)2:可擴(kuò)展性和多樣性
如果您想立即獲取廣泛的用戶群體信息,那么合成用戶數(shù)據(jù)將助您一臂之力。對(duì)于那些渴望探索各種文化和可訪問(wèn)性考量因素的用戶體驗(yàn)團(tuán)隊(duì)來(lái)說(shuō),將合成用戶納入研究范圍將大有裨益。
想象一下一家全球電子商務(wù)公司,當(dāng)他們可以生成合成用戶來(lái)在不同國(guó)家測(cè)試他們的網(wǎng)站,從而深入了解語(yǔ)言偏好和瀏覽習(xí)慣時(shí),他們會(huì)擁有多大的優(yōu)勢(shì)。
合成用戶無(wú)需訪問(wèn)現(xiàn)實(shí)世界的用戶池即可模擬不同的背景。
優(yōu)點(diǎn)3:探索邊緣情況和極端場(chǎng)景
我們必須面對(duì)現(xiàn)實(shí)——有些用戶體驗(yàn)挑戰(zhàn)會(huì)涉及??罕見(jiàn)、極端甚至危險(xiǎn)的情況,這些情況很難在真實(shí)用戶身上復(fù)制。正因如此,AI 生成的用戶數(shù)據(jù)可以幫助用戶體驗(yàn)研究人員識(shí)別標(biāo)準(zhǔn)用戶測(cè)試中可能無(wú)法發(fā)現(xiàn)的痛點(diǎn)。
假設(shè)一家網(wǎng)絡(luò)安全公司想測(cè)試用戶如何應(yīng)對(duì)網(wǎng)絡(luò)釣魚(yú)攻擊。這種情況通常比較敏感,也比較極端。不過(guò),公司可以創(chuàng)建不同技術(shù)水平的用戶,了解他們?nèi)绾螒?yīng)對(duì)此類(lèi)情況。
優(yōu)點(diǎn)#4-隱私考慮
在收集真實(shí)用戶數(shù)據(jù)時(shí),用戶體驗(yàn)團(tuán)隊(duì)可能會(huì)擔(dān)心隱私問(wèn)題。然而,一旦消除了對(duì)真實(shí)用戶數(shù)據(jù)的需求,合成用戶數(shù)據(jù)可以幫助遵守隱私法規(guī),同時(shí)仍然能夠獲得寶貴的用戶洞察。
站在醫(yī)療保健公司的角度來(lái)理解這一點(diǎn),他們希望優(yōu)化患者門(mén)戶網(wǎng)站,但又不想處理敏感的醫(yī)療記錄。通過(guò)使用合成用戶,他們可以測(cè)試門(mén)戶網(wǎng)站中的不同功能,同時(shí)避免隱私問(wèn)題。
簡(jiǎn)而言之,合成用戶可以幫助繞過(guò)與真實(shí)用戶數(shù)據(jù)收集相關(guān)的監(jiān)管問(wèn)題。
盡管我想分享合成用戶所提供的積極因素并讓它們聽(tīng)起來(lái)像是唯一的答案,但我也想提出有關(guān)其局限性的關(guān)鍵問(wèn)題。
使用合成用戶的局限性和風(fēng)險(xiǎn)
合成用戶可能有其優(yōu)點(diǎn),但他們也常常伴隨著某些缺點(diǎn),這會(huì)影響用戶體驗(yàn)研究的質(zhì)量和可靠性。
人工智能無(wú)法表現(xiàn)出真正的人類(lèi)情感。
假設(shè)一家公司想要通過(guò)模擬治療對(duì)話與合成用戶測(cè)試他們的心理健康應(yīng)用程序,那么他們這樣做真的能獲得可靠的見(jiàn)解嗎?
在某種程度上,人工智能生成的個(gè)人資料只能提供概括性的意見(jiàn)。但它們往往缺乏更深層次的含義,無(wú)法真正幫助設(shè)計(jì)師對(duì)真實(shí)用戶產(chǎn)生影響。
合成對(duì)話無(wú)法捕捉人類(lèi)所擁有的情感深度和不可預(yù)測(cè)性。由于無(wú)法展現(xiàn)人類(lèi)的全部情感,合成用戶的發(fā)現(xiàn)往往具有誤導(dǎo)性。
AI 生成的角色可能缺乏洞察力的一個(gè)關(guān)鍵領(lǐng)域并非態(tài)度研究,而是行為研究。AI 根本無(wú)法體驗(yàn)真實(shí)的情緒,例如喜悅、沮喪、疲憊等等。然而,我們知道,通過(guò)觀察真實(shí)用戶的行為,我們可以找出這些線索,并針對(duì)他們的痛點(diǎn)制定解決方案。
更有趣的是,合成用戶甚至難以復(fù)制研究人員在人類(lèi)行為中自然觀察到的某些非理性決策或自發(fā)行為。因此,合成用戶只能提供表面層面的洞察。
人工智能有點(diǎn)偏見(jiàn)!
還記得我之前在文章中說(shuō)過(guò),人工智能模型依賴(lài)于現(xiàn)有數(shù)據(jù)集(也就是互聯(lián)網(wǎng))嗎?這意味著它們會(huì)引入某些偏見(jiàn),強(qiáng)化刻板印象,而不是挑戰(zhàn)它們。
例如,人工智能模型從其訓(xùn)練數(shù)據(jù)中繼承了性別偏見(jiàn)和普遍刻板印象等偏見(jiàn),這可能會(huì)導(dǎo)致錯(cuò)誤的假設(shè)和發(fā)現(xiàn)。
這基本上意味著,一個(gè)主要根據(jù)西方互聯(lián)網(wǎng)習(xí)慣訓(xùn)練的人工智能模型,肯定難以模擬不同新興市場(chǎng)的精準(zhǔn)用戶體驗(yàn)行為。因此,真實(shí)用戶在處理文化和其他具有深層含義的問(wèn)題時(shí),往往更有洞察力。
人工智能無(wú)需上下文即可輕松做出反應(yīng)
假設(shè)一家專(zhuān)注于智能家居自動(dòng)化的公司想要了解燈光調(diào)節(jié)和用戶偏好。如果他們使用模擬用戶而非真實(shí)用戶,就很容易忽略與家居舒適度相關(guān)的文化和心理差異。
這從應(yīng)用的角度描述了這個(gè)問(wèn)題。眾所周知,人工智能生成的反饋無(wú)法刻畫(huà)情感和不可預(yù)測(cè)性因素,這也意味著它缺乏現(xiàn)實(shí)世界的經(jīng)驗(yàn)。
AI 模型缺乏對(duì)現(xiàn)實(shí)世界的直覺(jué),這常常導(dǎo)致用戶體驗(yàn)洞察不完整。如果實(shí)體過(guò)度依賴(lài) AI 生成的反饋,這可能會(huì)很危險(xiǎn)。
另外,你可能已經(jīng)注意到了這一點(diǎn),但合成用戶或人工智能通常只想“取悅”研究人員——這種現(xiàn)象被稱(chēng)為諂媚——這并不能很好地代表人類(lèi)的行為。好好想想吧!
依靠人工智能進(jìn)行用戶體驗(yàn)實(shí)踐真的合乎道德嗎?
使用合成人物角色并將結(jié)果標(biāo)記為用戶測(cè)試,或?qū)⒒谶@些數(shù)據(jù)集的用戶體驗(yàn)發(fā)現(xiàn)作為研究呈現(xiàn),可能會(huì)引發(fā)倫理?yè)?dān)憂。這些做法可能會(huì)誤導(dǎo)利益相關(guān)者,使其對(duì)洞察的真實(shí)性和可靠性產(chǎn)生誤解。最重要的是,應(yīng)該披露這些洞察的使用情況,尤其是在做出廣泛的用戶體驗(yàn)決策時(shí),以確保透明度并避免誤導(dǎo)性陳述。
Delve AI 就是一個(gè)很好的例子。他們公開(kāi)討論了合成人物角色在其研究中的創(chuàng)建和應(yīng)用,闡明了他們的方法論以及 AI 生成的數(shù)據(jù)在其過(guò)程中的作用。[5]
這表明,通過(guò)采用這種透明的做法,組織可以在堅(jiān)持道德標(biāo)準(zhǔn)的同時(shí),解決將合成數(shù)據(jù)集成到用戶體驗(yàn)研究中的復(fù)雜性。
合成用戶與真實(shí)用戶:如果這兩者正面交鋒,誰(shuí)會(huì)勝出?
所以事情是這樣的:我不會(huì)爭(zhēng)論合成用戶是否比使用真實(shí)用戶更好或更差,而是扮演魔鬼代言人并為兩者辯護(hù)。
根據(jù)我的研究和測(cè)試,我發(fā)現(xiàn)有趣的是,兩者都在用戶體驗(yàn)設(shè)計(jì)中占有一席之地,以下是一些您會(huì)感興趣的用例和場(chǎng)景:
場(chǎng)景:
- 早期構(gòu)思和假設(shè)檢驗(yàn)
合成用戶: ?高成本效益和可擴(kuò)展性
真實(shí)用戶: ?耗時(shí)且成本高昂
- 針對(duì)常見(jiàn) UX 模式的可用性測(cè)試
合成用戶: ?提供更快的反饋循環(huán)
真實(shí)用戶: ?需要真實(shí)用戶進(jìn)行驗(yàn)證
- 測(cè)試極端或罕見(jiàn)的用例
合成用戶: ?AI 可以模擬異常值
真實(shí)用戶: ?很難找到不同的參與者
- 情緒反應(yīng)和滿意度研究
合成用戶: ?AI 缺乏人類(lèi)情感
真實(shí)用戶: ?真實(shí)用戶提供真實(shí)的反應(yīng)
- 可訪問(wèn)性測(cè)試
合成用戶: ?可以模擬殘疾
真實(shí)用戶: ?真實(shí)用戶提供更深入的見(jiàn)解
- 文化背景和社會(huì)規(guī)范
合成用戶: ?AI 難以理解細(xì)微差別
真實(shí)用戶: ?真實(shí)用戶提供真實(shí)的觀點(diǎn)
- 為現(xiàn)有產(chǎn)品制作新功能
原型 合成用戶: ?快速迭代周期
真實(shí)用戶: ?提供對(duì)功能采用障礙的洞察
- 測(cè)試設(shè)計(jì)決策的倫理含義
合成用戶: ?AI 可能缺乏道德推理
真實(shí)用戶: ?真實(shí)用戶提供現(xiàn)實(shí)世界的倫理問(wèn)題視角
結(jié)合綜合用戶研究和真實(shí)用戶研究值得嗎?
從上表可以看出,沒(méi)有明顯的贏家。事實(shí)上,兩者各有利弊,這使得討論變得有趣。
在用戶體驗(yàn)設(shè)計(jì)和研究中,有一個(gè)地方可以讓合成用戶和真實(shí)用戶共同努力,實(shí)現(xiàn)更優(yōu)化的解決方案。
我建議使用合成用戶主要是為了早期構(gòu)思和假設(shè)檢驗(yàn),因?yàn)檫@既經(jīng)濟(jì)又不費(fèi)時(shí)。
為了驗(yàn)證,在任何重大產(chǎn)品發(fā)布之前,都要使用真實(shí)用戶進(jìn)行驗(yàn)證。最后,為了獲得真實(shí)世界的洞察,真實(shí)用戶是關(guān)鍵,但這并不妨礙您使用改進(jìn)的 AI 生成模型來(lái)提供更好的真實(shí)世界洞察。事實(shí)上,關(guān)鍵在于始終掌握最新的 AI 模型。
在用戶體驗(yàn)中集成合成用戶的最佳實(shí)踐
在結(jié)束本文之前,我將介紹一些將合成用戶融入用戶體驗(yàn)工作流程的實(shí)踐。我將提供一些可操作的步驟,供您日后用作未來(lái)項(xiàng)目的核對(duì)清單。
1. 使用合成用戶作為補(bǔ)充,而不是替代
需要明確的是——在研究和測(cè)試中,合成用戶絕不會(huì)取代真實(shí)用戶。相反,這些角色應(yīng)該增強(qiáng)你的真實(shí)用戶研究。務(wù)必將人工智能生成的洞察與真實(shí)世界的測(cè)試相結(jié)合,才能取得顯著的效果。
絕不能將 AI 生成的洞察僅應(yīng)用于整個(gè) UX 流程。但你不應(yīng)忽視,它對(duì) UX 工作流程中的特定任務(wù)也有其優(yōu)勢(shì)。例如,使用合成人物角色進(jìn)行早期原型的 A/B 測(cè)試,可以幫助提供寶貴的洞察,并幫助做出高效的決策。
2. 通過(guò)真實(shí)用戶測(cè)試驗(yàn)證人工智能的發(fā)現(xiàn)。
我之前提到過(guò)這一點(diǎn),但請(qǐng)記住,您做出的任何“重大”用戶體驗(yàn)決策都應(yīng)在實(shí)施前通過(guò)人工測(cè)試進(jìn)行驗(yàn)證。
永遠(yuǎn)不要完全相信人工智能生成的洞察,因?yàn)檫@可能會(huì)在未來(lái)給你帶來(lái)麻煩。務(wù)必使用真實(shí)的用戶反饋進(jìn)行交叉驗(yàn)證。
3. 利用真實(shí)數(shù)據(jù)改進(jìn)人工智能模型
請(qǐng)記住,人工智能可能存在某些偏見(jiàn),這可能會(huì)影響我們研究和測(cè)試的質(zhì)量。因此,請(qǐng)持續(xù)關(guān)注基于實(shí)際用戶行為數(shù)據(jù)的改進(jìn)型人工智能模型,這有助于提高準(zhǔn)確性。
不要依賴(lài) ChatGPT 等通用工具,而是探索專(zhuān)門(mén)用于生成用于 UX 研究和測(cè)試的合成角色的工具,例如Synthetic Users、UXtweak、Tonic.ai和MOSTLY AI。
4. 始終保持道德透明度
這通常很容易被忽略,但務(wù)必保持透明,說(shuō)明在研究中何時(shí)以及如何使用合成用戶。我建議在必要時(shí)披露此類(lèi)信息。這有助于你在實(shí)施重大用戶體驗(yàn)決策之前,堅(jiān)守道德立場(chǎng)并解決問(wèn)題。