如今,合成用戶在用戶體驗(yàn)研究中被廣泛使用已是司空見慣。畢竟,隨著人工智能的興起,合成數(shù)據(jù)生成正在成為獲取洞察的新常態(tài)。
具體來說,合成數(shù)據(jù)生成市場規(guī)模預(yù)計(jì)將以31.1% 的復(fù)合年增長率增長[1]。這意味著它不僅在增長,而且每年都在加速增長。到 2030 年,這個(gè)市場的價(jià)值可能達(dá)到驚人的 23.4 億美元。簡而言之,合成數(shù)據(jù)正變得如此龐大,企業(yè)無法忽視。
當(dāng)然,合成用戶,或 AI 生成的人物角色,只是合成數(shù)據(jù)生成的一種應(yīng)用。合成數(shù)據(jù)的范疇要廣泛得多。它涵蓋了從虛假用戶到虛假行為、交互,甚至是 AI 模型訓(xùn)練所用的虛假數(shù)據(jù)集等各種內(nèi)容。具體來說,在用戶體驗(yàn)研究中,合成用戶是為了模仿真實(shí)用戶的行為而創(chuàng)建的,這是利用合成數(shù)據(jù)進(jìn)行設(shè)計(jì)和測試的一種方式。
這是企業(yè)無法忽視的。例如,一家大型電商公司如果過度依賴與人工智能生成的人物角色的互動(dòng),很容易就會(huì)將其用戶體驗(yàn)研究預(yù)算削減 30%。
是的,他們或許會(huì)因在經(jīng)濟(jì)意義上徹底革新行業(yè)而獲得贊譽(yù)[2]。但代價(jià)是什么呢?有些人甚至走得更遠(yuǎn)——馬克·里森稱贊合成數(shù)據(jù)改變了研究領(lǐng)域的格局。他強(qiáng)調(diào),一些新的研究表明,人工智能生成的消費(fèi)者數(shù)據(jù)與真實(shí)調(diào)查的結(jié)果“相似度高達(dá)90%左右” 。[3]
即使取得了這樣的成功,公司最終仍會(huì)遭遇客戶投訴,投訴內(nèi)容包括設(shè)計(jì)不佳和需求未得到滿足。這是因?yàn)楹铣蓴?shù)據(jù)有其局限性和風(fēng)險(xiǎn)。
是的——AI驅(qū)動(dòng)的用戶是基于真實(shí)用戶數(shù)據(jù)的合成角色,它們模擬用戶與功能的交互,提供初步洞察。然而,在AI角色中表現(xiàn)良好的功能在真實(shí)用戶中仍可能失敗,因?yàn)锳I驅(qū)動(dòng)的反饋缺乏情感深度和不可預(yù)測性,因此現(xiàn)實(shí)世界的驗(yàn)證至關(guān)重要。因此,如果僅僅依賴AI生成的洞察,用戶參與度下降,并需要進(jìn)行成本高昂的重新設(shè)計(jì),也就不足為奇了。
這就引出了一個(gè)關(guān)鍵問題:人工智能生成的角色真的能在用戶體驗(yàn)研究中取代人類的直覺嗎?或者我們是否會(huì)因?yàn)檫^度依賴合成數(shù)據(jù)而危及創(chuàng)新?
本文將深入探討這些問題,探討在用戶體驗(yàn)設(shè)計(jì)和研究中使用合成用戶的機(jī)會(huì)和局限性。
此外,設(shè)計(jì)師將更清楚地了解何時(shí)以及如何在用戶體驗(yàn)研究中有效地整合合成用戶。
根據(jù)Neilsen/Norman Group 的說法,他們將合成用戶定義為“試圖模仿用戶群的人工智能生成的資料,提供未研究真實(shí)用戶而產(chǎn)生的人工研究結(jié)果”。
UX 研究使用模擬用戶來獲取用戶洞察,測試界面、工作流程和設(shè)計(jì)元素,而無需依賴人類參與者。正如我們所見,人工智能正在持續(xù)革新各行各業(yè),UX 研究也不例外。
目前,67% 的科技企業(yè)在其開發(fā)工作流程中使用合成數(shù)據(jù),而 2019 年這一比例僅為 23% [4]。許多此類公司越來越多地使用合成用戶來加速測試并研究全球市場的用戶行為,從而節(jié)省時(shí)間和成本。然而,這種對(duì)人工智能生成人物角色的日益依賴,引發(fā)了關(guān)于合成用戶研究的準(zhǔn)確性、倫理道德和有效性的關(guān)鍵問題(本文稍后將對(duì)此進(jìn)行探討)。
但首先,讓我們更多地了解合成用戶。
它們究竟是如何被創(chuàng)造出來的?這些虛擬用戶通常是使用人工智能模型構(gòu)建的,這些模型基于大量真實(shí)用戶交互、行為模式和決策過程的數(shù)據(jù)集進(jìn)行訓(xùn)練。基本上,這些數(shù)據(jù)來自整個(gè)互聯(lián)網(wǎng)!
傳統(tǒng)的 UX 角色基于對(duì)真實(shí)用戶群的定性和定量研究,而合成用戶則完全由數(shù)據(jù)驅(qū)動(dòng),并通過 AI 或訓(xùn)練有素的 LLM 生成。
我們深知,傳統(tǒng)用戶畫像需要基于市場調(diào)研手動(dòng)創(chuàng)建和驗(yàn)證。而合成用戶則可以根據(jù)人工智能生成的洞察動(dòng)態(tài)調(diào)整其設(shè)置。因此,企業(yè)對(duì)使用合成用戶的前景充滿興趣,因?yàn)樗灰暈橐环N可擴(kuò)展且經(jīng)濟(jì)高效的替代方案。
無論如何,合成用戶確實(shí)缺乏人類參與者在用戶體驗(yàn)研究中所能展現(xiàn)的真實(shí)人類情感的深度和不可預(yù)測的行為。但了解合成用戶的優(yōu)勢,挖掘其潛力,終將是一個(gè)明智的選擇。
模擬用戶可能會(huì)在設(shè)計(jì)領(lǐng)域引發(fā)負(fù)面情緒,但不可否認(rèn)的是,它有時(shí)在用戶體驗(yàn)研究中是一個(gè)有價(jià)值的工具。將模擬用戶納入用戶體驗(yàn)研究可以帶來以下一些好處:
這是我們最需要的優(yōu)勢。根據(jù)項(xiàng)目的性質(zhì),與真實(shí)人類用戶進(jìn)行用戶體驗(yàn)研究通常既耗時(shí)又費(fèi)錢,有時(shí)甚至?xí)龅綄擂蔚膶?duì)話。然而,模擬用戶消除了這些障礙,讓我們能夠以更低的成本進(jìn)行快速測試。
站在一家金融科技初創(chuàng)公司的角度,他們正在開發(fā)一款新的移動(dòng)銀行應(yīng)用。與其花費(fèi)數(shù)周時(shí)間進(jìn)行用戶訪談,不如在數(shù)小時(shí)內(nèi)生成數(shù)千名模擬用戶。
在這種情況下,擁有合成用戶可以幫助他們?cè)跁r(shí)間和預(yù)算限制至關(guān)重要的競爭激烈的市場中快速迭代。
如果您想立即獲取廣泛的用戶群體信息,那么合成用戶數(shù)據(jù)將助您一臂之力。對(duì)于那些渴望探索各種文化和可訪問性考量因素的用戶體驗(yàn)團(tuán)隊(duì)來說,將合成用戶納入研究范圍將大有裨益。
想象一下一家全球電子商務(wù)公司,當(dāng)他們可以生成合成用戶來在不同國家測試他們的網(wǎng)站,從而深入了解語言偏好和瀏覽習(xí)慣時(shí),他們會(huì)擁有多大的優(yōu)勢。
合成用戶無需訪問現(xiàn)實(shí)世界的用戶池即可模擬不同的背景。
我們必須面對(duì)現(xiàn)實(shí)——有些用戶體驗(yàn)挑戰(zhàn)會(huì)涉及??罕見、極端甚至危險(xiǎn)的情況,這些情況很難在真實(shí)用戶身上復(fù)制。正因如此,AI 生成的用戶數(shù)據(jù)可以幫助用戶體驗(yàn)研究人員識(shí)別標(biāo)準(zhǔn)用戶測試中可能無法發(fā)現(xiàn)的痛點(diǎn)。
假設(shè)一家網(wǎng)絡(luò)安全公司想測試用戶如何應(yīng)對(duì)網(wǎng)絡(luò)釣魚攻擊。這種情況通常比較敏感,也比較極端。不過,公司可以創(chuàng)建不同技術(shù)水平的用戶,了解他們?nèi)绾螒?yīng)對(duì)此類情況。
在收集真實(shí)用戶數(shù)據(jù)時(shí),用戶體驗(yàn)團(tuán)隊(duì)可能會(huì)擔(dān)心隱私問題。然而,一旦消除了對(duì)真實(shí)用戶數(shù)據(jù)的需求,合成用戶數(shù)據(jù)可以幫助遵守隱私法規(guī),同時(shí)仍然能夠獲得寶貴的用戶洞察。
站在醫(yī)療保健公司的角度來理解這一點(diǎn),他們希望優(yōu)化患者門戶網(wǎng)站,但又不想處理敏感的醫(yī)療記錄。通過使用合成用戶,他們可以測試門戶網(wǎng)站中的不同功能,同時(shí)避免隱私問題。
簡而言之,合成用戶可以幫助繞過與真實(shí)用戶數(shù)據(jù)收集相關(guān)的監(jiān)管問題。
盡管我想分享合成用戶所提供的積極因素并讓它們聽起來像是唯一的答案,但我也想提出有關(guān)其局限性的關(guān)鍵問題。
合成用戶可能有其優(yōu)點(diǎn),但他們也常常伴隨著某些缺點(diǎn),這會(huì)影響用戶體驗(yàn)研究的質(zhì)量和可靠性。
假設(shè)一家公司想要通過模擬治療對(duì)話與合成用戶測試他們的心理健康應(yīng)用程序,那么他們這樣做真的能獲得可靠的見解嗎?
在某種程度上,人工智能生成的個(gè)人資料只能提供概括性的意見。但它們往往缺乏更深層次的含義,無法真正幫助設(shè)計(jì)師對(duì)真實(shí)用戶產(chǎn)生影響。
合成對(duì)話無法捕捉人類所擁有的情感深度和不可預(yù)測性。由于無法展現(xiàn)人類的全部情感,合成用戶的發(fā)現(xiàn)往往具有誤導(dǎo)性。
AI 生成的角色可能缺乏洞察力的一個(gè)關(guān)鍵領(lǐng)域并非態(tài)度研究,而是行為研究。AI 根本無法體驗(yàn)真實(shí)的情緒,例如喜悅、沮喪、疲憊等等。然而,我們知道,通過觀察真實(shí)用戶的行為,我們可以找出這些線索,并針對(duì)他們的痛點(diǎn)制定解決方案。
更有趣的是,合成用戶甚至難以復(fù)制研究人員在人類行為中自然觀察到的某些非理性決策或自發(fā)行為。因此,合成用戶只能提供表面層面的洞察。
還記得我之前在文章中說過,人工智能模型依賴于現(xiàn)有數(shù)據(jù)集(也就是互聯(lián)網(wǎng))嗎?這意味著它們會(huì)引入某些偏見,強(qiáng)化刻板印象,而不是挑戰(zhàn)它們。
例如,人工智能模型從其訓(xùn)練數(shù)據(jù)中繼承了性別偏見和普遍刻板印象等偏見,這可能會(huì)導(dǎo)致錯(cuò)誤的假設(shè)和發(fā)現(xiàn)。
這基本上意味著,一個(gè)主要根據(jù)西方互聯(lián)網(wǎng)習(xí)慣訓(xùn)練的人工智能模型,肯定難以模擬不同新興市場的精準(zhǔn)用戶體驗(yàn)行為。因此,真實(shí)用戶在處理文化和其他具有深層含義的問題時(shí),往往更有洞察力。
假設(shè)一家專注于智能家居自動(dòng)化的公司想要了解燈光調(diào)節(jié)和用戶偏好。如果他們使用模擬用戶而非真實(shí)用戶,就很容易忽略與家居舒適度相關(guān)的文化和心理差異。
這從應(yīng)用的角度描述了這個(gè)問題。眾所周知,人工智能生成的反饋無法刻畫情感和不可預(yù)測性因素,這也意味著它缺乏現(xiàn)實(shí)世界的經(jīng)驗(yàn)。
AI 模型缺乏對(duì)現(xiàn)實(shí)世界的直覺,這常常導(dǎo)致用戶體驗(yàn)洞察不完整。如果實(shí)體過度依賴 AI 生成的反饋,這可能會(huì)很危險(xiǎn)。
另外,你可能已經(jīng)注意到了這一點(diǎn),但合成用戶或人工智能通常只想“取悅”研究人員——這種現(xiàn)象被稱為諂媚——這并不能很好地代表人類的行為。好好想想吧!
使用合成人物角色并將結(jié)果標(biāo)記為用戶測試,或?qū)⒒谶@些數(shù)據(jù)集的用戶體驗(yàn)發(fā)現(xiàn)作為研究呈現(xiàn),可能會(huì)引發(fā)倫理擔(dān)憂。這些做法可能會(huì)誤導(dǎo)利益相關(guān)者,使其對(duì)洞察的真實(shí)性和可靠性產(chǎn)生誤解。最重要的是,應(yīng)該披露這些洞察的使用情況,尤其是在做出廣泛的用戶體驗(yàn)決策時(shí),以確保透明度并避免誤導(dǎo)性陳述。
Delve AI 就是一個(gè)很好的例子。他們公開討論了合成人物角色在其研究中的創(chuàng)建和應(yīng)用,闡明了他們的方法論以及 AI 生成的數(shù)據(jù)在其過程中的作用。[5]
這表明,通過采用這種透明的做法,組織可以在堅(jiān)持道德標(biāo)準(zhǔn)的同時(shí),解決將合成數(shù)據(jù)集成到用戶體驗(yàn)研究中的復(fù)雜性。
所以事情是這樣的:我不會(huì)爭論合成用戶是否比使用真實(shí)用戶更好或更差,而是扮演魔鬼代言人并為兩者辯護(hù)。
根據(jù)我的研究和測試,我發(fā)現(xiàn)有趣的是,兩者都在用戶體驗(yàn)設(shè)計(jì)中占有一席之地,以下是一些您會(huì)感興趣的用例和場景:
場景:
從上表可以看出,沒有明顯的贏家。事實(shí)上,兩者各有利弊,這使得討論變得有趣。
在用戶體驗(yàn)設(shè)計(jì)和研究中,有一個(gè)地方可以讓合成用戶和真實(shí)用戶共同努力,實(shí)現(xiàn)更優(yōu)化的解決方案。
我建議使用合成用戶主要是為了早期構(gòu)思和假設(shè)檢驗(yàn),因?yàn)檫@既經(jīng)濟(jì)又不費(fèi)時(shí)。
為了驗(yàn)證,在任何重大產(chǎn)品發(fā)布之前,都要使用真實(shí)用戶進(jìn)行驗(yàn)證。最后,為了獲得真實(shí)世界的洞察,真實(shí)用戶是關(guān)鍵,但這并不妨礙您使用改進(jìn)的 AI 生成模型來提供更好的真實(shí)世界洞察。事實(shí)上,關(guān)鍵在于始終掌握最新的 AI 模型。
在結(jié)束本文之前,我將介紹一些將合成用戶融入用戶體驗(yàn)工作流程的實(shí)踐。我將提供一些可操作的步驟,供您日后用作未來項(xiàng)目的核對(duì)清單。
需要明確的是——在研究和測試中,合成用戶絕不會(huì)取代真實(shí)用戶。相反,這些角色應(yīng)該增強(qiáng)你的真實(shí)用戶研究。務(wù)必將人工智能生成的洞察與真實(shí)世界的測試相結(jié)合,才能取得顯著的效果。
絕不能將 AI 生成的洞察僅應(yīng)用于整個(gè) UX 流程。但你不應(yīng)忽視,它對(duì) UX 工作流程中的特定任務(wù)也有其優(yōu)勢。例如,使用合成人物角色進(jìn)行早期原型的 A/B 測試,可以幫助提供寶貴的洞察,并幫助做出高效的決策。
我之前提到過這一點(diǎn),但請(qǐng)記住,您做出的任何“重大”用戶體驗(yàn)決策都應(yīng)在實(shí)施前通過人工測試進(jìn)行驗(yàn)證。
永遠(yuǎn)不要完全相信人工智能生成的洞察,因?yàn)檫@可能會(huì)在未來給你帶來麻煩。務(wù)必使用真實(shí)的用戶反饋進(jìn)行交叉驗(yàn)證。
請(qǐng)記住,人工智能可能存在某些偏見,這可能會(huì)影響我們研究和測試的質(zhì)量。因此,請(qǐng)持續(xù)關(guān)注基于實(shí)際用戶行為數(shù)據(jù)的改進(jìn)型人工智能模型,這有助于提高準(zhǔn)確性。
不要依賴 ChatGPT 等通用工具,而是探索專門用于生成用于 UX 研究和測試的合成角色的工具,例如Synthetic Users、UXtweak、Tonic.ai和MOSTLY AI。
這通常很容易被忽略,但務(wù)必保持透明,說明在研究中何時(shí)以及如何使用合成用戶。我建議在必要時(shí)披露此類信息。這有助于你在實(shí)施重大用戶體驗(yàn)決策之前,堅(jiān)守道德立場并解決問題。
蘭亭妙微(藍(lán)藍(lán)設(shè)計(jì))www.devb.cn 是一家專注而深入的界面設(shè)計(jì)公司,為期望卓越的國內(nèi)外企業(yè)提供卓越的大數(shù)據(jù)可視化界面設(shè)計(jì)、B端界面設(shè)計(jì)、桌面端界面設(shè)計(jì)、APP界面設(shè)計(jì)、圖標(biāo)定制、用戶體驗(yàn)設(shè)計(jì)、交互設(shè)計(jì)、UI咨詢、高端網(wǎng)站設(shè)計(jì)、平面設(shè)計(jì),以及相關(guān)的軟件開發(fā)服務(wù),咨詢電話:01063334945。
藍(lán)藍(lán)設(shè)計(jì)的小編 http://www.devb.cn