對話多鄰國:用好AI大模型後,我們的付費用戶暴增超50%|36氪專訪

36氪 2024-04-30 10:10:26

作者|武靜靜

編輯|鄧詠儀

一家線上教育産品公司如何巧用大模型之力獲得新增長?多鄰國可以稱得上是全球市場典型的範本之一。

從産品來看,你很難感受到這是一家已經成立13年的“老公司”——作爲一個教育App,它的用戶忠誠得驚人,且還保持著飛速增長。2023年第四季度,多鄰國付費用戶達到660萬,同比增長57%,付費會員收入約爲1.6億美元。

“公司實現了創紀錄的用戶參與度和創紀錄的訂戶數量。”Duolingo首席執行官Luis von Ahn稱。

而在國內,多鄰國再度火出圈,人們在蹦迪時、喝酒、旅遊時都不忘在多鄰國每日打卡,在網上紛紛曬出連勝紀錄。連多鄰國標志性的logo“小綠鳥”,在社交平台上都已經成爲一個搞笑IP。

多鄰國品牌形象

學語言,就和打遊戲一樣輕松——多鄰國開創了一種新鮮的教育産品體驗,這是其長盛不衰的原因所在。多鄰國首席商務官Bob Meese告訴36氪,他們認爲,教育應用的關鍵就是讓用戶有學習動機,“我們在産品中融合了各種玩法、獎勵系統,讓學習變得有趣,從而達成學習目標。”

多鄰國的首席商務官Bob Meese

産品爆火的同時,多鄰國的業績也在持續騰飛。從財報表現來看,多鄰國的營收連續四個季度均實現了40%以上的增長。2024年第一季度,公司營收達1.16億美元,同比增長42%。

這些亮眼的表現背後,大模型也是一位隱藏的大功臣。

多鄰國是最早把大模型技術用在教育應用的科技公司之一。早在2021年——ChatGPT發布前一年,公司就開始和OpenAI合作,集成了GPT-3,開始用AI試水教育産品。在2023年GPT-4發布當天,多鄰國就推出一款由GPT-4 支持的新産品Duolingo Max,目前僅在部分歐美國家試運營。

多鄰國把大模型融入新産品開發、教學內容生成、産品交互等方方面面。多鄰國首席商務官Bob Meese告訴36氪,“像任何創新工具一樣,只要有一個好的操作員,大模型可以爲我們的的課程研發團隊帶來便利、速度和生産力。”

多鄰國的喜人增長和對AI技術的應用過程,有什麽經驗和方法可供創業公司參考?近期,36氪對話了多鄰國的首席商務官Bob Meese,以及多鄰國英語測試全球考生業務負責人王妍,聊了聊他們的思考。

多鄰國英語測試全球考生業務負責人王妍

以下是對話實錄,經36氪編輯整理:

GPT-4發布後,AI教學已經能趕上人類老師

36氪:在引入生成式AI的過程中,多鄰國如何安排産品的優先級?會選擇先在哪些各個環節和産品上試水?

Bob Meese: 多鄰國學習App、多鄰國英語測試,兩者均引入了生成式AI技術。

在與OpenAI攜手成爲首發合作夥伴時,首先,我們利用AI打造了類似于聊天機器人交互式體驗,這一功能最初被集成到高級訂閱服務——Duolingo Max中。

Duolingo Max兩大功能爲:解釋我的回答(Explain My Answer)和角色扮演(Roleplay)。前者會利用AI給題目提供具體的解釋,由貓頭鷹多兒以聊天機器人的形式發送;後者能讓學習者和AI以場景爲中心,進行及時對話。

除了交互式特性的開發,我們還利用AI技術來輔助內容生成。特別針對中級和更高水平學習者的內容,而AI可以生成教學內容,極大地提高生産效率。

王妍:在利用AI輔助內容生成方面,我們發現,多語言內容的生成對于學習體驗至關重要。而傳統上,這些內容由教師創建,借助AI大模型能顯著加快這一過程。原本需要幾十個小時准備的課程,現在僅需幾個小時即可完成。

36氪: 多鄰國英語測試(DET)這款産品目前在中國已經積累了大量用戶,它是如何結合大語言模型的?

王妍:DET很早就與OpenAI展開合作,甚至在ChatGPT發布之前。所以最初開始,AI技術就是核心和基礎。我們一直在引領潮流,不是跟隨者。

GPT模型不僅提高了效率,也確保了測試的公平性和中立性。通過大語言模型,我們能夠生成各種題型,並結合內部的質量檢測流程,確保題目對全球不同背景的考生都是公平和適宜的。同時也避免了人爲出題帶來的主觀性,試題更全面。

此外,我們還引入了最新的題型,包含了互動寫作(Interactive Writing)等新型互動題型,這些題型都采用了生成式AI技術。在互動寫作中,考生回答一個問題後,AI模型會基于答案實時生成下一道題目,提供一種多輪、個性化的測試體驗。

多鄰國英語測試(DET)數據

這種方法不僅能夠更深入地測試考生的對話能力,還能在短時間內准確地評估考生是否真正掌握了對話技巧。通過創新題型,測試的質量和效率明顯提升。

36氪:大模型的泛化能力很強。多鄰國除了接入GPT-4基礎模型之外,是否有做更多額外的工程化處理?

王妍:即使通用大模型,也需要我們自己在産品上進行定制化優化。

比如在語言測試産品上,多鄰國的內容通過AI生成,但教師也會從語言學習的專業維度出發,定義不同語言學習等級所需的場景、難度、詞彙量和語法覆蓋等;然後再利用AI生成符合這些要求的內容;之後,再由教師進行多輪複核。整個過程中,AI是一個提高效率的工具。

産品上,我們采用的是一種自適應測試(computer adaptive testing)的技術,這種技術本身與大模型無關,而是一個更爲成熟的計算機自適應模型。所以,多鄰國英語測試從第一題開始就會根據考生的表現實時調整難度,並據此實時調整後續的考試體驗。

這些技術基礎能夠讓我們更好的用好大模型,也是爲什麽我們能夠在很短的時間內達到傳統3小時考試的效率和內容覆蓋率的原因。

同時,我們也在不斷改進,工程師團隊會在模型的校准和使用上進行專業調試,保證AI生成效果更加精確和高效。

36氪:多鄰國是什麽時候接入GPT的?

Bob Meese:利用GPT進行內容生成開始于2021年,所以很早,多鄰國就在探索生成式AI,並和OpenAI團隊接觸。

但早期我們並沒有全面接入GPT-3,因爲當時,大模型性能尚未達到可與人類導師相媲美的水平,所以,實用性非常有限。而隨著GPT-4的出現,AI的互動體驗已經可以和人類導師相提並論。

2023年,在ChatGPT發布前六個月,我們就看到了它,並且擁有特殊的使用權限。當時,我們就已和OpenAI合作,開展一個初期項目,探索讓AI用類似于人類導師的方式教學。

36氪: 最早看到GPT的時候,最觸動你們和打動你們的點是什麽,你們認爲可以給産品帶來哪些顛覆性的改變?

Bob Meese: 作爲一家技術驅動的公司,多鄰國的創始團隊堅信,爲了覆蓋更廣泛的受衆,利用AI進行教學至關重要。但目前人類導師在教學效果上仍超越了技術。所以,早期,多鄰國主要依賴真人教師。

然而,接觸GPT-4後,我們就迅速將項目重心轉移到了新的大模型上。當時,我們的流程是,先由真人導師設計教學腳本,然後GPT-4將腳本翻譯成其他語言,並且根據給定的腳本生成內容。

舉個例子,如果腳本設計中,主角是一個有夢想的年輕女孩,GPT-4能夠基于此創造出一個完整的故事。此外,對語言學習者來說,將語言簡化到A1水平非常重要,GPT-4也能立即做到這一點。

此外,多鄰國也非常注重語言學習的趣味性,所以,我們還要求AI生成的內容是幽默、有趣的。而GPT-4能快速適應我們的需求,這是一個令人激動的突破。

大模型只是工具,産品和交互設計更重要

36氪:今年生成式AI在語音生成和視頻生成領域也很多,也有很多人開始直接用訪問ChatGPT等大語言模型作爲語言學習工具,最新的ChatGPT也開放了語音功能。隨著模型能力越來越強,你們是否會有這種被大模型替代的擔憂?

Bob Meese:我們的關注點是如何更好的激發學習者的動力,也正因如此,多鄰國的遊戲化教學方法收到很多用戶的喜歡和認可。

現階段,雖然已經在用AI升級産品,但我們的産品主線依然圍繞提升趣味性和吸引力進行。

和技術公司相比,我們認爲,OpenAI等大模型平台不會成爲競爭者,他們正朝著成爲通用技術平台的方向發展,目標是實現通用人工智能(AGI),所以並不會直接與我們競爭。

36氪: 大模型降低了新的公司構建AI教育産品的成本,面對一些新進入者,多鄰國的優勢是什麽?

Bob Meese:會有其他公司利用OpenAI的技術來提供類似的服務,但這需要考慮到成本。任何使用OpenAI技術的公司,都需要付費。問題是,他們是否能夠在承擔這些費用的同時,還提供免費服務?但我們可以做到免費。

多鄰國最初就以完全免費方式服務用戶。所以,與OpenAI合作時,盡管帶來了額外的成本,但我們的選擇是,將OpenAI的功能集成到高級訂閱服務中。

整體上,多鄰國的商業模式運轉非常好,且已經在盈利,並且能夠提供包括基礎免費服務在內的多層級服務。對于新公司而言,要從零開始建立這樣的業務模式和用戶基礎是更具挑戰性的。

更重要的是,多鄰國的産品與常規的教育軟件截然不同,它更像是一款遊戲。我們的創始團隊對遊戲産品有深刻的理解,産品采用了大量遊戲化元素,使得學習過程更加引人入勝。這讓我們在教育應用領域中獨樹一幟。

所以,我們的增長核心是依靠産品本身的吸引力,而非僅僅依賴于教師引導或打卡機制。這也與許多教育應用不同。

多鄰國的用戶留存率介于傳統教育應用和遊戲之間,我們的日活躍用戶(DAU)數量是其他教育應用的幾十倍。內核就是我們借鑒了遊戲公司的遊戲化機制,通過數千次的A/B測試不斷優化,使學習變得更加有趣。

所以,在遊戲化、習慣養成以及創造有趣學習體驗方面的專業知識和經驗,是我們的核心競爭優勢。

品牌也是我們的優勢之一。目前,多鄰國已經建立了強大的品牌認知度,口碑傳播是我們知名度提升的重要途徑。隨著技術的演進和市場的變化,這些優勢將爲我們未來的發展提供巨大的增長機會。

36氪: 多鄰國如何從創立到現在把遊戲化作爲産品的第一性原理實踐到底的?

Bob Meese: 作爲一家專注于語言學習應用的公司,我們的核心業圍繞三點:學習、用戶增長和變現。

我們投入了大量資源在最核心的部分——學習上。同時,也非常注重用戶增長,特別是在遊戲化方面。我們的用戶增長策略以其連勝紀錄(streak)功能而聞名,有的用戶已經連續使用超過4000天,這成爲了我們産品的核心特征。

我們認爲,教育産品中,用戶的學習動機是關鍵,我們與遊戲設計師的理念一致,以促進用戶增長和學習爲目標。其中,遊戲設計既包含內在元素,比如遊戲玩法本身,也包含外在元素,如獎勵系統,要確保這些元素與學習目標保持一致,此外,也需要關注遊戲化與用戶學習語言目標的一致性,培養用戶的每日學習習慣。

産品設計上,我們注重簡潔性。我之前在遊戲行業,知道遊戲設計可能會變得複雜,但我認爲,遊戲機制過于複雜,會削弱學習體驗,因此,我們會避免過度複雜的設計,並持續叠代我們的産品,確保它既有趣又能促進學習。

36氪: 在使用大語言模型的過程中,我們如何解決機器幻覺問題,避免它影響內容質量?

Bob Meese: 通過精心的産品設計能夠顯著降低産品中AI模型産生幻覺帶來的風險。

比如,把産品會話設計的短一點,專注于具體的交互場景。在角色扮演環節,用戶會有一個明確的目標和AI互動。我們設定了明確的情節和轉折點,避免了完全開放式的對話,從而在一定程度上控制了體驗,並限制了單次體驗的時間,通常幾分鍾之後就會重置。

此外,多鄰國對AI可能産生的幻覺效應已經建立了相應的防護措施。AI的優勢在于其能夠靈活應對各種響應,但我們也會對不適當的內容進行限制,確保全年齡段用戶都能安全使用。也會過濾掉任何不當語言,確保它們不會出現在用戶體驗中。

我們的目標是讓用戶在短時間內獲得高效且愉悅的學習體驗。每次交互結束後,用戶可以重新開始,享受一個全新的學習過程。通過這種方式,我們能夠利用AI提供個性化的學習體驗,同時確保內容的質量。

王妍:多鄰國産品的背後,采用的是一種結合人類智慧與機器輔助的模式。這種模式的核心在于精心設計的學習體驗,而不是簡單的人機對話。正如Bob所強調的,我們的産品設計非常注重場景化和設計性,我們不會讓學習者與AI進行純粹的開放式交互,因爲這不僅涉及到AI可能産生幻覺的風險,更關乎用戶體驗。

大多數學習者更喜歡被動接收而非主動創造,希望獲得一個爲自己量身定制的學習體驗。所以,産品設計中,我們的每個課程都像是預先包裝好的,看起來是對話形式,但實際上已經根據學習者的水平和能力,精心設計了對話內容和流程。比如一個故事情節的突然轉折,並不是AI自發生成的,而是産品設計的一部分。

我們很少讓學習者隨意與AI模型進行交互,這種體驗往往並不理想。相反,我們認爲,産品的精心打磨比底層技術更爲重要。就像幾十年前人們就可以通過電視或收音機學習英語,但這種方式並不受歡迎。現代的産品之所以受到喜愛,是因爲它們能夠將概念分解並使之更加有趣和易于理解。我們的目標是通過精心設計的學習體驗,提升學習效率並激發學習者的興趣。

0 阅读:7