EMO來了！通義APP推出照片唱歌功能

把一段音頻、一張照片輸入AI模型，就能讓圖中人物開口唱歌說話，讓奧黛麗赫本唱《上春山》、陶俑仕女說英文RAP、愛因斯坦說中文段子。不久前，這款名爲EMO的模型因爲阿裏通義實驗室的一篇論文火遍海內外，模型的産品化進程也廣受關注。4月25日，EMO終于上線通義APP，開放給所有用戶免費使用。

打開通義APP，進入“全民舞台”頻道，就可來到EMO産品頁面“全民唱演”。在歌曲、熱梗、表情包中任選一款模板，上傳肖像照片，EMO隨即就能合成視頻。

通義APP首批上線了80多個EMO模板，包括熱門歌曲《上春山》《野狼disco》等，網絡熱梗“缽缽雞”“回手掏”等。目前通義APP暫不開放用戶自定義音頻，用戶只能選擇APP預置的音頻來生成視頻。

EMO是通義實驗室研發的AI模型，其背後的肖像說話（Talking Head）技術是當前大熱的AIGC領域。EMO之前的Talking Head技術都需針對人臉、人頭或者身體部分做3D建模，通義實驗室在業界率先提出了弱控制設計，無需建模就可驅動肖像開口說話，不僅降低視頻生成成本，還大幅提升了視頻生成質量。EMO學習並編碼了人類表達情緒的能力，能將音頻內容和人物的表情、嘴型匹配，還能把音頻的語氣特征和情緒色彩反映到人物微表情上。

2月底，通義實驗室公布相關論文，EMO隨之成爲繼SORA之後最受關注的AI模型之一。現在，通義APP讓所有人都可免費體驗前沿模型的創造力。未來，EMO技術有望應用于數字人、數字教育、影視制作、虛擬陪伴、電商直播等場景。

通義APP近期爆款頻出，現象級應用“全民舞王”曾在社交平台掀起“兵馬俑跳科目三”“金毛跳舞”的熱潮，全民舞王背後的模型Animate Anyone也出自通義實驗室。近期，通義APP還陸續推出了超長文檔解析、AI編碼助手、AI會議助手等免費實用功能。通義大模型正在成爲越來越多用戶的超級AI助手。

文采家

EMO來了！通義APP推出照片唱歌功能

盧松松