零門檻用AI畫漫畫,跨模態內容創作進入nextlevel

深響 2024-04-22 20:09:30

©️深響原創 · 作者|何理

AI這把火,燒了一年多。現在,有AI可以幫你寫PPT,有的會寫歌,有的能幫公司批量生成營銷素材,有的擅長“量子速讀”提煉長文本。總之,幾乎每個月都有AI熱點出現。

各種熱點背後,有兩個事情值得注意:

第一,實踐證明,AI落地一定是貼近已有需求,用原先無法想象的效率,完成用戶想做或必須做的事;第二,已有的AI應用涉及文本、音頻、圖像等多種形式,但大多處于分散狀態。如果它們能被整合成一個多模態一站式AI應用平台,AI落地會更加廣泛。

百度文庫是“跨模態+一站式“內容創作的AI原生應用代表。在Create2024百度AI開發者大會上,百度創始人、董事長兼首席執行官李彥宏介紹了百度文庫的新成果——智能漫畫和智能畫本功能。李彥宏表示:“百度文庫的智能漫畫能力,極大地提高了創作漫畫的效率,降低了漫畫創作的成本和門檻,可以讓更多有想法、有創意的人實現自己的漫畫創作夢。”

除了生成漫畫和畫本,用戶還可以在百度文庫生成研究報告、PPT、文檔、思維導圖,還能進行拍圖生文等等。百度集團資深副總裁、百度移動生態事業群組總經理何俊傑表示:“大語言模型重新打開了文庫的想象空間,它已經進化爲一站式AI內容創作平台。”

創意如何輕盈落地

如何理解百度文庫的新成果?我們不妨從直觀的體驗開始講起。

如果你愛看漫畫和小說,肯定有過這樣的時刻——這部漫畫劇情太精彩了,可是作者更新好慢,真想替他畫下去;作品裏這兩人CP感好強!好想做二創;這部玄幻小說設定有意思,要是文字能變成漫畫就更好了。

如果你是家長,在給孩子講故事時肯定也有過這樣的想法:孩子對故事裏的場景和動物有些陌生,理解起來有困難,有對應的繪本就簡單多了。

這些需求很普遍,但在以前很難實現。大部分人沒接受過繪圖、分鏡訓練,即使能想象出精彩畫面,創意也無法落地。但借助百度文庫,一切都變得可行。

例如,《周處除三害》是一個在《晉書》和《世說新語》裏都有記載的曆史故事。用戶可以借百度文庫,用簡單幾個步驟,把年代久遠的文字轉變爲生動的畫面:

在百度文庫上,只需要輸入《周處除三害》相關的「一句話」主題,百度文庫將檢索相關內容,自動生成完整的故事分鏡和腳本

用戶進行內容調整後,可以選擇多種漫畫風格,設定多種角色形象;

設置完畢後,百度文庫AI將自動生成完整漫畫作品,自動匹配豐富的人物對話文本,用戶可繼續在編輯器中進行精調。

《周處除三害》智能漫畫創作全過程

漫畫是風格化的,畫本則更廣泛通用。大會上,百度演示的智能畫本案例《小明不愛洗澡》,在畫風上明顯更“包容”,適用于更低年齡段讀者的需求,可以有效填補家庭教育場景裏的“繪本空白”。

《小明不愛洗澡》智能畫本生成結果

「深響」近期試用了百度文庫的智能漫畫和智能畫本功能,如大會演示的那樣,兩個功能易上手、速度快、效果好——只需輸入主題即可生成故事大綱,選擇“制作畫本”後稍加等待就能獲得完整結果。

試用過程中,「深響」也把百度文庫生成的繪本發給有娃的朋友,這位年輕媽媽對繪本的反饋是“畫面質量、閱讀體驗和市面上的親子繪本很接近”。看完後她還發來一些需求,比如“能不能以‘吃飯前要洗手’爲主題做個繪本”,“小朋友剛跟我說了一些奇思妙想,能不能把它們變成繪本”。

和之前的體驗一樣,這兩個需求同樣都只需“一句話”主題輸入,就能變成繪本輸出(輸入“吃飯前要洗手”,可以獲得《小貓咪咪學洗手》的繪本),整個操作過程幾乎是“傻瓜式”,它可以發生在親子互動的各個環節,家長和孩子的交流也因此變得更有趣生動。

在百度文庫APP上生成“飯前洗手”繪本。全程操作簡單,畫面生動可閱讀性強 錄屏:深響

當然,如果想更精細地編輯故事文本,百度文庫也給了相應的選項。你可以對生成的故事大綱進行編輯,也可以對分鏡腳本進行修改。或者,你也可以和孩子一起,在百度文庫的智能文檔裏,利用AI交互,把孩子的創意變成一個完整的故事,然後再把這個故事變成好看的漫畫或繪本。正好423世界讀書日馬上要到了,利用百度文庫,家長和孩子都能實現“繪本自由”,讀書這件事會因爲AI變得更易得、更有趣。

百度文庫根據“機器人和人類一起保衛地球”主題生成故事大綱和分鏡後,用戶可以做進一步調整

截圖來源:百度文庫

這樣的交互體驗和交付質量是開創性的。目前,行業在“AI繪制漫畫”上仍存在一定痛點,多數工具只能生成單圖、四宮格圖片,在場景關聯性、人物一致性、劇情還原度上都有待完善,且通常需要大量後期工作來調整。

而百度文庫不只是解決“繪制”環節的難點,還將AI封裝于整個工作流程,在“指令生成故事”等方面進行優化提升,同時強化多場景及多人物處理、人物一致性、故事完整性、畫面細膩度、圖文與劇情匹配度等方面的專業表現,這使得其生成的作品達到能“直接交付”的水平。

“跨模態+一站式”內容創作的價值

就體驗而言,智能漫畫和智能畫本都是幫助用戶零門檻落地創意的好工具,但它們並不僅僅是兩款“創意工具”。兩款産品是“結果”,共同成長于百度文庫的跨模態和一站式能力之上。

跨模態指的是,百度文庫能夠處理各種文字、語音、圖像信息,能把不同模態的信息綜合起來,實現更精確的情境理解和輸出。在此基礎上,用戶可以在百度文庫一個平台上,一站式實現不同類型的內容創作。

簡言之,跨模態和一站式能力讓百度文庫有更廣泛的落地可能。它可以橫向進入更多場景,縱向進入更多環節。

“進入更多場景”指的是,在工作生活中,你可以利用百度文庫完成更多需求,比如生成思維導圖、做研究報告、智能合成多個文檔、寫PPT和年終彙報,或者直接發一張圖,讓文庫幫你生成小紅書文案。基于自然語言交互,你的産出過程會簡便得多、高效得多。

百度文庫AI解圖創作小紅書文案

以研究報告和PPT爲例,一份研究報告涉及大量文字和圖表,一份精美的PPT需要用戶不斷調整樣式、文字、排版,傳統內容編輯工具操作起來又很繁瑣,完成相應的産出往往要耗費大量精力。

借助百度文庫,用戶能輕松實現原本繁複操作才能達到的效果——做個研究報告,只需輸入報告主題,或者用簡單的語音交互,幾分鍾內便能獲得一份結構嚴謹、圖表清晰、內容翔實的報告。基于這份報告,用戶還能進行精細化的編輯調整,選擇不同風格的模版封面及導出格式。

百度文庫“智能生成研究報告”演示

類似的,用戶只需要輸入主題或上傳文檔,或者簡單“動動嘴”,就能利用百度文庫在幾十秒內生成一份邏輯清晰、配圖准確的PPT。此外,百度文庫也支持模版上傳、文檔生成PPT、PPT內生成專業圖表、PPT在線調整編輯、一鍵生成演講稿和思維導圖等功能,能夠做到多格式、多文檔的生成、編輯全能力打通。

全能力打通破解的是當前AI應用的核心痛點。一直以來,市場關于AI有種“矛盾”的態度,大家都覺得AI很強,但實際應用體驗總是“不盡人意”。目前,AI在工作生活中的落地還是處于“分散”狀態,大部分人只用AI解決點狀需求,沒能把它融入工作流程中。如果想用AI完整、順暢地解決需求,則需要專門搭建一套AI工作流,整個過程費時費力。

百度文庫的升級打破了僵局。從“頭腦風暴”、“寫大綱”,到生成和編輯文檔,再到PPT生成、思維導圖等文件的生成,各個場景的需求用戶都可以基于百度文庫解決。重要的是,百度文庫“進入更多環節”的同時,用戶操作門檻低,且體驗順滑,無需在文件傳輸和轉換等問題上多花費精力。

而百度文庫的全場景指令創作和編輯,意味著用戶僅需簡單的語音指令,即可不受地點限制地高效完成工作中的常見需求。低門檻操作+全場景覆蓋+靈活編輯+PC移動雙端操作,百度文庫帶來的是新的辦公體驗。百度文庫並非只解決單一環節的問題,而是成長爲一個完整的生産力平台。

百度文庫全場景指令創作和編輯演示

從趣味工具,到生産力革新

新技術發展總遵循這樣的規律:最開始,它是少數愛好者的“趣味工具”,但隨著技術能力的完善以及用戶的增長,它會越來越快地滲透到大衆的工作和生活中,滲透到千行百業裏。

早年,在圖形界面交互出現前,計算機交互靠的是各種指令和參數,學習門檻高,只有少數極客玩得轉。但隨著計算機交互方式和技術的發展,大衆經過簡單學習就能操作個人電腦,PC和互聯網時代得以到來。

今天的AI技術也是如此。一年多以前,大家都在鑽研怎麽寫Prompt,精調一張繪畫作品需要不斷測試提示詞。隨著技術和産品的發展,繁瑣和專業的操作被不斷簡化,AI生成結果變得穩定且高質,外加自然語言本身就是“零門檻”的交互方式,AI正在加速往更大衆化的方向滲透。

AI時代的敘事漸漸從“趣味技術工具”轉向“生産力革新”。用戶和行業都將從中受益——用戶側,原先無法實現的需求變得觸手可及;行業側,隨著以智能漫畫和智能畫本爲代表的多模態AI能力的成熟,影視文娛行業、家庭教育行業、出版行業都能從中找到提效空間。

僅僅一年多,AI的發展就又進入了新的階段。“跨模態+一站式”趨勢正在推動AI內容創作進一步落地,而百度文庫和趨勢同頻,且是趨勢中的領先者。

這是多重因素共同造就的——百度文庫在文本理解與數據分析領域有豐富積累,能准確抓取並分析文字中的數據信息,再轉換生成適合的圖表;文心大模型又爲百度文庫注入了新活力。據悉,相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%;疊加百度文庫多年來對用戶需求的洞察,百度文庫得以重構爲“一站式AI內容創作平台”。

大會上,李彥宏提到,AI正在掀起一場創造力革命。“未來開發應用就像拍個短視頻一樣簡單,人人都是開發者,人人都是創造者”。

百度文庫的進展,正在讓“零門檻、一站式”創作落地現實。從過往的技術變革經驗來看,新技術的發展和滲透常常是指數級的,智能漫畫和智能畫本將推動AI大衆化進程。AI時代的增長曲線,顯然越來越陡峭了。

0 阅读:0

深響

簡介:全球視野,價值視角。