
你可以透過設計原創動漫風角色、生成乾淨的角色主視覺、製作一段短舞蹈鏡頭、加入對嘴近景,並把這些片段剪成適合直式平台的出道預告,來打造一位虛擬 K-pop 偶像。
先從偶像概念開始,而不是先選工具。一位有說服力的虛擬偶像,應該在角色圖像、動作片段、聲音瞬間和縮圖中都保持一致。生成任何素材之前,先寫一段簡短創意設定,包括舞台名、氛圍、視覺記憶點、服裝、色彩和出道亮點。
第一版請保持小而清楚。一套服裝、一種髮型、一個舞台氛圍和一句短台詞,就足夠做出第一支預告。如果一開始就想生成完整 MV,通常會把更多時間花在修正連貫性,而不是塑造表演本身。
你還需要幾類參考素材:
避免要求 AI 複製真實偶像。請使用「銀色鮑伯頭」、「霓虹青綠舞台外套」、「星形臉頰裝飾」這類原創特徵,而不是真人藝名。目標是創造一位有明確身份的新表演者,而不是相似臉。
DomoAI 適合這類場景,因為虛擬偶像不只需要單一素材。你需要角色圖、動作、對嘴和最終畫質處理。實用做法是分階段建立:先做主視覺,再做舞蹈,接著做說話或演唱近景,最後剪成短出道預告。
角色設計可使用 DomoAI 內的 Text to Image 或 GPT Image2 生成原創偶像圖像。若要讓靜態圖動起來,可使用 Image to Video;如果你有動作參考,想讓虛擬偶像跟隨該動作,可使用 Character to Video。近景則可用 Talking Avatar,從肖像生成對嘴說話片段。
Talking Avatar 最適合用作偶像開場介紹或反應台詞。它可使用肖像圖、腳本、聲音、動作提示、情緒、聲線變化、上傳音訊進行聲音克隆,以及多語輸出。最終音樂、字幕、卡點與節奏,建議在剪輯軟體中完成。
請用能支撐多次生成的方式寫設定。一個好用公式是:
舞台名 + 偶像定位 + 視覺母題 + 服裝 + 舞台氛圍 + 個性
例如:「Rina V,一位自信的虛擬 K-pop 主舞,帶有青綠星形元素、短版銀色外套、高馬尾、亮面黑靴,以及俏皮的未來感舞台氣場。」這能給影像模型足夠結構,同時避免鎖定真實人物。
讓設計在手機尺寸也能被辨認。大形狀比細節重要:髮型輪廓、外套顏色、一個配件和明確姿勢。如果角色縮成小縮圖仍然有辨識度,通常在直式短片中也更穩定。
在 DomoAI 中使用 GPT Image2 製作第一版角色。生成全身主視覺,要求姿勢乾淨、手和鞋清楚可見、背景簡單。提示詞應聚焦在偶像本人,而不是複雜舞台或人群。
如果臉好但服裝弱,就圍繞服裝修改提示詞。如果服裝強但臉變化太大,就把最佳圖片作為視覺參考,要求變體保持同一角色身份。保存一張全身圖做舞蹈鏡頭,再保存一張肖像裁切做對嘴近景。
簡單主視覺提示詞:
Original virtual K-pop idol, anime style, full-body key art, teal and silver stage outfit, star-shaped cheek accent, confident debut pose, clean hands, glossy black boots, bright pop stage lighting, no real celebrity likeness.
舞蹈段落請選一個短副歌動作或姿勢轉換。5 到 10 秒的動作比完整舞蹈更容易控制。使用四肢清楚的全身圖,避免大型道具,並保持鏡頭方向簡單。
如果你有參考舞蹈影片,Character to Video 能幫助保留動作,同時替換成你的角色。如果只需要一段短暫偶像動態,Image to Video 會更直接。請把最佳結果當成預告中的一個鏡頭,而不是期待一次生成承包整支影片。
可用的動作語言包括「idol chorus dance」、「confident step forward」、「hand-heart gesture」、「turn to camera」和「ending pose」。避免一次要求太多動作。一個乾淨動作通常比五個不穩定動作更專業。
使用肖像圖做近景。在 Talking Avatar 中上傳肖像、輸入短腳本、選擇或提供聲音、加入動作提示並設定情緒。第一次測試請讓台詞保持簡短。
出道預告中,口白通常比長句演唱更可靠:
「Hi, I'm Rina V. This is my first stage.」
如果已有乾淨音訊,也可以測試短副歌句。若重點是讓嘴型精準匹配音訊,可嘗試 AI video lip sync 路徑。背景音樂和最終卡點應放在 Talking Avatar 之外完成,因為 Talking Avatar 主要負責角色台詞本身。
用三個鏡頭思考:亮相、表演、近景。開頭放名字卡或定格姿勢,接著在節拍上切入舞蹈動作,再加入對嘴介紹或副歌句。最後用定格、標誌或「debut soon」字幕收尾。
對短影音平台來說,7 到 15 秒的 9:16 直式預告已足夠。字幕要短且易讀。如果某段值得保留,最終輸出前可使用 Video Upscaler,尤其是希望在大螢幕上看起來更乾淨時。
如果想參考更多風格化音樂影片流程,可查看 anime music video creation guide 和 AI VTuber maker 頁面。
請根據需要的鏡頭選流程。虛擬偶像頁通常需要多種模式,因為舞蹈鏡頭和對嘴鏡頭解決的是不同問題。
把提示詞當作起點,看到第一版結果後再收緊。最重要的控制點是原創性、鏡頭類型、姿勢清楚度和角色一致性。
先檢查一致性。臉、髮型、服裝和色彩重點,在全身圖、舞蹈片段和近景中都應該仍然像同一位偶像。如果角色變化太大,用更強參考和更少新細節重新生成弱的那一段。
再檢查動作。留意變形的手、不清楚的步伐、漂移的配件,或分散注意力的鏡頭運動。簡單乾淨的動作勝過複雜但不穩的舞步。
最後檢查權利和平台適配。使用原創角色提示詞,避免真實偶像肖像,並確認音訊可用於你要發布的平台。為口白加上字幕,因為許多觀眾一開始會靜音觀看短片。
AI 可以幫你製作角色圖、動畫舞蹈鏡頭和對嘴近景。你仍需要創意方向、音樂或音訊選擇,以及剪輯,才能把這些素材變成完成度高的偶像預告。
使用四肢清楚、服裝形狀簡潔、道具少的全身圖。清楚站姿會比裁切肖像或擁擠舞台圖更適合作為動作工具的起點。
可以。肖像圖可搭配 Talking Avatar 做短口白或對嘴片段。最佳做法是從短台詞、清楚音訊和單一情緒開始,而不是一開始就做很長的表演。
不應該。請用自己的名字、服裝、顏色和視覺母題建立原創角色。你可以參考偶像表演語言,但要避免真實人物姓名、肖像或相似臉提示。
先從 7 到 15 秒開始。這足以放入亮相、一個舞蹈動作和一個近景台詞,同時保持容易快速修改。
DomoAI 可協助角色圖、圖像動畫、角色轉影片動作、Talking Avatar 對嘴和影片升級。最終音樂放置、字幕和卡點剪輯建議在剪輯軟體中完成。
Make every scene
worth sharing.